Pytania oznaczone «data-visualization»

46
Interpretacja predyktora i / lub odpowiedzi transformowanej logarytmicznie

Zastanawiam się, czy ma to znaczenie w interpretacji, czy transformowane są tylko zmienne zależne, zależne i niezależne, czy tylko zmienne niezależne. Rozważ przypadek log(DV) = Intercept + B1*IV + Error Mogę interpretować IV jako wzrost procentowy, ale jak to się zmienia, kiedy mam log(DV)...

45
Jak ustalić, czy oś y wykresu powinna zaczynać się od zera?

Jednym z powszechnych sposobów „kłamstwa z danymi” jest użycie skali osi y, która sprawia, że ​​wydaje się, że zmiany są bardziej znaczące niż są w rzeczywistości. Kiedy przeglądam publikacje naukowe lub raporty laboratoryjne studentów, często jestem sfrustrowany tym „grzechem wizualizacji danych”...

45
Jak poprawnie kreślić trendy

Tworzę wykres, aby pokazać trendy śmiertelności (na 1000 osób) w różnych krajach, a historia, która powinna pochodzić z fabuły, jest taka, że ​​Niemcy (jasnoniebieska linia) są jedynymi, których trend rośnie po 1932 roku. moja pierwsza (podstawowa) próba Moim zdaniem ten wykres pokazuje już to,...

44
Jaki jest twój ulubiony wykres statystyczny?

To mój ulubiony Ten przykład jest w humorystyczny sposób (podziękowania należą się mojemu byłemu profesorowi, Stevenowi Gortmakerowi), ale interesują mnie również wykresy, w których czujesz się pięknie i przekazujesz wgląd lub metodę statystyczną wraz z twoimi pomysłami na ten temat. Jeden wpis...

37
Kiedy t-SNE wprowadza w błąd?

Cytując jednego z autorów: t-Distributed Stochastic Neighbor Embedding (t-SNE) to ( nagradzana ) technika redukcji wymiarowości, która szczególnie dobrze nadaje się do wizualizacji wysokowymiarowych zestawów danych. Brzmi więc całkiem nieźle, ale tak mówi Autor. Kolejny cytat autora (dotyczy:...

34
Dlaczego istnieje różnica pomiędzy ręcznym obliczeniem regresji logistycznej 95% przedziału ufności a użyciem funkcji confint () w R?

Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow...