Interpretacja fabuły skrzypiec

9

Porównuję rozproszenie różnych grup za pomocą wykresów skrzypcowych, jednak większość zasobów online, które znalazłem, są po prostu związane z tym, jak tworzyć wykresy i bardzo podstawową interpretacją wyników (mediana wariancji, dane są skupione lub nie).

Szukam szczegółowych przykładów, które mogę podążać za moją wskazówką, aby poprawnie interpretować wykresy skrzypiec.

Gago-Silva
źródło

Odpowiedzi:

9

Wykres skrzypiec jest tylko histogramem (lub częściej wygładzonym wariantem, takim jak gęstość jądra) odwrócony na bok i dublowany. Każdy podręcznik, który uczy, jak interpretować histogramy, powinien dać ci intuicję, której szukasz. Edycja według sugestii Nicka Coxa: Freedman, Pisani, Purves, Statistics obejmuje histogramy.

Jeśli chodzi o interpretację ich w bardziej formalny sposób, celem wykresu rozkładu jest dostrzeżenie rzeczy, które mogą zostać oszukane przez testy statystyczne.

Jedną z rzeczy, które lubię robić na wykresach skrzypcowych, jest dodawanie wierszy dla mediany, średniej itp. Czasami nakładam się na wykres pudełkowy, aby zobaczyć więcej w statystykach podsumowujących.

Przynajmniej powinieneś być w stanie wykryć wszelkie poważne odchylenia w pierwszych kilku momentach (średnia, dyspersja, skośność, kurtoza), a także bimodalność i wartości odstające.

Ari B. Friedman
źródło
2
+1, podobny wykres jest piramidą populacji , rozkład odbity jest tylko inną kategorią (i używa bardziej typowych estymatorów typu histogramu zamiast kde).
Andy W
1
Ani Tukey, eksploracyjna analiza danych , ani Cleveland, elementy wykresów danych , nie mówią wiele o histogramach: oba są bardziej zainteresowane innymi wrażeniami i bardziej pod wrażeniem. Czy są to książki, o których tu mowa? Jedną z książek, która obejmuje histogramy jako podstawowe, jest Freedman, Pisani, Purves, Statistics .
Nick Cox,
1
Faktycznie, Cleveland ma powiedzieć coś o histogramy. Mówi, że są to słabe wykresy i że nie zostaną wykorzystane w jego książce. :-). A F, P i P to wspaniała książka.
Peter Flom
1
Uczyłem od FPP. Nie użyliby jawnie OLS do przewidzenia obszaru prostokąta, ponieważ nie dokonują jawnej regresji wielowymiarowej. Mają jednak kilka przykładów w tym duchu. Na przykład, co gdyby Galileusz próbował przewidzieć czas, w którym obiekt spada z wysokości h na podstawie regresji liniowej? Pasujesz do ładnego najmniejszego kwadratu, ale oczywiście prawda jest taka, że - morałem tej historii jest zawsze patrzenie na resztki. t=ch
Michael Lugo,
1
@TrevorAlexander To dobre pytanie. Nie zdaję sobie sprawy z tego, że literatura pokazująca, że ​​interpretacja jest lepsza, gdy jest dublowana, ale dla mojego oka wyglądają ładniej niż histogramy w orientacji pionowej.
Ari B. Friedman,