Załóżmy, że patrzymy na tę fabułę pudeł i wąsów:
Myślę, że między czwartkiem a piątkiem większość zgodziłaby się, że wydaje się, że istnieje znaczna różnica w czasie snu. Czy to jednak statystycznie uzasadnione przypuszczenie? Czy potrafimy dostrzec znaczące różnice z uwagi na fakt, że żaden z zakresów kwartylu wewnętrznego nie pokrywa się między czwartkiem a piątkiem? A co z faktem, że górne i dolne wąsy odpowiednio w czwartek i piątek pokrywają się? Czy to wpływa na naszą analizę?
Zwykle dołączanie do takiej tabeli byłoby ANOVA, ale jestem ciekawy, jak wiele możemy powiedzieć o różnicach między grupami, po prostu patrząc na wykres pudełkowy .
anova
data-visualization
boxplot
blacksite
źródło
źródło
Odpowiedzi:
Nie możesz. Gdybyś miał rozmiary próbki i duże doświadczenie, być może będziesz w stanie zgadnąć - a dokładność zgadywania będzie zależeć (oprócz wielkości efektu) od wielkości próbki. Jeśli N = 1 000 000 na grupę, to ma to duże znaczenie. Jeśli N = 10 na grupę, nie tyle. Przy 100 na grupę trudniej zgadnąć.
Twierdziłbym, że to dobra rzecz. W przypadku wykresu pudełkowego nie chodzi o to, aby zgadywać o znaczeniu statystycznym, ale o to, co się dzieje i próbować to uzasadnić. Hmm Więcej spania w weekendy. To ciekawe, ale nie zaskakujące. Możemy modelować godziny snu jako funkcję weekendu vs. Lub możemy spróbować sprawdzić, czy ten wzór jest różny. Może ludzie na emeryturze nie mają tego wzoru? Co z pracownikami zmianowymi? Ludzie, którzy pracują w weekendy? Ludzie, którzy pracują 7 dni w tygodniu?
Jak mawiał mój ulubiony profesor w szkole gradowej (Herman Friedman): „Przestańcie śledzić badania!”
źródło
Tak, możesz. Przynajmniej w przybliżeniu.
Przedstawiam poniżej (i rzeczywiście istnieje związek z „nakładaniem się pudełka”, jak sugerujesz) wraz z pewnymi zastrzeżeniami i ograniczeniami. Ale najpierw omówmy kilka wstępnych przygotowań do kontekstu i kontekstu. (Myślę, że odpowiednia odpowiedź tutaj nie powinna koncentrować się na szczegółach tego przykładu - choć może to zasługuje na wzmiankę na marginesie - ale na zasadniczej kwestii użycia wykresów pudełkowych do oceny, czy widoczne różnice można łatwo wytłumaczyć jako zmienność losową, czy nie .)
Jeśli masz dostęp do danych, możesz narysować wycięte wykresy pudełkowe, które są przeznaczone do tego rodzaju porównania wizualnego.
Omówiono tutaj obliczenia wykresów z karbem . Jeśli odstępy między wycięciami nie pokrywają się, dwie porównywane grupy są w przybliżeniu różne na poziomie 5%; obliczenia są oparte na obliczeniach normalnych, ale są dość solidne i działają dość dobrze w różnych zakresach dystrybucji. (Jeśli jest to traktowane jako formalny test, moc nie jest tak wysoka w normalnych warunkach, ale powinna dobrze sobie radzić w różnych mniej lub bardziej „typowych” ciężkich przypadkach).
Biorąc pod uwagę sposób, w jaki działają wycięte wykresy pudełkowe, możesz rozpoznać szybką, praktyczną regułę, która zadziała, gdy będziesz mieć tylko ekran taki jak w pytaniu. Gdy wielkość próbki wynosi 10, a mediana jest umieszczona blisko środka pudełka, wycięcia na wykresie z karbem mają mniej więcej szerokość pudełka, więc końce wycięć i pudełko znajdują się mniej więcej w tym samym miejscu.
Patrząc na swoją działkę:
Zauważ, że po pojawieniu się wykresu możemy stwierdzić, że wielkość próbki musi wynosić co najmniej 5; jeśli byłyby mniejsze niż 5, wykresy pudełkowe dla pojedynczej próbki miałyby wyraźne wskazówki, że pochodziły z mniejszej wielkości próbki (takie jak mediany będące martwym środkiem każdego pudełka lub wąsy o długości 0, gdy występowała wartość odstająca).
Alternatywnie, jeśli pola (oznaczające kwartyle) nie nakładają się na siebie, a wielkość próby wynosi co najmniej 10, wówczas dwie porównywane grupy powinny mieć różne mediany na poziomie 5% (traktowane jako porównanie pojedynczej pary).
[Uwaga: nie bierze to pod uwagę liczby porównań, więc jeśli wykonujesz wiele porównań, ogólny błąd typu I będzie większy. Jest przeznaczony raczej do kontroli wizualnej niż do testów formalnych; niemniej jednak zaangażowane pomysły można dostosować do bardziej formalnego podejścia, w tym dostosowania do wielokrotnych porównań.]
Po skierowana czy możliwe byłoby rozsądne, aby rozważyć, czy powinien . Może nie; kwestia potencjalnego hakowania p jest prawdziwa, ale jeśli używasz tego, aby dowiedzieć się, na przykład, czy chcesz kontynuować gromadzenie nowych danych na temat badań, a wszystko, co masz, to fabuła w gazecie - powiedzmy - może być całkiem użyteczne, aby móc dokonać oceny, czy jest tam więcej, niż można łatwo wytłumaczyć zmiennością spowodowaną hałasem. Ale dogłębne rozważenie tego problemu naprawdę byłoby odpowiedzią na inne pytanie.
źródło