Jak sprawdzić różnice między dwiema grupami oznacza, że ​​dane nie są normalnie dystrybuowane?

19

Wyeliminuję wszystkie szczegóły biologiczne i eksperymenty i przytoczę tylko problem i to, co zrobiłem statystycznie. Chciałbym wiedzieć, czy ma rację, a jeśli nie, jak postępować. Jeśli dane (lub moje wyjaśnienie) nie są wystarczająco jasne, postaram się lepiej wyjaśnić, edytując.

Załóżmy, że mam dwie grupy / obserwacje, X i Y, o rozmiarze i . Chciałbym wiedzieć, czy środki tych dwóch obserwacji są równe. Moje pierwsze pytanie brzmi:N.x=215N.y=40

  1. Jeśli założenia są spełnione, czy istotne jest tutaj zastosowanie parametrycznego testu t dla dwóch próbek? Pytam o to, ponieważ z mojego rozumienia jest on zwykle stosowany, gdy rozmiar jest mały?

  2. Wykreśliłem histogramy zarówno X, jak i Y, i nie były one normalnie rozłożone, co jest jednym z założeń testu t dla dwóch próbek. Moje zamieszanie polega na tym, że uważam je za dwie populacje i dlatego sprawdziłem ich normalną dystrybucję. Ale zaraz zamierzam wykonać dwupróbkowy test t ... Czy to prawda?

  3. Z centralnego twierdzenia o granicy rozumiem, że jeśli wykonujesz próbkowanie (z powtórzeniami / bez, w zależności od liczebności populacji) wiele razy i za każdym razem obliczasz średnią próbek, wówczas rozkład będzie w przybliżeniu normalny. Średnia tych zmiennych losowych będzie dobrym oszacowaniem średniej populacji. Postanowiłem to zrobić na X i Y, 1000 razy, i uzyskałem próbki, i przypisałem losową zmienną do średniej każdej próbki. Fabuła była bardzo rozpowszechniona. Średnia X i Y wynosiła 4,2 i 15,8 (co było takie same jak dla populacji + - 0,15), a wariancja wynosiła 0,95 i 12,11.
    Przeprowadziłem test t dla tych dwóch obserwacji (po 1000 punktów danych) z nierównymi wariancjami, ponieważ są one bardzo różne (0,95 i 12,11). Hipoteza zerowa została odrzucona.
    Czy to w ogóle ma sens? Czy to poprawne / znaczące podejście lub test na dwóch próbach jest wystarczający, czy całkowicie błędny?

  4. Przeprowadziłem również nieparametryczny test Wilcoxona, aby się upewnić (na oryginalnych X i Y), a hipoteza zerowa została tam również przekonująco odrzucona. W przypadku, gdy moja poprzednia metoda była całkowicie błędna, przypuszczam, że wykonanie testu nieparametrycznego jest dobre, z wyjątkiem może mocy statystycznej?

W obu przypadkach średnie były znacząco różne. Chciałbym jednak wiedzieć, czy jedno lub oba podejścia są błędne / całkowicie błędne, a jeśli tak, jaka jest alternatywa?

Bieg
źródło

Odpowiedzi:

21

Pomysł, że test t jest przeznaczony tylko dla małych próbek, jest historycznym potwierdzeniem. Tak, pierwotnie został opracowany dla małych próbek, ale w teorii nie ma nic, co odróżniałoby małe od dużych. W czasach, gdy komputery były powszechnie używane do robienia statystyk, tabele t często zwiększały się tylko do około 30 stopni swobody, a normalna była używana jako przybliżenie rozkładu t. Miało to na celu utrzymanie rozsądnego rozmiaru stołu. Teraz z komputerami możemy przeprowadzać testy t dla dowolnej wielkości próbki (chociaż dla bardzo dużych próbek różnica między wynikami testu z i testu t jest bardzo mała). Główną ideą jest zastosowanie testu t podczas korzystania z próbki do oszacowania odchyleń standardowych oraz testu z, jeśli znane są odchylenia standardowe populacji (bardzo rzadko).

Twierdzenie o granicy centralnej pozwala nam zastosować normalne wnioskowanie teoretyczne (w tym przypadku testy t), nawet jeśli populacja nie jest normalnie rozłożona, o ile wielkości próbek są wystarczająco duże. Oznacza to, że twój test jest przybliżony (ale przy rozmiarach próbki, aplikacja powinna być bardzo dobra).

Test Wilcoxona nie jest testem środków (chyba że wiesz, że populacje są idealnie symetryczne i istnieją inne mało prawdopodobne założenia). Jeśli głównym przedmiotem zainteresowania są środki, to test t jest prawdopodobnie najlepszym do cytowania.

Biorąc pod uwagę, że twoje odchylenia standardowe są tak różne, a kształty są nienormalne i prawdopodobnie różnią się od siebie, różnica w środkach może nie być najciekawszą rzeczą, która się tutaj dzieje. Pomyśl o nauce i co chcesz zrobić z wynikami. Czy decyzje podejmowane są na poziomie populacji czy na poziomie indywidualnym? Pomyśl o tym przykładzie: porównujesz 2 leki na daną chorobę, na lek A połowa próbki zmarła natychmiast, a druga połowa wyzdrowiała w ciągu około tygodnia; w przypadku leku B wszyscy przeżyli i wyzdrowiali, ale czas do wyzdrowienia był dłuższy niż tydzień. Czy w takim przypadku naprawdę zależy Ci na tym, który średni czas powrotu do zdrowia był krótszy? Lub zastąp połowę umierania w A tylko bardzo długim czasem powrotu do zdrowia (dłużej niż ktokolwiek w grupie B).

Greg Snow
źródło
Dziękuję Greg. Zakładam, że nie ma nic złego w samej procedurze? Rozumiem, że może nie zadaję właściwego pytania, ale moje obawy dotyczą zarówno testu / procedury statystycznej, jak i zrozumienia samego siebie, biorąc pod uwagę dwie próbki. Sprawdzę, czy zadaję właściwe pytanie i wrócę z ewentualnymi pytaniami. Może jeśli wyjaśnię problem biologiczny, pomogłoby to w uzyskaniu większej ilości sugestii. Dzięki jeszcze raz.
Arun
5

Jeden dodatek do już bardzo wyczerpującej odpowiedzi Grega.

Jeśli dobrze cię rozumiem, twój punkt 3 określa następującą procedurę:

  • nX
  • mn
  • Powtórz to 1000 razy, zapisz odpowiednie środki
  • X

Teraz zakładasz, że dla tej średniej obowiązuje twierdzenie o limicie centralnym, a odpowiadająca mu zmienna losowa będzie normalnie rozkładana.

Może rzućmy okiem na matematykę obliczeń, aby zidentyfikować błąd:

X X1,,XnX1,,XnXmk

Yk=1mja=1mXμjak

μjaknja

11000k=110001mja=1mXμjak

Xja1000m1000mXja

Teraz jednak Centralne Twierdzenie Graniczne stwierdza, że ​​suma wielu niezależnych zmiennych losowych jest w przybliżeniu normalna. (Co powoduje, że jest również średnią w przybliżeniu normalną).

Twoja suma powyżej nie daje niezależnych próbek. Być może masz losowe wagi, ale to wcale nie uniezależnia twoich próbek. Procedura opisana w punkcie 3 jest zatem niezgodna z prawem.

t

Thilo
źródło
Dziękuję Ci. Wygląda na to, że test t już rozwiązuje problem za pomocą CLT (z odpowiedzi Grega, którą przeoczyłem). Dzięki za wskazanie tego i za jasne wyjaśnienie 3), co tak naprawdę chciałem wiedzieć. Będę musiał poświęcić więcej czasu na zrozumienie tych koncepcji.
Arun
2
Należy pamiętać, że CLT działa różnie dobrze w zależności od danego rozkładu (lub, co gorsza, oczekiwana wartość lub wariancja rozkładu nie istnieje - wtedy CLT nie jest nawet ważny). W razie wątpliwości zawsze dobrym pomysłem jest wygenerowanie rozkładu podobnego do obserwowanego, a następnie symulowanie testu przy użyciu tego rozkładu kilkaset razy. Dowiesz się o jakości aproksymacji dostaw CLT.
Thilo