Mam pewne trudności ze zrozumieniem interpretacji testu 2 próbek KS i tego, jak różni się on od zwykłego testu t między 2 grupami.
Powiedzmy, że mam mężczyzn i kobiety wykonujących pewne zadania i zbieram wyniki z tego zadania. Moim ostatecznym celem jest ustalenie, czy mężczyźni i kobiety wykonują inaczej w tym zadaniu
Więc jedną rzeczą, którą mogłem zrobić, to przeprowadzić test między dwiema grupami. Inną rzeczą, którą mogłem zrobić, to obliczyć ECDF dla mężczyzn i kobiet, wykreślić je i przeprowadzić 2 próbny test KS. Dostałbym coś takiego:
Test KS
Hipoteza zerowa dla testu KS jest taka, że 2 zestawy ciągłych rozkładów wyników pochodzą z tej samej populacji
Podczas przeprowadzania testu KS otrzymuję: D = 0,1888, wartość p = 0,04742
Najpierw chcę sprawdzić, czy moja interpretacja wyników jest poprawna. Odrzuciłbym tutaj hipotezę zerową i powiedziałbym, że rozkłady wyników dla mężczyzn i kobiet pochodzą z różnych populacji. Innymi słowy, rozkład wyników mężczyzn i kobiet różni się od siebie.
Mówiąc dokładniej, mężczyźni mają większe prawdopodobieństwo osiągnięcia niższych wyników w tym zadaniu, i to jest różnica między dwiema płciami, jak interpretuję z fabuły
Test T
Teraz w teście przetestuje różnicę między średnimi mężczyzn i kobiet na zmiennej score.
Wyobraźmy sobie przypadek, w którym wydajność mężczyzn jest gorsza niż u kobiet w tym zadaniu. W takim przypadku rozkład wyników męskich będzie wyśrodkowany wokół niskiej średniej, podczas gdy rozkład wyników męskich będzie wyśrodkowany wokół wysokiej średniej. Ten scenariusz byłby zgodny z powyższą fabułą, ponieważ mężczyźni będą mieli większe prawdopodobieństwo osiągnięcia niższych wyników
Jeśli test t okaże się znaczący, doszłbym do wniosku, że kobiety osiągają średnio znacznie wyższy wynik niż mężczyźni. Lub pod względem populacji, wyniki kobiet pochodzą z populacji, której średnia jest wyższa niż populacja mężczyzn, co brzmi bardzo podobnie do wniosku KS, że pochodzą z różnych populacji.
Co za różnica?
Wniosek, który wyciągnęłbym w obu przypadkach testowych KS i t, jest taki sam. Mężczyźni osiągają słabe wyniki w stosunku do kobiet. Jaka jest więc korzyść z używania jednego testu nad drugim? Czy jest jakaś nowa wiedza, którą możesz zdobyć korzystając z testu KS?
Moim zdaniem, mężczyźni z rozkładem skupionym wokół niskiej średniej, a kobiety skupione wokół wysokiej średniej, powodują znaczący test t. Ale przez ten sam fakt samce będą miały większe prawdopodobieństwo uzyskania niższych wartości, co spowodowałoby, że wykres wyglądałby jak powyżej i dałby znaczący test KS. Tak więc wyniki obu testów mają tę samą podstawową przyczynę, ale być może można argumentować, że test KS uwzględnia więcej niż tylko środki rozkładów, a także bierze pod uwagę kształt rozkładu, ale czy można przeanalizować przyczynę znaczącego testu KS na podstawie samych wyników testu?
Jaka jest więc wartość testu KS podczas testu? I załóżmy, że mogę spełnić założenia testu t dla tego pytania
Odpowiedzi:
Jako przykład, dlaczego chcesz użyć dwóch przykładowych testów Kołmogorowa-Smirnowa:
Wyobraź sobie, że średnie liczebności populacji były podobne, ale wariancje były bardzo różne. Test Kołmogorowa-Smirnowa mógłby wykryć tę różnicę, ale test t nie.
Albo wyobraź sobie, że rozkłady mają podobne środki i sd, ale samce mają rozkład bimodalny (czerwony), podczas gdy kobiety (niebieski) nie:
Czy mężczyźni i kobiety zachowują się inaczej? Tak - mężczyźni zazwyczaj osiągają wyniki około 7,5-8 lub 12,5-13, podczas gdy kobiety częściej osiągają więcej punktów w kierunku środka (około 10 lub więcej), ale są znacznie mniej skupione wokół tej wartości niż dwie wartości mężczyźni mają tendencję do zdobywania punktów w pobliżu.
Więc Kołmogorow-Smirnov może znaleźć znacznie bardziej ogólne rodzaje różnic w rozkładzie niż test t.
źródło