Czy można stosować test dobroci dopasowania Kołmogorowa-Smirnowa do porównywania dwóch rozkładów empirycznych w celu ustalenia, czy wydają się pochodzić z tego samego rozkładu podstawowego, zamiast porównywania jednego rozkładu empirycznego z wcześniej określonym rozkładem odniesienia?
Pozwól, że spróbuję zapytać o to w inny sposób. Zbieram N próbek z jakiejś dystrybucji w jednym miejscu. Zbieram próbki M w innym miejscu. Dane są ciągłe (każda próbka jest liczbą rzeczywistą między 0 a 10, powiedzmy), ale normalnie nie są dystrybuowane. Chcę przetestować, czy wszystkie próbki N + M pochodzą z tego samego podstawowego rozkładu. Czy w tym celu uzasadnione jest zastosowanie testu Kołmogorowa-Smirnowa?
re
(Czytałem gdzie indziej, że test poprawności dopasowania Kołmogorowa-Smirnowa nie jest ważny dla dyskretnych rozkładów , ale przyznaję, że nie rozumiem, co to oznacza lub dlaczego może być prawdą. Czy to oznacza, że moje proponowane podejście jest złe? )
A może polecasz coś innego?
Odpowiedzi:
To jest w porządku i całkiem rozsądne. Jest to tak zwany test dwóch prób Kołmogorowa-Smirnowa . Mierzenie różnicy między dwiema funkcjami rozkładu przez supermormę jest zawsze sensowne, ale aby przeprowadzić formalny test, chcesz poznać rozkład pod hipotezą, że dwie próbki są niezależne i każda z nich ma ten sam podstawowy rozkład. Aby polegać na zwykłej teorii asymptotycznej, potrzebujesz ciągłości leżącego u jej podstaw wspólnego rozkładu (nie rozkładów empirycznych). Więcej informacji można znaleźć na stronie w Wikipedii, do której prowadzi powyższy link.
W R można użyćp
ks.test
, który oblicza dokładne wartości dla małych rozmiarów próbek.źródło