Czy mogę użyć Kołmogorowa-Smirnowa do porównania dwóch rozkładów empirycznych?

Czy można stosować test dobroci dopasowania Kołmogorowa-Smirnowa do porównywania dwóch rozkładów empirycznych w celu ustalenia, czy wydają się pochodzić z tego samego rozkładu podstawowego, zamiast porównywania jednego rozkładu empirycznego z wcześniej określonym rozkładem odniesienia?

Pozwól, że spróbuję zapytać o to w inny sposób. Zbieram N próbek z jakiejś dystrybucji w jednym miejscu. Zbieram próbki M w innym miejscu. Dane są ciągłe (każda próbka jest liczbą rzeczywistą między 0 a 10, powiedzmy), ale normalnie nie są dystrybuowane. Chcę przetestować, czy wszystkie próbki N + M pochodzą z tego samego podstawowego rozkładu. Czy w tym celu uzasadnione jest zastosowanie testu Kołmogorowa-Smirnowa?

$F_0$ $N$ $F_1$ $M$ $F_0$ $F_1$ $D = \sup_x |F_0(x) - F_1(x)|$ $D$

(Czytałem gdzie indziej, że test poprawności dopasowania Kołmogorowa-Smirnowa nie jest ważny dla dyskretnych rozkładów , ale przyznaję, że nie rozumiem, co to oznacza lub dlaczego może być prawdą. Czy to oznacza, że moje proponowane podejście jest złe? )

A może polecasz coś innego?

Zastanawiam się, czy w oparciu o komentarze @ Glen_b tutaj ( stats.stackexchange.com/questions/362/... ) nie należy używać testu KS do porównywania rozkładów empirycznych, ponieważ testu KS nie należy stosować przy szacowaniu parametrów (? ).

russellpierce

Odpowiedzi:

To jest w porządku i całkiem rozsądne. Jest to tak zwany test dwóch prób Kołmogorowa-Smirnowa . Mierzenie różnicy między dwiema funkcjami rozkładu przez supermormę jest zawsze sensowne, ale aby przeprowadzić formalny test, chcesz poznać rozkład pod hipotezą, że dwie próbki są niezależne i każda z nich ma ten sam podstawowy rozkład. Aby polegać na zwykłej teorii asymptotycznej, potrzebujesz ciągłości leżącego u jej podstaw wspólnego rozkładu (nie rozkładów empirycznych). Więcej informacji można znaleźć na stronie w Wikipedii, do której prowadzi powyższy link.

W R można użyć ks.test, który oblicza dokładne wartości dla małych rozmiarów próbek. $p$

NRH
źródło

W R możesz także wykonać boothonetowy test KS sekhon.berkeley.edu/matching/ks.boot.html, który pozbywa się wymogu ciągłości

Dr G

więcej informacji, jeśli korzystasz z Matlaba

Artem Kaznatcheev