Czy mogę użyć Kołmogorowa-Smirnowa do porównania dwóch rozkładów empirycznych?

16

Czy można stosować test dobroci dopasowania Kołmogorowa-Smirnowa do porównywania dwóch rozkładów empirycznych w celu ustalenia, czy wydają się pochodzić z tego samego rozkładu podstawowego, zamiast porównywania jednego rozkładu empirycznego z wcześniej określonym rozkładem odniesienia?

Pozwól, że spróbuję zapytać o to w inny sposób. Zbieram N próbek z jakiejś dystrybucji w jednym miejscu. Zbieram próbki M w innym miejscu. Dane są ciągłe (każda próbka jest liczbą rzeczywistą między 0 a 10, powiedzmy), ale normalnie nie są dystrybuowane. Chcę przetestować, czy wszystkie próbki N + M pochodzą z tego samego podstawowego rozkładu. Czy w tym celu uzasadnione jest zastosowanie testu Kołmogorowa-Smirnowa?

F0NF1MF0F1reD=supx|F0(x)F1(x)|D

(Czytałem gdzie indziej, że test poprawności dopasowania Kołmogorowa-Smirnowa nie jest ważny dla dyskretnych rozkładów , ale przyznaję, że nie rozumiem, co to oznacza lub dlaczego może być prawdą. Czy to oznacza, że ​​moje proponowane podejście jest złe? )

A może polecasz coś innego?

DW
źródło
Zastanawiam się, czy w oparciu o komentarze @ Glen_b tutaj ( stats.stackexchange.com/questions/362/... ) nie należy używać testu KS do porównywania rozkładów empirycznych, ponieważ testu KS nie należy stosować przy szacowaniu parametrów (? ).
russellpierce

Odpowiedzi:

19

To jest w porządku i całkiem rozsądne. Jest to tak zwany test dwóch prób Kołmogorowa-Smirnowa . Mierzenie różnicy między dwiema funkcjami rozkładu przez supermormę jest zawsze sensowne, ale aby przeprowadzić formalny test, chcesz poznać rozkład pod hipotezą, że dwie próbki są niezależne i każda z nich ma ten sam podstawowy rozkład. Aby polegać na zwykłej teorii asymptotycznej, potrzebujesz ciągłości leżącego u jej podstaw wspólnego rozkładu (nie rozkładów empirycznych). Więcej informacji można znaleźć na stronie w Wikipedii, do której prowadzi powyższy link.

W R można użyć ks.test, który oblicza dokładne wartości dla małych rozmiarów próbek. p

NRH
źródło
8
W R możesz także wykonać boothonetowy test KS sekhon.berkeley.edu/matching/ks.boot.html, który pozbywa się wymogu ciągłości
Dr G
5
więcej informacji, jeśli korzystasz z Matlaba
Artem Kaznatcheev