Pytanie mówi wszystko. Przeczytałem oba, że nie można uogólniać KS do wymiaru równego lub większego niż dwa , i że słynne implementacje takie jak w przepisach numerycznych są po prostu błędne. Czy możesz wyjaśnić, dlaczego tak jest?
kolmogorov-smirnov
bivariate
ecdf
pedrofigueira
źródło
źródło
Odpowiedzi:
Uważam, że uzasadnione jest cytowanie odpowiedniej części tego akapitu:
Jak stwierdzono, wydaje się to zbyt silne.
1) Funkcja rozkładu dwuwymiarowego, czyli to mapa od do . Oznacza to, że funkcja przyjmuje jednoznaczne wartości rzeczywiste od 0 do 1. Te wartości - będące prawdopodobieństwami - są już z pewnością „uporządkowane” - i właśnie to (wartość funkcji) musimy porównać z testami opartymi na ECDF . Podobnie ecdf, jest doskonale dobrze zdefiniowany w przypadku zmiennej dwuwymiarowej.fa(x1,x2)) = P(X1≤x1,X2)≤x2)) R2) [ 0 , 1 ] fa^
Nie sądzę, że koniecznie trzeba próbować przekształcić ją w jakąś funkcję zmiennej łączonej jednowymiarowej, jak sugeruje tekst. Po prostu obliczasz i przy każdej wymaganej kombinacji i obliczasz różnicę.fa fa^
2) Jednak w kwestii tego, czy nie zawiera dystrybucji, mają one rację:
a) wyraźnie taka statystyka testowa nie zmieniłaby się przez zmiany transformacji marginesów, to znaczy, gdyby skonstruowana jako test dwuwymiarowych niezależnych mundurów, , to działa równo a także test niezależnego gdzie . W tym sensie nie zawiera dystrybucji (możemy powiedzieć „bez marży”).U = (U1,U2)) (X1,X2)) Uja=faja(Xja)
b) jednak istnieje podstawowa kwestia bardziej ogólnie w szerszym znaczeniu, że naiwna wersja statystyki KS (jak właśnie opisałem) nie jest ogólnie wolniejsza od dystrybucji; nie możemy po prostu przekształcić arbitralnie .U X∗= g ( U )
We wcześniejszej wersji mojej odpowiedzi powiedziałem:
To jest źle. Rzeczywiście istnieją problemy, jeśli nastąpi zmiana nie tylko marginesów z niezależnych mundurów dwuwymiarowych, jak właśnie wspomniano. Trudności te zostały jednak przeanalizowane na wiele sposobów w wielu dokumentach, które dają dwuwymiarowe / wielowymiarowe wersje statystyk Kołmogorowa-Smirnowa, które nie cierpią z powodu tego problemu.
Mogę wrócić i dodać niektóre z tych odniesień oraz dyskusję na temat ich działania, gdy tylko pozwoli na to czas.
źródło