Próbuję zrozumieć, jak uzyskać wartości dla jednostronnego testu Kołmogorowa-Smirnowa i staram się znaleźć CDF dla i w przypadku dwóch próbek. Poniżej podano w kilku miejscach CDF dla w przypadku jednej próby:
Co więcej, istnieje nieco inna formuła tego jednopróbkowego CDF (zastępuję w jego cytacie za spójność z moją notacją tutaj):
Wykorzystując transformatę całkową prawdopodobieństwa, Donald Knuth wyprowadza ich (wspólny) rozkład na str. 57 i ćwiczenie 17 TAoCP Tom 2. Cytuję:
Odnosi się to do jednostronnych hipotez w przypadku jednej próby, takich jak: H , gdzie jest empirycznym CDF z , a to trochę CDF.
I że w tym przypadku jest to wartość w swoim próbki, a jest największą liczbą całkowitą . (Czy to prawda?)
Ale czym jest CDF dla (lub ), gdy ma się dwie próbki? Na przykład, gdy H dla empirycznych CDF i ? Jak uzyskać ?
źródło
Odpowiedzi:
Ok, mam zamiar to zrobić. Mile widziane krytyczne spostrzeżenia.
Na stronie 192 Gibbons i Chakraborti (1992), powołując się Hodges, 1958, start z małej próbki (dokładny?) CDF dla testu dwustronnego (ja swapping ich i notacja dla i odpowiednio ):m , n re n1,n2) x
Gdzie powstaje przez wyliczenie ścieżek (monotonicznie rosnących w i ) od początku do punktu przez wykres z - podstawiając na - wartości x- osi i y- osi wynoszą i . Ścieżki muszą ponadto być zgodne z ograniczeniem pozostawania w granicach (gdzie jest wartością statystyki testu Kołmogorowa-Smirnowa):A (n1,n2)) n1 n2) (n1,n2)) S.m( x ) fan1( x ) n1fa1( x ) n2)fa2)( x ) x
Poniżej znajduje się ich obraz Rysunek 3.2, podając przykład , z 12 takimi ścieżkami:A ( 3 , 4 )
Gibbons i Chakaborti twierdzą dalej, że jednostronna wartość jest uzyskiwana przy użyciu tej samej metody graficznej, ale tylko z dolną granicą dla i tylko górna dla .p re+n1,n2) re-n1,n2)
Te małe próby obejmują algorytmy zliczania ścieżek i / lub relacje powtarzalności, co niewątpliwie czyni pożądane obliczenia asymptotyczne. Gibony i Chakraborti zauważają również ograniczające CDF, gdy i zbliżają się do nieskończoności, :n1 n2) ren1,n2)
I podają ograniczający CDF (lub ) jako:re+n1,n2) re-n1,n2)
Ponieważ i są ściśle nieujemne, CDF może przyjmować tylko niezerowe wartości powyżej :re+ re- [ 0 , ∞ )
Odnośniki
Gibbons, JD i Chakraborti, S. (1992). Nieparametryczne wnioskowanie statystyczne . Marcel Decker, Inc., wydanie trzecie, wydanie poprawione i rozszerzone.
Hodges, JL (1958). Prawdopodobieństwo istotności testu dwóch prób Smirnova. Arkiv för matematik . 3 (5): 469--486.
źródło