Czy istnieje wersja z wieloma próbkami lub alternatywa dla testu Kołmogorowa-Smirnowa?

12

Porównuję rozkład wielkości drzew na sześciu parach poletek, gdzie jedna poletka została poddana obróbce, a druga kontroli. Używając testu Kołmogorowa-Smirnowa na każdej parze wykresów, stwierdzam, że wynosi od 0,0003707 do 0,75 . Czy istnieją jakieś odpowiednie metody radzenia sobie ze wszystkimi powtórzeniami łącznie, takie jak rozszerzenie próby KS na wiele próbek, czy też istnieje odpowiedni test kontrolny? A może powinienem po prostu wyciągnąć wniosek: „Rozkład wielkości różni się znacznie (p <0,05 ) na 2 parach wykresów i marginalnie ( p = 0,59 ) na jednej parze wykresów”.p0.00037070.75(p<0.05p=0.59

N Brouwer
źródło
2
Co chcesz porównać w tych rozkładach, że różnią się tendencją centralną lub że różnią się kształtem? Myślę o KS jako bardziej o kształcie / naturze rozkładu, ale coś takiego jak test Friedmana może ustalić, że próbki różnią się tendencją centralną.
gung - Przywróć Monikę

Odpowiedzi:

13

W rzeczywistości istnieje kilka przykładowych testów KS. Np. Próba r Kolmogorova-Smirnova z która, jak sądzę, ma dobrą moc. Przedruk tego pięknego papieru jest dostępny tutaj . Znam również analogi K-próbki z Kołmogorowa-Smirnowa i Cramera-V. Testy Misesa (ale o ile wiem, mają mniej mocy).r2

Momo
źródło
5
Cóż, wadą tego „pięknego” artykułu Böhm i Hornika jest to, że, o ile wiem, nie ma publicznie dostępnej implementacji. Matematyka jest na tyle złożona, że ​​sam nie chciałbyś jej wdrożyć. Wysłałem autorów pocztą i poprosiłem ich, ale nie odpowiedzieli. Pamiętaj, że Hornik jest członkiem grupy R Core Developers ... Jeśli ktoś wie o implementacji, proszę zamieścić link tutaj!
Laryx Decidua,
8

Istnieje pakiet R kSamples, który daje między innymi nieparametryczny test k-próbki Andersona-Darlinga. Hipoteza zerowa jest taka, że ​​wszystkie k próbek pochodzi z tego samego rozkładu, którego nie trzeba podawać. Może możesz tego użyć.

Mały przykład porównywania próbek normalnych i rozproszonych gamma skalowanych w taki sposób, aby miały tę samą średnią i wariancję:

library("kSamples")
set.seed(142)
samp.num <- 100
alpha <- 2.0; theta <- 3.0  # Gamma parameters shape and scale, using Wikipedia notation
gam.mean <- alpha * theta # mean of the Gamma
gam.sd <- sqrt(alpha) * theta # S.D. of the Gamma
norm.data <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)  # Normal with the same mean and SD as the Gamma
gamma.data <- rgamma(samp.num, shape=alpha, scale=theta)
norm.data2 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
norm.data3 <- rnorm(samp.num, mean=gam.mean, sd=gam.sd)
ad.same <- ad.test(norm.data,norm.data2,norm.data3) # "not significant, p ~ 0.459"
ad.diff <- ad.test(gamma.data,norm.data2,norm.data3) # "significant, p ~ 0.00066"
Laryx Decidua
źródło
4

Kilka podejść:

Użyj par p-wartości, ale dostosuj je do wielu porównań, używając czegoś takiego jak Bon Bononi lub Fałszywe wskaźniki szybkości wykrywania (pierwsza prawdopodobnie będzie nieco zbyt konserwatywna). Dzięki temu możesz mieć pewność, że te, które wciąż znacznie się różnią, prawdopodobnie nie są wynikiem wielu testów.

Możesz stworzyć ogólny test w smaku KS, znajdując największą odległość między dowolnymi rozkładami, tj. Wykreśl wszystkie empiryczne pliki cdf i znajdź największą odległość od najniższej linii do najwyższej linii, a może średnią odległość lub inny znaczący pomiar. Następnie możesz sprawdzić, czy jest to istotne, wykonując test permutacji: zgrupuj wszystkie dane w 1 dużym pojemniku, a następnie losowo podziel je na grupy o takich samych rozmiarach próbek, jak oryginalne grupy, ponownie oblicz statystyki na permutowanych danych i powtórz proces wiele razy (około 999). Następnie sprawdź, jak oryginalne dane mają się do permutowanych zestawów danych. Jeśli pierwotne statystyki danych mieszczą się w środku permutowanych, nie ma znaczących różnic, ale jeśli są na krawędzi, lub poza którymkolwiek z permutowanych, dzieje się coś ważnego (ale to nie mówi ci, które są różne). Prawdopodobnie powinieneś to wypróbować na symulowanych danych, w których wiesz, że istnieje różnica, która jest wystarczająco duża, aby być interesującym, aby sprawdzić moc tego testu i znaleźć interesujące różnice.

Greg Snow
źródło