Czy istnieje alternatywa dla testu Kołmogorowa-Smirnowa dla powiązanych danych z korektą?

14

Mam garść danych z dwóch próbek (kontrolnej i poddanej obróbce), z których każda zawiera kilka tysięcy wartości, które mają zostać poddane testom istotności w R. Teoretycznie wartości powinny być ciągłe, ale z powodu zaokrąglenia wykonanego przez oprogramowanie pomiarowe nie są i mają więzi. Rozkłady są nieznane, a kształty rozkładów kontrolnych i leczonych mogą być różne, dlatego chciałbym zastosować test nieparametryczny, aby porównać, czy różnica między próbkami jest znacząca dla 10 różnych czynników.

Myślałem o zastosowaniu testu Kołmogorowa-Smirnowa, ale tak naprawdę nie nadaje się do więzi. Niedawno natknąłem się na nową bibliotekę R o nazwie Matching, która wykonuje bootstrapową wersję testu KS i toleruje więzi. Czy to naprawdę dobry pomysł, czy powinienem zamiast tego użyć innego testu? I czy muszę dostosować wartość p?

AnjaM
źródło
Powiązany artykuł dotyczy dopasowywania wyników skłonności. Może być tak, że test bootstrap ma większą ogólność, ale nie jestem pewien.
Michael R. Chernick
Zrobiłbym wersję randomizacyjną czegoś takiego jak Kołmogorow-Smirnov (właściwie właściwie prawdopodobnie użyłbym albo Andersona-Darlinga, albo Cramera-von Misesa dla KS, ale nadal z rozkładem losowości, aby się tym zająć więzi).
Glen_b
Czy widziałeś kod Toma Waterhouse'a ?
Ray Koopman

Odpowiedzi:

13

Zamiast korzystać z testu KS, możesz po prostu użyć procedury permutacji lub ponownego próbkowania zaimplementowanej w oneway_testfunkcji coinpakietu. Spójrz na zaakceptowaną odpowiedź na to pytanie .

Aktualizacja : Mój pakiet afexzawiera funkcję compare.2.vectorsimplementującą permutację i inne testy dla dwóch wektorów. Możesz go pobrać z CRAN:

install.packages("afex")

Dla dwóch wektorów xi y(obecnie) zwraca coś takiego:

> compare.2.vectors(x,y)
$parametric
   test test.statistic test.value test.df       p
1     t              t     -1.861   18.00 0.07919
2 Welch              t     -1.861   17.78 0.07939

$nonparametric
             test test.statistic test.value test.df       p
1 stats::Wilcoxon              W     25.500      NA 0.06933
2     permutation              Z     -1.751      NA 0.08154
3  coin::Wilcoxon              Z     -1.854      NA 0.06487
4          median              Z      1.744      NA 0.17867

Wszelkie uwagi dotyczące tej funkcji są mile widziane.

Henrik
źródło
3
(+1) Opis tego i innych testów można znaleźć na tym blogu
@Henrik Dzięki za sugestię i za wskazanie drugiego pytania. To bardzo pomocne!
AnjaM,
@AnjaM Nie ma za co. Możesz także sprawdzić moją aktualizację.
Henrik