Kwestia wielokrotnych porównań to naprawdę duży temat. Było wiele opinii i wiele nieporozumień. Wynika to z wielu rzeczy; między innymi częściowo dlatego, że problem jest naprawdę ważny, a częściowo dlatego, że tak naprawdę nie ma ostatecznej reguły ani kryterium. Weźmy prototypowy przypadek: przeprowadzasz eksperyment z zabiegami i otrzymujesz znaczącą ANOVA, więc teraz zastanawiasz się, które sposoby leczenia różnią się. Jak sobie z tym poradzić, uruchomić testy t t? Chociaż testy te indywidualnie utrzymywałyby na poziomie .05, „rodzinne” (tj. Prawdopodobieństwo wystąpienia co najmniej 1 błędu typu I) wybuchnie. W rzeczywistości wskaźnik błędu rodzinnego wyniesiekk(k−1)/2αα1−(1−α)k. Pytanie brzmi: co definiuje „rodzinę”? I nie ma ostatecznej odpowiedzi poza trywialną, że „rodzina” jest zbiorem kontrastów. To, czy jakiś konkretny zestaw kontrastów należy uznać za rodzinę, jest decyzją subiektywną. Analizy 3, 17 i 42, które kiedykolwiek przeprowadziłem w moim życiu, są zbiorem kontrastów. Mógłbym dostosować mój próg aby mieć pewność, że prawdopodobieństwo wystąpienia błędów typu I wynosi 5%, ale nikt nie uznałoby to za sensowne. Pytanie dla ciebie brzmi: czy uważasz, że twoje kontrasty są zbiorem w sensownym sensie i tylko ty możesz dokonać takiego osądu? Oferuję kilka standardowych podejść. Wielu analityków uważa, że jeśli zestaw kontrastów pochodzi z tego samego zestawu eksperymentów / danych, należy je traktować jak rodzinę,αα dostosowanie ) są konieczne. Inni uważają, że nawet jeśli kontrasty pochodzą z tego samego eksperymentu, a a priori i ortogonalne, specjalne procedury nie są wymagane. Obie te pozycje można obronić. Na koniec należy również zauważyć, że procedury kontroli rodzinnych poziomów błędów są kosztowne. zwiększone poziomy błędów typu II.
gung - Przywróć Monikę
źródło
Dyskusja na temat researchgate ( http://www.researchgate.net/post/Bonferroni-how_is_the_family_of_hypotheses_defined ) dostarczyła listę artykułów, które mogą pomóc w zbieraniu opinii - artykuły faktycznie zaczynają się od pytania „kiedy zastosować poprawki w wielu sytuacjach testowych „. Artykuły - wszystkie często cytowane - to:
1) Rothman KJ. W przypadku wielu porównań nie są wymagane żadne korekty. Epidemiology.1990; 1 (1): 43-6. http://psg-mac43.ucsf.edu/ticr/syllabus/courses/9/2003/02/27/Lecture/readings/Rothman.pdf
2) Perneger TV. Co jest nie tak z dostosowaniami Bonferroni. BMJ. 1998; 316 (7139): 1236–8. http://static.sdu.dk/mediafiles/D/1/F/%7BD1F06030-8FA7-4EE2-BB7D-60D683B18EAA%7DWhat_s-wrong%20_with_Bonferroni_adjustments.BMJ.1998.pdf
3) Bender R, Lange S. Dostosowanie do wielokrotnych testów - kiedy i jak? J Clin Epidemiol. 2001; 54: 343–9. http://www.rbsd.de/PDF/multiple.pdf
Podsumowanie:
1) i 2) koncentrują się na „wszystkich hipotezach zerowych są prawdziwe”, zwanych ogólną hipotezą zerową. Można go lepiej odrzucić (tj. Bez kumulacji alfa), jeśli zastosowane zostaną korekty dla wielu porównań. Jednak zarówno 1), jak i 2) sprzeciwiają się temu, że ogólna hipoteza zerowa jest rzadko w pełni wykorzystywana w procesie badań naukowych - więc kryterium „całej teorii łamie się” nie stosuje się automatycznie, gdy jedna / niektóre hipotezy zerowe w danych analizy są odrzucane przez przypadek. 1) dodaje, że naiwnością jest myśleć o pojedynczych hipotezach zerowych, które zostały (fałszywie) odrzucone, nigdy więcej nie zostaną powtórzone przez społeczność naukową.
3) stwierdza, że gdy pojedyncze hipotezy stopnieją w jednym argumencie, należy dokonać korekt.
Z mojego punktu widzenia 1), 2), 3) razem po prostu odzwierciedlają, jak ostrożnie musimy kryterium „cała teoria łamie”. Nie ma też sposobu na umieszczenie wszystkich zerowych hipotez w jednej dużej kiełbasie - ani też sposobu polegania na kawałkach kiełbasy przedstawionych jako wiele pojedynczych hipotez. To tutaj praca empiryczna naprawdę spotyka się z pracą z teorią z badanej dziedziny.
źródło