Recenzuję artykuł, który wykonał> 15 osobnych testów 2x2 Chi Square. Zasugerowałem, że muszą poprawić wiele porównań, ale odpowiedzieli, mówiąc, że wszystkie porównania zostały zaplanowane i dlatego nie jest to konieczne.
Wydaje mi się, że to nie musi być poprawne, ale nie mogę znaleźć żadnych zasobów, które wyraźnie stwierdzą, czy tak jest.
Czy ktoś może w tym pomóc?
Aktualizacja:
Dziękujemy za wszystkie bardzo pomocne odpowiedzi. W odpowiedzi na prośbę @ gung o dodatkowe informacje na temat badania i analiz porównują dane zliczeń dla dwóch rodzajów uczestników (studentów, nie-studentów) w dwóch warunkach, w trzech okresach. Wiele testów 2x2 Chi Square porównuje każdy przedział czasu, w każdym warunku, dla każdego typu uczestnika (jeśli ma to sens; np. Studenci, warunek 1, przedział czasu 1 vs przedział czasu 2), więc wszystkie analizy testują tę samą hipotezę .
Odpowiedzi:
To jest IMHO złożony problem i chciałbym przedstawić trzy uwagi na temat tej sytuacji.
Po pierwsze i ogólnie, bardziej skupiłbym się na tym, czy zmierzysz się z badaniem potwierdzającym z zestawem dobrze ukształtowanych hipotez zdefiniowanych w kontekście argumentacyjnym lub badaniem wyjaśniającym, w którym zaobserwowano wiele prawdopodobnych wskaźników, niż czy są one planowane, czy nie (ponieważ możesz po prostu zaplanuj wszystkie możliwe porównania).
Po drugie, skupiłbym się również na tym, jak omawiane są następnie uzyskane wartości p. Czy są one indywidualnie wykorzystywane do przedstawienia ostatecznych wniosków, czy też są wspólnie omawiane jako dowody i brak dowodów?
Na koniec chciałbym omówić możliwość, że hipoteza> 15 wynikająca z> 15 oddzielnych testów chi-kwadrat jest w rzeczywistości wyrażeniem kilku pojedynczych hipotez (być może jednej), które można streścić.
Mówiąc bardziej ogólnie, niezależnie od tego, czy hipoteza jest z góry określona, czy nie, poprawienie wielu porównań jest kwestią tego, co uwzględnisz w błędzie typu I. Nie korygując MC, utrzymujesz tylko kontrolę wskaźnika błędów dla porównania typu I. Tak więc w przypadku licznych porównań masz wysoki wskaźnik błędów typu I dla całej rodziny, a zatem jesteś bardziej podatny na fałszywe odkrycia.
źródło
Biorąc pod uwagę twoją aktualizację projektu, sugerowałbym, aby wykonali jakąś formę log-liniowego modelu, aby użyć wszystkich danych na raz. Przeprowadzone przez nich analizy posiłków wydają się (a) nieefektywne (b) nienaukowe, ponieważ testują 15 hipotez, w których z pewnością jest mniej prawdziwych hipotez.
Nie jestem fanem korygowania mnogości jako odruchu warunkowego, ale w tym przypadku, jeśli odrzucą one głębsze podejście analityczne, sugerowałbym, aby poprawili.
źródło
Jeśli zastąpisz słowo „planowane” słowem „z premedytacją”, może to pomóc w rozwianiu argumentu przedstawionego przez autorów. Rozważ dwie różne analizy statystyczne tych samych danych:
Tak czy inaczej, jest to „morderstwo” - pytanie brzmi, czy jest to stopień pierwszy, czy drugi stopień. Oczywiście pierwszy z nich jest moralnie bardziej problematyczny. Wydaje mi się, że autorzy tutaj próbują twierdzić, że nie było to morderstwo, ponieważ zostało zaplanowane z premedytacją.
źródło
Ten artykuł dotyczy bezpośrednio twojego pytania: http://jrp.icaap.org/index.php/jrp/article/view/514/417
(Frane, AV, „Planowane testy hipotez nie są koniecznie zwolnione z korekty mnogości”, Journal of Research Practice, 2015)
źródło