Znalazłem ten cytat wiele razy:
Skonsultowanie się ze statystykiem po zakończeniu eksperymentu często oznacza jedynie poproszenie go o przeprowadzenie sekcji zwłok. Może może powiedzieć, z czego umarł eksperyment. - Ronald Fisher (1938)
Wydaje mi się być może trochę zarozumiały. Jedynymi przykładami, jakie kiedykolwiek znalazłem opisującymi, jak eksperymenty giną bez dobrego projektu, są brak kontroli lub słaba kontrola. Na przykład eksperymenty, które kontrolują aplikację nawozu, ale nie kontrolują środowiska wymaganego do aplikacji. Może to tylko ja, ale wydaje się, że szybkie przeczytanie sekcji Wikipedii na temat zasad projektowania Fishera obejmie większość podstaw.
Jako statystyk, jak często widzisz problemy z danymi związane z eksperymentem? Czy zawsze są one związane z tymi kilkoma czynnikami wymienionymi przez Fishera, czy też z innymi poważnymi pułapkami, na które powinniśmy uważać my, nieprzeszkoleni statystycznie naukowcy?
źródło
Odpowiedzi:
Uważam, że to, co Fisher miał na myśli w swoim słynnym cytacie, wykracza poza powiedzenie „Zrobimy pełny czynnikowy projekt do naszych badań” lub inne podejście projektowe. Konsultowanie się ze statystą przy planowaniu eksperymentu oznacza inteligentne myślenie o każdym aspekcie problemu, w tym o celu badań, o tym, jakie zmienne są istotne, jak je gromadzić, zarządzaniu danymi, pułapkach, pośredniej ocenie przebiegu eksperymentu i wielu innych więcej. Często uważam, że ważne jest zapoznanie się z każdym aspektem proponowanego eksperymentu, aby naprawdę zrozumieć, na czym polegają trudności.
Moje doświadczenie pochodzi głównie z zastosowań medycznych. Niektóre z napotkanych problemów, którym można było zapobiec, konsultując się wcześniej ze statystykami:
Często problemy z badaniem sięgają jeszcze dalej, do początkowej koncepcji badań:
Jak dotąd brzmi to tak, jakby cierpiał statystyk i być może cierpi wiarygodność naukowa, gdy PI próbuje wyciągać wnioski nie poparte danymi (zawsze fajna dyskusja). Ale cierpi także zespół eksperymentalny, ponieważ wykonują niepotrzebną dodatkową pracę (nie wykonując niezbędnej pracy) podczas fazy eksperymentalnej i po tym muszą poświęcić znacznie więcej czasu na dyskusję ze swoim statystykiem, ponieważ wcześniej nie uzyskali porady. I oczywiście końcowy artykuł będzie gorszy, będzie miał mniej wniosków (i więcej „przypuszczeń”) i prawdopodobnie nie znajdzie się w tak znaczącym czasopiśmie, jakiego chciał PI.
źródło
Dwa słowa: Wielkość próbki ... Analiza mocy jest koniecznością. Dzięki dołączeniu do zespołu kompetentnych statystyk od samego początku, prawdopodobnie zaoszczędzisz sobie dużo frustracji, pisząc sekcje wyników i dyskusji w swoim manuskrypcie lub raporcie.
Zbyt często zdarza się, że główny badacz zbiera dane przed skonsultowaniem się ze statystykiem w oczekiwaniu na „model predykcyjny” lub „związek przyczynowy” na próbie mniejszej niż 30 osób. Gdyby PI skonsultował się ze statystykiem przed zebraniem danych, statystyka byłaby w stanie poinformować PI, po odpowiednich analizach, w celu zebrania większej ilości danych / podmiotów lub zrestrukturyzowania celów ich planu / projektu analizy.
źródło
Przypuszczam, że zależy to od tego, jak ściśle interpretujesz słowo „projekt”. Czasami uważa się, że oznacza to całkowicie zrandomizowane vs. losowe bloki itp. Nie sądzę, że widziałem badanie, które umarło z tego powodu. Ponadto, jak wspomnieli inni, podejrzewam, że „zmarł” jest zbyt silny, ale zależy to od sposobu interpretacji tego terminu. Z pewnością widziałem badania, które były „nieistotne” (i że w związku z tym badacze później nie próbowali publikować); przy założeniu, że badania te mogłyby być „znaczące”, gdyby zostały przeprowadzone inaczej (zgodnie z oczywistą radą, którą bym dał), a zatem zostały opublikowane, mogą kwalifikować się jako „zmarłe”. W świetle tej koncepcji kwestia mocy podniesiona zarówno przez @RobHall, jak i @MattReichenbach jest dość prosta, ale moc to coś więcej niż wielkość próbki, a te mogą podlegać luźniejszej koncepcji „projektowania”. Oto kilka przykładów:
Nie zbierając / nie rejestrując / nie wyrzucając informacji
Pracowałem nad badaniem, w którym badacze byli zainteresowani tym, czy dana cecha była związana z rakiem. Dostali myszy z dwóch linii (tj. Linii genetycznych, myszy wyhodowano dla określonych właściwości), gdzie jedna linia miała więcej cechy niż druga. Jednak ta cecha nie została faktycznie zmierzona, nawet jeśli mogła być. Ta sytuacja jest analogiczna do dychotomizacji lub binowania zmiennej ciągłej, co zmniejsza moc. Jednak nawet jeśli wyniki byłyby „znaczące”, byłyby mniej pouczające, niż gdybyśmy znali wielkość cechy dla każdej myszy.
Innym przypadkiem w ramach tego samego nagłówka jest brak myślenia i gromadzenie oczywistych współzmiennych.
Zły projekt kwestionariusza
Niedawno pracowałem nad badaniem, w którym przeprowadzono badanie satysfakcji pacjenta w dwóch warunkach. Jednak żaden z elementów nie uzyskał punktacji wstecznej. Okazało się, że większość pacjentów po prostu przewinęła listę i zaznaczyła wszystkie 5s ( zdecydowanie się zgadzam ), być może nawet nie czytając pozycji. Były też inne problemy, ale jest to dość oczywiste. Co dziwne, osoba odpowiedzialna za przeprowadzenie badania powiedziała mi, że jej uczestnictwo wyraźnie zachęciło ją, by nie weryfikowała badania najpierw ze statystykami, mimo że jesteśmy wolni i wygodnie dostępni do takich konsultacji.
źródło
Widziałem tego rodzaju problem w eksperymentach podobnych do ankiet i psychologicznych.
W jednym przypadku cały eksperyment musiał zostać przypisany do doświadczenia edukacyjnego. Na wielu poziomach występowały problemy, które skutkowały mnóstwem wyników, ale wyniki, które zdawały się potwierdzać hipotezę. W końcu mogłem pomóc zaplanować bardziej rygorystyczny eksperyment, który zasadniczo miał wystarczającą moc, aby odrzucić hipotezę.
W innym przypadku otrzymałem ankietę, która została już zaprojektowana i wykonana, i było wiele problemów, które spowodowały wpływ na kilka obszarów zainteresowania. Na przykład w jednym kluczowym obszarze zapytali, ile razy klienci byli odwracani od wydarzenia, ponieważ było pełne, gdy przybyli. Problem polega na tym, że nie ma przedziału czasowego w pytaniu, więc nie można odróżnić kogoś, kto próbował 4 razy uczestniczyć w spotkaniu i został czterokrotnie odrzucony, a kimś, kto próbował uczestniczyć w konferencji 40 razy i został tylko 4 razy odwrócony. .
Nie jestem wyszkolonym statystykiem kapitału, ale gdyby przyszli do mnie wcześniej, byłbym w stanie pomóc im rozwiązać te problemy i uzyskać lepsze wyniki. W pierwszym przypadku nadal byłoby rozczarowujące: „Przepraszam, twoja hipoteza wydaje się niezwykle nieprawdopodobna”, ale może uratować ich drugi eksperyment. W drugim przypadku udzieliłby im odpowiedzi na niektóre ważne pytania i poprawiłoby wyniki. (Innym problemem, jaki mieli, jest to, że badali wiele lokalizacji w czasie, a przynajmniej niektóre osoby były ankietowane wiele razy, bez pytania jak „Czy wziąłeś tę ankietę gdzie indziej?”)
Być może same w sobie nie są to kwestie statystyczne, ale w obu przypadkach inteligentni, dobrze wykształceni eksperci w dziedzinie stworzyli wadliwe instrumenty, a wyniki były jednym martwym eksperymentem i jednym eksperymentem z amputowanymi kończynami.
źródło