Czasami w raportach zamieszczam oświadczenie o wartościach p i innych dostarczonych statystykach wnioskowania. Mówię, że ponieważ próbka nie była przypadkowa, takie statystyki nie miałyby ścisłego zastosowania. Moje konkretne sformułowanie jest zwykle podane w przypisie:
„Podczas gdy, ściśle rzecz biorąc, wnioskowanie statystyczne ma zastosowanie tylko w kontekście losowego próbkowania, stosujemy konwencję w raportowaniu poziomów istotności i / lub przedziałów ufności jako dogodnych mierników, nawet w przypadku próbek nielosowych. Zobacz Wnioskowanie statystyczne Michaela Oakesa : komentarz dla społeczności i nauki behawioralne (NY: Wiley, 1986).
Kilka razy - raz dla recenzowanej pracy, raz lub dwa w środowisku nieakademickim - redaktor lub recenzent sprzeciwił się temu zrzeczeniu się, nazywając je mylącym, i uważał, że wnioski wnioskowania powinny być po prostu zgodne z opisem (i otrzymaj płaszcz władzy). Czy ktoś jeszcze napotkał ten problem i znalazł dobre rozwiązanie? Z jednej strony ludzkie rozumienie wartości p jest na ogół ponure, nawet w kontekście losowego próbkowania, więc być może nie ma to większego znaczenia, co mówimy. Z drugiej strony przyczynianie się do nieporozumień wydaje się stanowić jedną z części problemu. Powinienem dodać, że często mam do czynienia z badaniami ankietowymi, w których losowe przydzielanie nie ma zastosowania i gdzie symulacje Monte Carlo często nie rozwiązują problemu reprezentatywności.
Odpowiedzi:
Rzeczywiście istnieje argument, który nie powinien obejmować wyłączenia odpowiedzialności. Szczerze mówiąc, znalazłem krótki traktat na temat natury wartości p w artykule w czasopiśmie, który byłby trochę odrażający, i przez chwilę musiałbym się zatrzymać i spróbować dowiedzieć się, czy zrobiłeś coś szczególnie… .esoteric ... uzasadnić poświęcenie tej przestrzeni do określonego punktu.
Zasadniczo, jako recenzent, nazwałbym to niepotrzebnym, ponieważ czytelnik powinien już wiedzieć, czym jest wartość p i co robi. Mogę nawet się temu sprzeciwić, ponieważ sporządzenie takiej notatki w rzeczywistości nie zapobiega żadnej z wielu zbrodni analizy i interpretacji, które towarzyszą wartościom p, a jedynie nakłada płaszcz „zaufaj mi, wiem, co robię”. To również trochę dziwne - „Zamierzam odważnie przeciwstawić się wartościom p, ale nie tak śmiałym, że ich nie zgłaszam”.
Kiedy rozważam „ugruntowane poglądy na wartości p”, jestem znacznie mniej zaniepokojony czymś takim, co napisałeś powyżej, a bardziej martwię się naciskami recenzentów na znaczenie statystyczne w celu opublikowania lub przedmiotem artykułu (umieść gwiazda po znalezieniu i nagle jest to wielka sprawa) lub mieszanie znaczenia statystycznego ze znaczeniem znaleziska.
źródło
Wykorzystanie wnioskowania statystycznego można uzasadnić nie tylko na podstawie modelu populacji, ale także na podstawie modelu randomizacji. Ten ostatni nie przyjmuje żadnych założeń dotyczących sposobu uzyskania próbki. W rzeczywistości Fisher był tym, który zasugerował, że model randomizacji powinien być podstawą wnioskowania statystycznego (w przeciwieństwie do Neymana i Pearsona). Zobacz na przykład:
Ernst, MD (2004). Metody permutacji: podstawa do dokładnego wnioskowania. Statistics Science, 19, 676-685. [link (otwarty dostęp)]
Ludbrook, J. & Dudley, H. (1998). Dlaczego testy permutacji przewyższają testy ti F w badaniach biomedycznych. American Statistician, 52, 127-132. [link (jeśli masz dostęp do JSTOR)]
W jakiś sposób wątpię jednak, czy redaktorzy lub recenzenci używali tego jako powodu nazywania waszego wyłączenia odpowiedzialności „mylącym”.
źródło
Inną, potencjalnie uzupełniającą opcją byłoby rozwinięcie przypisu. Zarówno opis problemu, jakiego doświadczyli recenzenci, jak i obecnie zaakceptowana odpowiedź na tej stronie, sugerują, że nie przekazano wystarczającej ilości informacji, aby wyjaśnić twoją motywację do włączenia przypisu, ani wystarczająco, aby zmotywować czytelnika do podążania za twoim cytatem do referencji że używasz tego tak zwięźle. Pojedyncze, dodatkowe zdanie, a nawet krótki cytat z referencji, może znacznie przyczynić się do wyjaśnienia wartości przypisu i zmotywowania czytelników do głębszego czytania. Najwyraźniej twój przypis jak wcześniej motywuje prostą, negatywną, lekceważącą reakcję na twoją zaniżoną próbę zakłócania ich samozadowolenia z powodu niewłaściwych założeń. Czytelnicy mogą być nieco mniej leniwi intelektualnie, jeśli nakarmisz je jedną lub dwiema głównymi kwestiami dotyczącymi problemów, które prawdopodobnie rutynowo przeoczają. Również w przypadku wielu szczególnych problemów zp
Referencje
- Goodman, SN (1992). Komentarz na temat replikacji, wartości P i dowodów. Statystyka w medycynie, 11 (7), 875–879.
- Goodman, SN (2001). Z P -values i Bayesa: Skromna propozycja. Epidemiology, 12 (3), 295–297. Źródło: http://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf .
- Goodman, S. (2008). Brudny tuzin: dwanaście błędnych wyobrażeń o wartości P. Seminaria z hematologii, 45 (3), 135–140. Źródło: http://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf .
- Gorroochurn, P., Hodge, SE, Heiman, GA, Durner, M., i Greenberg, DA (2007). Brak replikacji badań asocjacyjnych: „pseudo-awarie” do replikacji? Genetics in Medicine, 9 (6), 325–331. Źródło: http://www.nature.com/gim/journal/v9/n6/full/gim200755a.html .
- Hurlbert, SH i Lombardi, CM (2009). Ostateczne załamanie się ram teoretycznych decyzji Neymana-Pearsona i powstanie neoFisherii. Annales Zoologici Fennici, 46 (5), 311–349. Źródło: http://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf .
- Lew, MJ (2013). Do P lub nie do P: O dowodowym charakterze wartości P i ich miejscu w wnioskach naukowych. arXiv: 1311.0081 [stat.ME]. Źródło:http://arxiv.org/abs/1311.0081 .
- Nuzzo, R. (2014, 12 lutego). Metoda naukowa: błędy statystyczne. Nature News, 506 (7487). Źródło: http://www.nature.com/news/scientific-method-statistic-errors-1.14700 .
- Rosenthal, R., Rosnow, RL i Rubin, DB (2000). Kontrasty i rozmiary efektów w badaniach behawioralnych: podejście korelacyjne. Cambridge University Press.
- Senn, S. (2001). Dwa okrzyki dla wartości P? Journal of Epidemiology and Biostatistics, 6 (2), 193–204. Źródło: http://www.phil.vt.edu/dmayo/conference_2010/Senn%20Two%20Cheers%20Paper.pdf .
- Wagenmakers, EJ (2007). Praktyczne rozwiązanie wszechobecnych problemówwartości p . Biuletyn i przegląd psychonomiczny, 14 (5), 779–804. Źródło: http://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf .
źródło