Do analizy wielkości efektu zauważam, że istnieją różnice między d Cohena, g Hedgesa i g * Hedgesa.
- Czy te trzy wskaźniki są zwykle bardzo podobne?
- Jaki byłby przypadek, w którym przyniosłyby różne wyniki?
- Czy jest to również kwestia preferencji, z której korzystam lub z której korzystam?
effect-size
cohens-d
Elpezmuerto
źródło
źródło
Odpowiedzi:
Zarówno warianty d Cohena, jak i g pule Hedgesa przy założeniu równych wariancji populacji, ale pule g przy użyciu n - 1 dla każdej próbki zamiast n, co zapewnia lepsze oszacowanie, zwłaszcza im mniejsze są wielkości próby. Zarówno di ig są nieco pozytywnie tendencyjne, ale tylko nieznacznie w przypadku średnich lub większych próbek. Odchylenie jest zmniejszane za pomocą g *. Wartość d według Glassa nie zakłada równych wariancji, dlatego używa sd z grupy kontrolnej lub grupy porównawczej linii podstawowej jako standaryzatora dla różnicy między tymi dwoma średnimi.
Te rozmiary efektów oraz rozmiary efektów Cliffa i innych nieparametrycznych omówiono szczegółowo w mojej książce:
Grissom, RJ i Kim, J, J. (2005). Wielkości efektów dla badań: szerokie praktyczne podejście. Mahwah, NJ: Erlbaum.
źródło
Według mojego zrozumienia, g Hedgesa jest nieco bardziej dokładną wersją d Cohena (z pulą SD), ponieważ dodajemy współczynnik korekcji dla małej próbki. Oba miary zasadniczo zgadzają się, gdy założenie homoscedastyczności nie jest naruszone, ale możemy znaleźć sytuacje, w których tak nie jest, patrz np. McGrath i Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Inne artykuły są wymienione na końcu mojej odpowiedzi.
Ogólnie stwierdziłem, że w prawie każdym badaniu psychologicznym lub biomedycznym zgłaszane jest d Cohena; prawdopodobnie wynika to ze znanej ogólnej zasady interpretowania jej wielkości (Cohen, 1988). Nie wiem o żadnym ostatnim artykule rozważającym g Hedgesa (lub deltę Cliffa jako nieparametryczną alternatywę). Bruce Thompson ma poprawioną wersję sekcji APA na temat wielkości efektu.
Przeglądając badania Monte Carlo wokół miar wielkości efektu, znalazłem ten artykuł, który może być interesujący (czytam tylko streszczenie i konfigurację symulacji): Odporne przedziały ufności dla rozmiarów efektów: badanie porównawcze d Cohena i delty Cliffa w warunkach nienormalności i heterogeniczne wariancje (pdf).
O twoim drugim komentarzu,
MBESS
pakiet R zawiera różne narzędzia do obliczania ES (np.smd
I powiązane funkcje).Inne referencje
źródło
Wydaje się, że kiedy ludzie mówią Cohena, mają na myśli głównie:
Gdzies jest zbiorczym odchyleniem standardowym,
Istnieją inne estymatory dla zbiorczego odchylenia standardowego, prawdopodobnie najbardziej powszechne poza powyższym:
Innym razem g Hedge'a jest zarezerwowane, aby odnosić się do którejkolwiek z wersji znormalizowanej średniej skorygowanej przez odchylenie, opracowanej przez Hedgesa. Hedges (1981) wykazał, że wartość d Cohena była tendencyjna w górę (tj. Jego wartość oczekiwana jest wyższa niż rzeczywista wartość parametru populacji), szczególnie w małych próbkach, i zaproponowała współczynnik korygujący w celu skorygowania odchylenia d Cohena:
G według Hedgesa (bezstronny estymator):
Jednak ten współczynnik korygujący jest dość złożony obliczeniowo, więc Hedges podał również trywialne obliczeniowo przybliżenie, które - choć wciąż nieco tendencyjne - jest odpowiednie do prawie wszystkich możliwych celów:
(Oryginalnie z Hedges, 1981, ta wersja od Borenstein, Hedges, Higgins i Rothstein, 2011, s. 27)
Bibliografia:
Borenstein, M., Hedges, LV, Higgins, JP, i Rothstein, HR (2011). Wprowadzenie do metaanalizy. West Sussex, Wielka Brytania: John Wiley & Sons.
Cohen, J. (1977). Analiza mocy statystycznej dla nauk behawioralnych (wydanie 2). Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.
Hedges, LV (1981). Teoria dystrybucji dla estymatora Glassa wielkości efektu i powiązanych estymatorów. Journal of Educational Statistics, 6 (2), 107-128. doi: 10.3102 / 10769986006002107
Hedges LV, Olkin I. (1985). Metody statystyczne metaanalizy. San Diego, Kalifornia: Academic Press
źródło
Jeśli po prostu próbujesz zrozumieć podstawowe znaczenie Hedgesa, tak jak ja, możesz również uznać to za pomocne:
Ich definicja jest krótka i jasna:
Byłbym wdzięczny ekspertom od statystyki, którzy to edytują, aby dodać wszelkie ważne zastrzeżenia do małego (0,2) średniego (0,5) i dużego (0,8) roszczenia, aby pomóc niedoświadczonym uniknąć błędnej interpretacji liczb H Hedgesa stosowanych w naukach społecznych i badaniach psychologicznych.
[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Wpływ terapii opartej na uważności na lęki i depresję: przegląd metaanalizy Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt i Diana Oh. J Consult Clin Psychol. Kwiecień 2010 r .; 78 (2): 169–183. doi: 10.1037 / a0018555
[2] Cohen J. Analiza statystyczna mocy dla nauk behawioralnych. 2nd ed. Erlbaum; Hillsdale, NJ: 1988 (cyt. W [1])
źródło
Pozostałe plakaty dotyczyły kwestii podobieństw i różnic między gid. Aby dodać do tego, niektórzy uczeni uważają, że wartości wielkości efektu oferowane przez Cohena są zdecydowanie zbyt hojne, co prowadzi do nadinterpretacji słabych efektów. Nie są one również powiązane z r, co prowadzi do możliwości, że uczeni mogą konwertować w tę iz powrotem, aby uzyskać bardziej korzystne interpretacje wielkości efektów. Ferguson (2009, Professional Psychology: Research and PRactice) zasugerował użycie następujących wartości do interpretacji dla g:
.41, jako zalecane minimum dla „znaczenia praktycznego”. 1.15, umiarkowany efekt 2.70, silny efekt
Są one oczywiście bardziej rygorystyczne / trudniejsze do osiągnięcia i niewiele eksperymentów z zakresu nauk społecznych przyniesie mocne efekty ... prawdopodobnie tak powinno być.
źródło
Bruce Thompson ostrzegał przed użyciem Cohena (0,2) jako małego (0,5) jako średniego i (0,8) jako dużego. Cohen nigdy nie zamierzał używać ich jako sztywnych interpretacji. Wszystkie wielkości efektów należy interpretować w oparciu o kontekst powiązanej literatury. Jeśli analizujesz powiązane wielkości efektów zgłoszone na dany temat i są one (0,1) (0,3) (0,24) i dajesz efekt (0,4), to może to być „duży”. I odwrotnie, jeśli cała pokrewna literatura ma wpływ (0,5) (0,6) (0,7), a ty masz efekt (0,4), można to uznać za małe. Wiem, że jest to trywialny przykład, ale niezwykle ważny. Uważam, że Thompson stwierdził kiedyś w artykule: „Bylibyśmy głupi w innej metodzie”, porównując interpretacje wielkości efektu z tym, jak naukowcy społeczni interpretowali wówczas wartości p.
źródło