Różnica między wartościami Cohena i wartościami Hedgesa dla miar wielkości efektu

19

Do analizy wielkości efektu zauważam, że istnieją różnice między d Cohena, g Hedgesa i g * Hedgesa.

  • Czy te trzy wskaźniki są zwykle bardzo podobne?
  • Jaki byłby przypadek, w którym przyniosłyby różne wyniki?
  • Czy jest to również kwestia preferencji, z której korzystam lub z której korzystam?
Elpezmuerto
źródło
1
W przypadku, gdy jest to przydatne, formuły potencjalnego odpowiadającego są wymienione tutaj: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim
Symulacja w R z różnymi wartościami n1, n2, s1, s2 i różnicą populacji byłaby dobrym ćwiczeniem. Ktoś?
Jeromy Anglim,
1
Ten materiał jest również omawiany tutaj: Jaka jest różnica między Hedges 'g a Cohen's d .
Gung - Przywróć Monikę

Odpowiedzi:

18

Zarówno warianty d Cohena, jak i g pule Hedgesa przy założeniu równych wariancji populacji, ale pule g przy użyciu n - 1 dla każdej próbki zamiast n, co zapewnia lepsze oszacowanie, zwłaszcza im mniejsze są wielkości próby. Zarówno di ig są nieco pozytywnie tendencyjne, ale tylko nieznacznie w przypadku średnich lub większych próbek. Odchylenie jest zmniejszane za pomocą g *. Wartość d według Glassa nie zakłada równych wariancji, dlatego używa sd z grupy kontrolnej lub grupy porównawczej linii podstawowej jako standaryzatora dla różnicy między tymi dwoma średnimi.

Te rozmiary efektów oraz rozmiary efektów Cliffa i innych nieparametrycznych omówiono szczegółowo w mojej książce:

Grissom, RJ i Kim, J, J. (2005). Wielkości efektów dla badań: szerokie praktyczne podejście. Mahwah, NJ: Erlbaum.

Robert J. Grissom
źródło
8

Według mojego zrozumienia, g Hedgesa jest nieco bardziej dokładną wersją d Cohena (z pulą SD), ponieważ dodajemy współczynnik korekcji dla małej próbki. Oba miary zasadniczo zgadzają się, gdy założenie homoscedastyczności nie jest naruszone, ale możemy znaleźć sytuacje, w których tak nie jest, patrz np. McGrath i Meyer, Psychological Methods 2006, 11 (4) : 386-401 ( pdf ). Inne artykuły są wymienione na końcu mojej odpowiedzi.

Ogólnie stwierdziłem, że w prawie każdym badaniu psychologicznym lub biomedycznym zgłaszane jest d Cohena; prawdopodobnie wynika to ze znanej ogólnej zasady interpretowania jej wielkości (Cohen, 1988). Nie wiem o żadnym ostatnim artykule rozważającym g Hedgesa (lub deltę Cliffa jako nieparametryczną alternatywę). Bruce Thompson ma poprawioną wersję sekcji APA na temat wielkości efektu.

Przeglądając badania Monte Carlo wokół miar wielkości efektu, znalazłem ten artykuł, który może być interesujący (czytam tylko streszczenie i konfigurację symulacji): Odporne przedziały ufności dla rozmiarów efektów: badanie porównawcze d Cohena i delty Cliffa w warunkach nienormalności i heterogeniczne wariancje (pdf).

O twoim drugim komentarzu, MBESSpakiet R zawiera różne narzędzia do obliczania ES (np. smdI powiązane funkcje).

Inne referencje

  1. Zakzanis, KK (2001). Statystyki mówią prawdę, całą prawdę i tylko prawdę: formuły, ilustracyjne przykłady numeryczne i heurystyczna interpretacja analiz wielkości efektu dla badaczy neuropsychologicznych. Archives of Clinical Neuropsychology , 16 (7), 653-667. ( pdf )
  2. Durlak, JA (2009). Jak wybierać, obliczać i interpretować rozmiary efektów. Journal of Pediatric Psychology ( pdf )
chl
źródło
2
Anonimowy użytkownik chciał dodać następującą definicję homoscedastyczności dla tych, którzy mogą nie być zaznajomieni z tym terminem: „właściwość zestawu zmiennych losowych, gdzie każda zmienna ma tę samą wariancję skończoną”.
Gung - Przywróć Monikę
5

Wydaje się, że kiedy ludzie mówią Cohena, mają na myśli głównie:

d=x¯1x¯2s

Gdzie s jest zbiorczym odchyleniem standardowym,

s=(x1x¯1)2+(x2x¯2)2n1+n22

Istnieją inne estymatory dla zbiorczego odchylenia standardowego, prawdopodobnie najbardziej powszechne poza powyższym:

s=(x1x¯1)2+(x2x¯2)2n1+n2

sn1+n2dgss

Innym razem g Hedge'a jest zarezerwowane, aby odnosić się do którejkolwiek z wersji znormalizowanej średniej skorygowanej przez odchylenie, opracowanej przez Hedgesa. Hedges (1981) wykazał, że wartość d Cohena była tendencyjna w górę (tj. Jego wartość oczekiwana jest wyższa niż rzeczywista wartość parametru populacji), szczególnie w małych próbkach, i zaproponowała współczynnik korygujący w celu skorygowania odchylenia d Cohena:

G według Hedgesa (bezstronny estymator):

g=d(Γ(df/2)df/2Γ((df1)/2))
df=n1+n22Γ

Jednak ten współczynnik korygujący jest dość złożony obliczeniowo, więc Hedges podał również trywialne obliczeniowo przybliżenie, które - choć wciąż nieco tendencyjne - jest odpowiednie do prawie wszystkich możliwych celów:

g

sol=re(1-3)4(refa)-1)
refa=n1+n2)-2)

(Oryginalnie z Hedges, 1981, ta wersja od Borenstein, Hedges, Higgins i Rothstein, 2011, s. 27)

solsol

n>20

Bibliografia:

Borenstein, M., Hedges, LV, Higgins, JP, i Rothstein, HR (2011). Wprowadzenie do metaanalizy. West Sussex, Wielka Brytania: John Wiley & Sons.

Cohen, J. (1977). Analiza mocy statystycznej dla nauk behawioralnych (wydanie 2). Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.

Hedges, LV (1981). Teoria dystrybucji dla estymatora Glassa wielkości efektu i powiązanych estymatorów. Journal of Educational Statistics, 6 (2), 107-128. doi: 10.3102 / 10769986006002107

Hedges LV, Olkin I. (1985). Metody statystyczne metaanalizy. San Diego, Kalifornia: Academic Press

FelixST
źródło
3

Jeśli po prostu próbujesz zrozumieć podstawowe znaczenie Hedgesa, tak jak ja, możesz również uznać to za pomocne:

Wielkość G żywopłotów można interpretować przy użyciu konwencji Cohena (1988 [2]) jako małą (0,2), średnią (0,5) i dużą (0,8). [1]

Ich definicja jest krótka i jasna:

G Hedgesa jest odmianą d Cohena, która koryguje tendencyjność ze względu na małe rozmiary próbki (Hedges i Olkin, 1985). [1] przypis

Byłbym wdzięczny ekspertom od statystyki, którzy to edytują, aby dodać wszelkie ważne zastrzeżenia do małego (0,2) średniego (0,5) i dużego (0,8) roszczenia, aby pomóc niedoświadczonym uniknąć błędnej interpretacji liczb H Hedgesa stosowanych w naukach społecznych i badaniach psychologicznych.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Wpływ terapii opartej na uważności na lęki i depresję: przegląd metaanalizy Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt i Diana Oh. J Consult Clin Psychol. Kwiecień 2010 r .; 78 (2): 169–183. doi: 10.1037 / a0018555

[2] Cohen J. Analiza statystyczna mocy dla nauk behawioralnych. 2nd ed. Erlbaum; Hillsdale, NJ: 1988 (cyt. W [1])

joshoff
źródło
4
+1. Re: małe, średnie, duże, jako pierwsze przejście, jeśli nie masz żadnej odpowiedniej wiedzy ani kontekstu, te „rozmiary koszulek” są OK, ale w rzeczywistości to, co jest małym lub dużym efektem, będzie się różnić w zależności od dyscypliny lub tematu . Co więcej, fakt, że efekt jest „duży”, niekoniecznie oznacza, że ​​jest on praktycznie ważny lub teoretycznie znaczący.
Gung - Przywróć Monikę
1

Pozostałe plakaty dotyczyły kwestii podobieństw i różnic między gid. Aby dodać do tego, niektórzy uczeni uważają, że wartości wielkości efektu oferowane przez Cohena są zdecydowanie zbyt hojne, co prowadzi do nadinterpretacji słabych efektów. Nie są one również powiązane z r, co prowadzi do możliwości, że uczeni mogą konwertować w tę iz powrotem, aby uzyskać bardziej korzystne interpretacje wielkości efektów. Ferguson (2009, Professional Psychology: Research and PRactice) zasugerował użycie następujących wartości do interpretacji dla g:

.41, jako zalecane minimum dla „znaczenia praktycznego”. 1.15, umiarkowany efekt 2.70, silny efekt

Są one oczywiście bardziej rygorystyczne / trudniejsze do osiągnięcia i niewiele eksperymentów z zakresu nauk społecznych przyniesie mocne efekty ... prawdopodobnie tak powinno być.

Podróż w czasie
źródło
0

Bruce Thompson ostrzegał przed użyciem Cohena (0,2) jako małego (0,5) jako średniego i (0,8) jako dużego. Cohen nigdy nie zamierzał używać ich jako sztywnych interpretacji. Wszystkie wielkości efektów należy interpretować w oparciu o kontekst powiązanej literatury. Jeśli analizujesz powiązane wielkości efektów zgłoszone na dany temat i są one (0,1) (0,3) (0,24) i dajesz efekt (0,4), to może to być „duży”. I odwrotnie, jeśli cała pokrewna literatura ma wpływ (0,5) (0,6) (0,7), a ty masz efekt (0,4), można to uznać za małe. Wiem, że jest to trywialny przykład, ale niezwykle ważny. Uważam, że Thompson stwierdził kiedyś w artykule: „Bylibyśmy głupi w innej metodzie”, porównując interpretacje wielkości efektu z tym, jak naukowcy społeczni interpretowali wówczas wartości p.

użytkownik136666
źródło