Odchylenie statystyki Cohena

12

Cohena jest jednym z najczęstszych sposobów mierzenia wielkości efektu ( patrz Wikipedia ). Po prostu mierzy odległość między dwoma środkami pod względem zbiorczego odchylenia standardowego. Jak możemy uzyskać matematyczny wzór szacowania wariancji Cohena ? dd

Edycja z grudnia 2015 r .: Z tym pytaniem wiąże się pomysł obliczania przedziałów ufności wokół . W tym artykule stwierdzono, żed

σd2=n+n×+d22n+

gdzie jest sumą dwóch wielkości próbek, a jest iloczynem dwóch wielkości próbek.n+n×

Jak powstaje ta formuła?

JRK
źródło
@Clarinetist: Edytowanie pytania innej osoby jest nieco kontrowersyjne, aby dodać do niego więcej treści i więcej pytań (w przeciwieństwie do poprawienia brzmienia). Pozwoliłem sobie zatwierdzić twoją edycję (biorąc pod uwagę, że umieściłeś hojną nagrodę i myślę, że twoja edycja poprawi pytanie), ale inni mogą zdecydować się wycofać.
ameba mówi Przywróć Monikę
1
@amoeba Nie ma problemu. Tak długo, jak formuła istnieje dla (której wcześniej nie było) i jasne jest, że szukamy matematycznego wyprowadzenia formuły, to w porządku. σd2
Klarnecista
Myślę, że mianownik drugiej frakcji powinien wynosić . Zobacz moją odpowiedź poniżej. 2(n+2)

Odpowiedzi:

15

Zauważ, że wyrażenie wariancji w pytaniu jest przybliżeniem. Hedges (1981) wyprowadził dużą wariancję próbki i aproksymację w ustawieniu ogólnym (tj. Wiele eksperymentów / badań), a moja odpowiedź w zasadzie omawia pochodne w pracy.d

Po pierwsze, wykorzystamy następujące założenia:

Załóżmy, że mamy dwie niezależne grupy leczenia, (leczenie) i (kontrola). Niech i być oceniane / Odpowiedzi / niezależnie od tematu w grupie i pod warunkiem w grupie , odpowiednio.C Y T i Y C j i T j C.TCYTiYCjiTjC

Zakładamy, że odpowiedzi są normalnie rozłożone i grupy leczenia i kontrolne mają wspólną wariancję, tj

YTiN(μT,σ2),i=1,nTYCjN(μC,σ2),j=1,nC

Wielkość efektu, którą chcemy oszacować w każdym badaniu, to . Oszacowanie wielkości efektu, którego użyjemy, to gdzie jest obiektywną wariancją próby dla grupy . δ=μTμCσ

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2
Sk2k

Rozważmy właściwości dużej próbki . d

Najpierw zauważ, że: i (luźny z moją notacją): i

Y¯TY¯CN(μTμC,σ2nT+nCnTnC)
(1)(nT1)ST2σ2(nT+nC2)=1nT+nC2(nT1)ST2σ21nT+nC2χnT12
(2)(nC1)SC2σ2(nT+nC2)=1nT+nC2(nC1)SC2σ21nT+nC2χnC12

Równania (1) i (2) prowadzą do tego, że (znowu, luźno z moją notacją):

1σ2(nT1)ST2+(nC1)SC2nT+nC21nT+nC2χnT+nC22

A teraz sprytna algebra: gdzie

d=Y¯TY¯C(nT1)ST2+(nC1)SC2nT+nC2=(σnT+nCnTnC)1(Y¯TY¯C)(σnT+nCnTnC)1(nT1)ST2+(nC1)SC2nT+nC2=(Y¯TY¯C)(μTμC)σnT+nCnTnC+μTμCσnT+nCnTnC(nT+nCnTnC)1(nT1)ST2+(nC1)SC2σ2(nT+nC2)=nT+nCnTnC(θ+δnTnCnT+nCVν)
θN(0,1), i . Zatem jest razy zmienna, która następuje po rozkładzie t z stopnie swobody i parametr .Vχν2ν=nT+nC2dnT+nCnTnCnT+nC2δnTnCnT+nC

Korzystając z właściwości momentu rozkładut , wynika, że: gdzie

(3)Var(d)=(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2b2
b=Γ(nT+nC22)nT+nC22Γ(nT+nC32)134(nT+nC2)1

Zatem równanie (3) zapewnia dokładnie dużą wariancję próbki. Zauważ, że obiektywnym estymatorem dla jest , z wariancją:δbd

Var(bd)=b2(nT+nC2)(nT+nC4)(nT+nC)nTnC(1+δ2nTnCnT+nC)δ2

W przypadku dużych stopni swobody (tj. ) wariancja zmienia się z stopniami swobody i parametrem niecentralności może być aproksymowany przez ( Johnson, Kotz, Balakrishnan, 1995 ). Mamy więc: nT+nC2tνp1+p22ν

Var(d)nT+nCnTnC(1+δ2(nTnCnT+nC)2(nT+nC2))=nT+nCnTnC+δ22(nT+nC2)

Podłącz nasz estymator dla i gotowe.δ


źródło
Bardzo, bardzo ładne pochodzenie. Kilka pytań: 1) czy mógłbyś wyjaśnić, co oznacza notacja (wiem, że ma to coś wspólnego z różnicą przykładowych środków, ale jak oba mogą mieć ten sam indeks?)? 2) czy możesz wyjaśnić, w jaki sposób dokonuje się aproksymacji dla (nie potrzebuję wszystkich szczegółów, źródło jest w porządku i może krótkie wyjaśnienie)? W przeciwnym razie jestem z tego całkiem zadowolony. (+1) To również zgadza się z obserwacją, którą poczyniłem, że nie ma normalnego rozkładu, w przeciwieństwie do wyjaśnienia w powiązanym artykule w PO. bdY¯iTY¯iCbd
Klarnecista
@Clarinetist Thanks! 1) Jak mogą mieć ten sam indeks? Literówka, właśnie tak! : P Są artefaktem mojego pierwszego szkicu odpowiedzi. Naprawię to. 2) Wyciągnąłem go z papieru z żywopłotów - w tej chwili nie znam jego pochodzenia, ale pomyślę o tym jeszcze trochę.
Teraz szukam wyprowadzenia, ale dla twojej informacji licznik powinien wynosić . Γ ( n T + n C - 2bΓ(nT+nC22)
Klarnecista
Wyprowadzenie dokumencie: math.stackexchange.com/questions/1564587/... . Okazuje się, że prawdopodobnie wystąpił błąd znaku.
Klarnecista
@mike: bardzo imponująca odpowiedź. Dziękujemy za poświęcenie czasu na podzielenie się z nami.
Denis Cousineau,