Myślę, że mogę odpowiedzieć na twoje pytania dotyczące przynajmniej nieskorygowanych oszacowań powtarzalności, tj. Klasycznych korelacji wewnątrz klasy (ICC). Jeśli chodzi o „skorygowane” szacunki powtarzalności, przejrzałem papier, który podłączyłeś, i tak naprawdę nie widziałem, gdzie można znaleźć zastosowaną formułę? Na podstawie wyrażenia matematycznego wydaje się, że jest to powtarzalność średnich wyników (a nie poszczególnych wyników). Ale nie jest jasne, czy i tak jest to kluczowa część twojego pytania, więc zignoruję to.
(1.) Czy powyższe obliczenia mające na celu oszacowanie punktowe powtarzalności efektu mają sens?
Tak, proponowane wyrażenie ma sens, ale konieczna jest niewielka modyfikacja proponowanej formuły. Poniżej pokazuję, w jaki sposób można uzyskać proponowany współczynnik powtarzalności. Mam nadzieję, że to zarówno wyjaśnia koncepcyjne znaczenie współczynnika, jak i pokazuje, dlaczego pożądane byłoby jego nieznaczne zmodyfikowanie.
Na początek weźmy najpierw współczynnik powtarzalności w pierwszym przypadku i wyjaśnijmy, co to znaczy i skąd pochodzi. Zrozumienie tego pomoże nam zrozumieć bardziej skomplikowany drugi przypadek.
Tylko losowe przechwyty
W tym przypadku mieszanym modelem dla tej odpowiedzi w tej grupie jest
gdzie przypadkowe przechwyty mają wariancję i reszty mają wariancję .ij
yij=β0+u0j+eij,
u0jσ2u0eijσ2e
Teraz korelacja między dwiema zmiennymi losowymi i jest zdefiniowana jako
xy
corr=cov(x,y)var(x)var(y)−−−−−−−−−−√.
Wyrażenie współczynnika ICC / powtarzalności następnie pochodzi pozwalając dwóch zmiennych losowych i są dwie obserwacje wciągane z tego samego grupy
oraz jeśli uprościsz to, korzystając z podanych powyżej definicji i właściwości wariancji / kowariancji (procesu, którego tu nie pokażę, chyba że ty lub inni wolelibyście, żebym to zrobił), otrzymacie
xyj
ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
jadodo= σ2)u0σ2)u0+ σ2)mi.
Oznacza to, że ICC lub „nieskorygowany współczynnik powtarzalności” w tym przypadku ma prostą interpretację jako oczekiwana korelacja między obserwacjami pary z tego samego skupienia (pomniejszona o ustalone efekty, które w tym przypadku jest tylko wielką średnią). Fakt, że ICC można interpretować również jako
odsetek wariancji w tym przypadku, jest przypadkowy; taka interpretacja nie jest ogólnie prawdą w przypadku bardziej skomplikowanych ICC. Podstawowa jest interpretacja jako pewnego rodzaju korelacja.
Losowe przechwyty i losowe stoki
Teraz w drugim przypadku musimy najpierw wyjaśnić, co dokładnie oznacza „niezawodność efektów (tj. Efekt sumarycznego kontrastu zmiennej z 2 poziomami)” - twoje słowa.
Najpierw układamy model. Model mieszany dla tej odpowiedzi w tej grupie poniżej tego poziomu predyktora kodowanego kontrastem to
gdzie przypadkowe przechwyty mają wariancję , losowe stoki mają wariancję , losowe przechwyty i stoki mają kowariancję , a reszty mają wariancję .j k xjajotkx
yijk=β0+β1xk+u0j+u1jxk+eijk,
σ2u0σ2u1σu01eijσ2e
Jaka jest zatem „powtarzalność efektu” w tym modelu? Myślę, że dobrą definicją kandydata jest to, że jest to oczekiwana korelacja między dwiema parami różnic różnic obliczonych w ramach tego samego klastra , ale w różnych parach obserwacji .ji
Tak więc para wyników różnicy byłaby (pamiętaj, że założyliśmy, że jest zakodowany kontrastem, więc ):
i
x|x1|=|x2|=x
yi1jk2−yi1jk1=(β0−β0)+β1(xk2−xk1)+(u0j−u0j)+u1j(xk2−xk1)+(ei1jk2−ei1jk1)=2xβ1+2xu1j+ei1jk2−ei1jk1
yi2jk2−yi2jk1=2xβ1+2xu1j+ei2jk2−ei2jk1.
Podłączenie ich do wzoru korelacji daje nam
co upraszcza do
Zauważ, że ICC jest technicznie funkcją ! Jednak w tym przypadku może przyjąć tylko 2 możliwe wartości, a ICC jest identyczny dla obu tych wartości.
ICC=cov(2xβ1+2xu1j+ei1jk2−ei1jk1,2xβ1+2xu1j+ei2jk2−ei2jk1)var(2xβ1+2xu1j+ei1jk2−ei1jk1)var(2xβ1+2xu1j+ei2jk2−ei2jk1)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
xxICC=2x2σ2u12x2σ2u1+σ2e.
xx
Jak widać, jest to bardzo podobne do współczynnika powtarzalności zaproponowanego w pytaniu, jedyną różnicą jest to, że wariancja losowego nachylenia musi być odpowiednio skalowana, jeśli wyrażenie ma być interpretowane jako ICC lub „nieskorygowany współczynnik powtarzalności”. Wyrażenie, które napisałeś działa w specjalnym przypadku, w którym predyktor jest zakodowany , ale ogólnie nie.± 1x±12√
(2.) Gdy mam wiele zmiennych, których powtarzalność chcę oszacować, dodanie ich do tego samego dopasowania (np. lmer(dv~(iv1+iv2|unit)+iv1+iv2
) Wydaje się dawać wyższe oszacowania powtarzalności niż tworzenie osobnego modelu dla każdego efektu. Ma to dla mnie sens obliczeniowy, ponieważ włączenie wielu efektów będzie miało tendencję do zmniejszania rezydualnej wariancji, ale nie jestem pewien, czy uzyskane szacunki powtarzalności są prawidłowe. Czy oni są?
Uważam, że praca z podobną pochodną, jak przedstawiono powyżej dla modelu z wieloma predyktorami z ich własnymi losowymi nachyleniami, pokazałaby, że powyższy współczynnik powtarzalności byłby nadal aktualny, z wyjątkiem dodatkowej komplikacji, że wyniki różnic, którymi jesteśmy zainteresowani koncepcyjnie, byłyby teraz mają nieco inną definicję: interesuje nas oczekiwana korelacja różnic między skorygowanymi średnimi po kontrolowaniu dla innych predyktorów w modelu.
Jeśli inne predyktory są ortogonalne względem predyktora będącego przedmiotem zainteresowania (jak np. W zrównoważonym eksperymencie), uważam, że opracowany powyżej współczynnik ICC / powtarzalność powinien działać bez żadnych modyfikacji. Jeśli nie są ortogonalne, musisz zmodyfikować formułę, aby uwzględnić to, co może się skomplikować, ale mam nadzieję, że moja odpowiedź podpowiedziała, jak to może wyglądać.