I zostały pominie ten przegląd lm / lmer formuł R od @conjugateprior i irytować się według następującego wpisu:
Załóżmy teraz, że A jest losowy, ale B jest stały, a B jest zagnieżdżony w A.
aov(Y ~ B + Error(A/B), data=d)
Poniżej przedstawiono analogiczną formułę modelu mieszanego lmer(Y ~ B + (1 | A:B), data=d)
dla tego samego przypadku.
Nie do końca rozumiem, co to znaczy. W eksperymencie, w którym podmioty są podzielone na kilka grup, mielibyśmy czynnik losowy (podmioty) zagnieżdżony w ustalonym czynniku (grupach). Ale jak można zagnieździć stały czynnik w losowym czynniku? Coś naprawiono zagnieżdżonego w losowych obiektach? Czy to w ogóle możliwe? Jeśli nie jest to możliwe, czy te formuły R mają sens?
Ten przegląd jest wymieniona być częściowo oparte na stronach osobowości projektu na ten ANOVA w R oparła się na tym tutorialu na powtarzanych pomiarów w R . Podany jest następujący przykład ANOVA dla powtarzanych pomiarów:
aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)
Tutaj uczestnikom przedstawiono słowa o różnej wartościowości (czynnik z trzema poziomami) i mierzono ich czas przywołania. Każdemu tematowi przedstawiane są słowa ze wszystkich trzech poziomów walencyjnych. Nie widzę nic zagnieżdżonego w tym projekcie (wydaje się, że jest skrzyżowane, jak na wspaniałą odpowiedź tutaj ), więc naiwnie pomyślałbym, że Error(Subject)
lub (1 | Subject)
powinien być odpowiedni losowy termin w tym przypadku. Subject/Valence
„Zagnieżdżanie” (?) Jest niejasna.
Zauważ, że rozumiem, że Valence
jest to czynnik wewnątrz podmiotu . Ale myślę, że nie jest to czynnik „zagnieżdżony” w podmiotach (ponieważ wszyscy badani doświadczają wszystkich trzech poziomów Valence
).
Aktualizacja. Badam pytania na temat CV dotyczące kodowania powtarzanych miar ANOVA w R.
W tym przypadku stosuje się następujące ustalone i powtarzane miary w obrębie podmiotu / powtarzane miary
subject
:summary(aov(Y ~ A + Error(subject/A), data = d)) anova(lme(Y ~ A, random = ~1|subject, data = d))
Tutaj dla dwóch stałych efektów A i B w obrębie podmiotu / powtarzanych pomiarów:
summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d)) lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d)
Tutaj dla trzech wewnętrznych efektów A, B i C:
summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d)) lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)
Moje pytania:
- Dlaczego
Error(subject/A)
nieError(subject)
? - Jest to
(1|subject)
albo(1|subject)+(1|A:subject)
lub po prostu(1|A:subject)
? - Jest to
(1|subject) + (1|A:subject)
czy(1|subject) + (0+A|subject)
i dlaczego nie wystarczy(A|subject)
?
Do tej pory widziałem kilka wątków, które twierdzą, że niektóre z tych rzeczy są równoważne (np. Pierwszy: twierdzenie, że są takie same, ale przeciwne twierdzenie dotyczące SO ; trzeci: rodzaj twierdzenia, że są takie same ). Czy oni są?
źródło
subject/condition
ten, jest to koncepcyjnie wątpliwe, ponieważ wydaje się sugerować, że warunki są zagnieżdżone w podmiotach, kiedy wyraźnie jest odwrotnie, ale faktycznie jestsubject + subject:condition
to model, który jest idealnie prawidłowym modelem z przypadkowymi efektami podmiotowymi i losowe stoki obiektu X.lm
iaov
formuły? Jeśli chcę mieć wiarygodne źródło tego, na czym dokładnieaov
polega (czy jest to opakowanielm
?) I jakError()
działają warunki, gdzie powinienem szukać?aov
jest opakowaniemlm
w tym sensie, żelm
jest używane dla dopasowania najmniejszych kwadratów, aleaov
wykonuje dodatkową pracę (zwłaszcza tłumaczącError
terminlm
). Autorytatywnym źródłem jest kod źródłowy lub ewentualnie odniesienie podane whelp("aov")
: Chambers i in. (1992). Ale nie mam dostępu do tego odwołania, więc zajrzałbym do kodu źródłowego.Odpowiedzi:
W modelach mieszanych traktowanie czynników jako stałych lub losowych, szczególnie w połączeniu z tym, czy są one skrzyżowane, częściowo skrzyżowane czy zagnieżdżone, może prowadzić do wielu nieporozumień. Wydaje się również, że istnieją różnice w terminologii między tym, co rozumie się przez zagnieżdżanie w świecie anova / zaprojektowanych eksperymentów a światem modeli mieszanych / wielopoziomowych.
Nie twierdzę, że znam wszystkie odpowiedzi i moja odpowiedź nie będzie kompletna (i może powodować dalsze pytania), ale spróbuję rozwiązać niektóre z tych problemów tutaj:
(tytuł pytania)
Nie, nie sądzę, żeby to miało sens. Kiedy mamy do czynienia z powtarzanymi taktami, wtedy zwykle wszystko, co się powtarza, będzie losowe, nazwijmy to
Subject
, ilme4
będziemy chcieli umieścićSubject
po prawej stronie jednego lub więcej|
w losowej części formuła. Jeśli mamy inne losowe efekty, są one albo skrzyżowane, częściowo skrzyżowane, albo zagnieżdżone - i moja odpowiedź na to pytanie rozwiązuje ten problem.Problem z tymi eksperymentami typu anova wydaje się polegać na tym, jak radzić sobie z czynnikami, które normalnie można by uznać za ustalone, w sytuacji powtarzanych działań, a pytania w treści OP mówią o tym:
Zwykle nie używam,
aov()
więc mogłem coś przeoczyć, ale dla mnieError(subject/A)
jest to bardzo mylące w przypadku powiązanego pytania .Error(subject)
w rzeczywistości prowadzi do dokładnie takich samych wyników.Odnosi się to do tego pytania. W takim przypadku wszystkie poniższe formuły efektów losowych prowadzą do dokładnie tego samego wyniku:
Wynika to jednak z faktu, że symulowany zestaw danych w pytaniu nie ma w sobie żadnej zmiany, jest po prostu tworzony
Y = rnorm(48)
. Jeśli weźmiemy prawdziwy zestaw danych, taki jakcake
zbiór danych wlme4
, stwierdzimy, że na ogół tak nie będzie. Z dokumentacji oto konfiguracja eksperymentalna:Powtórzyliśmy więc w sobie środki
replicate
, a także interesują nas ustalone czynnikirecipe
itemperature
(możemy to zignorować,temp
ponieważ jest to po prostu inne kodowanietemperature
) i możemy wizualizować sytuację za pomocąxtabs
:Gdyby
recipe
to był efekt losowy, powiedzielibyśmy, że są to efekty losowe skrzyżowane. W żaden sposób nierecipe A
należy doreplicate 1
żadnej replikacji.Podobnie dla
temp
.Pierwszy model, który moglibyśmy zmieścić, to:
Będzie to traktować każde
replicate
jako jedyne źródło losowej zmienności (inne niż resztkowe oczywiście). Ale mogą istnieć losowe różnice między przepisami. Możemy więc pokusić się o uwzględnienierecipe
jako kolejnego (skrzyżowanego) efektu losowego, ale byłoby to niewłaściwe, ponieważ mamy tylko 3 poziomy,recipe
więc nie możemy oczekiwać, że model dobrze oszacuje składniki wariancji. Zamiast tego możemy użyćreplicate:recipe
jako zmiennej grupującej, która pozwoli nam traktować każdą kombinację replikacji i przepisu jako osobny czynnik grupujący. Tak więc mając na uwadze powyższy model, mielibyśmy 15 losowych przechwyceń dla poziomówreplicate
, a teraz będziemy mieli 45 losowych przechwyceń dla każdej z oddzielnych kombinacji:Zauważ, że mamy teraz (bardzo nieznacznie) różne wyniki wskazujące, że istnieje pewna losowa zmienność ze względu na przepis, ale nie jest to wielka różnica.
Podobnie moglibyśmy zrobić to samo
temperature
.Teraz wracając do pytania, pytacie również
Nie jestem do końca pewien, skąd to (przy użyciu losowych nachyleń) - wydaje się, że nie pojawia się w 2 połączonych pytaniach - ale mam problem z
(1|subject) + (1|A:subject)
tym, że jest dokładnie taki sam,(1|subject/A)
co oznacza, żeA
jest zagnieżdżonysubject
, co w turn oznacza (dla mnie), że każdy poziomA
występuje na 1 i tylko 1 poziom,subject
którego wyraźnie tutaj nie ma.Prawdopodobnie dodam i / lub edytuję tę odpowiedź po tym, jak się nad tym zastanowię, ale chciałem uspokoić swoje początkowe przemyślenia.
źródło
cake
zestaw danych. Wydaje się, że replikacja jest zagnieżdżona w recepturze; powódxtabs
nie pokazuje, że jest to dokładnie powód, który opisujesz w swojej odpowiedzi zagnieżdżonej vs. skrzyżowanej: replikacja jest myląco kodowana jako 1-15, a nie jako 1-45. Dla każdego przepisu wykonano 15 „powtórzeń” z 6 ciastami; każde ciasto następnie pieczono w innej temperaturze. Zatem przepis jest czynnikiem między podmiotami, a temperatura jest czynnikiem wewnątrz podmiotu. Tak powinno być zgodnie z twoją odpowiedzią(1|recipe/replicate)
. Nie?(1|replicate:recipe)
jest prawdopodobnie równoważny.cake
do jednego przepisu. Jeśli chodzi o trzeci punkt, o którym mówisz, że nie masz pewności, skąd on pochodzi, zobacz ostatni link w moim Q, z przykładem trzech czynników wewnątrz podmiotu. Zobacz także pozytywny komentarz Jake'a pod tym Q, w którym wspomina o losowych zboczach.aov
ciebie, masz rację, że wydaje się, żeError(subject/A)
iError(subject)
dają takie same wyniki, jeśli nie ma innych czynników, ale weź przykład z połączonego wątku z dwoma czynnikami, a tamError(subject/(A*B))
iError(subject)
nie są równoważne. Moje obecne rozumienie jest takie, że to pierwsze obejmuje przypadkowe stoki.cake
zestaw danych nie był dobrym działającym przykładem. Przepraszam. Przyjrzę się temu nieco głębiej i prawdopodobnie spróbuję znaleźć lepszy do zilustrowania.Ups Alarmujący komentatorzy zauważyli, że mój post był pełen bzdur. Myliłem projekty zagnieżdżone i powtarzane miary.
Ta strona zawiera użyteczny podział różnicy między projektami zagnieżdżonych i powtarzanych miar. Co ciekawe, autor pokazuje oczekiwane średnie kwadraty dla ustalonych w ustalonych, losowych w ustalonych i losowych w losowych - ale nie ustalonych w losowych. Trudno sobie wyobrazić, co by to oznaczało - jeśli czynniki na poziomie A zostaną wybrane losowo, to losowość rządzi teraz wyborem czynników na poziomie B. Jeśli 5 szkół zostanie wybranych losowo z rady szkoły, a następnie 3 nauczycieli będzie wybrane z każdej szkoły (nauczyciele zagnieżdżeni w szkołach), poziomy współczynnika „nauczyciela” są teraz losową selekcją nauczycieli z rady szkolnej na podstawie losowej selekcji szkół. Nie mogę „naprawić” nauczycieli, których będę miał w eksperymencie.
źródło