Mam problem z interpretacją wykresów interakcji, gdy występuje interakcja między dwiema zmiennymi niezależnymi.
Poniższe wykresy pochodzą z tej strony:
Tutaj i są zmiennymi niezależnymi, a jest zmienną zależną.
Pytanie: Występuje interakcja i główny efekt , ale brak głównego efektu
Można zauważyć, że im wyższa wartość , tym wyższa wartość , jeżeli B jest inaczej, jest stała, niezależnie od wartości . Dlatego istnieje interakcja między i i głównym efektem (ponieważ wyższa prowadzi do wyższej , utrzymując stałą na ).
Widzę też, że różne poziomy doprowadzą do różnych poziomów , utrzymując stałeDlatego istnieje główny efekt B. Ale najwyraźniej tak nie jest. To musi oznaczać, że źle interpretuję fabułę interakcji. Co ja robię źle?
Błędnie interpretuję także wątek 6-8. Logika, której użyłem do ich interpretacji, jest taka sama jak ta, której użyłem powyżej, więc jeśli znam błąd, który popełniam powyżej, powinienem być w stanie poprawnie zinterpretować resztę. W przeciwnym razie zaktualizuję to pytanie.
Odpowiedzi:
Interpretujesz poszczególne punkty na wykresie i nazywasz to interakcją, ale tak nie jest. Biorąc podany przez ciebie przykład, wyobraź sobie, jak wyglądałby twój opis interakcji, gdyby główny efekt A był znacznie większy. A może gdyby był znacznie mniejszy lub nawet 0. Twój opis by się zmienił, ale ten główny efekt powinien być niezależny od interakcji. Dlatego twój opis dotyczy danych, ale nie interakcji jako takiej.
Musisz odjąć główne efekty, aby zobaczyć tylko interakcję. Gdy to zrobisz, WSZYSTKIE interakcje 2x2 wyglądają jak ostatnie na stronie, do której się odwołujesz, symetryczne „X”. Na przykład w połączonym dokumencie znajduje się zestaw danych
Widoczne są główne efekty w wierszach i kolumnach. Jeśli zostaną usunięte, możesz zobaczyć interakcję (pomyśl o poniższych macierzach, które działają jednocześnie).
(Odejmowane macierze powyżej można obliczyć jako odchylenia od oczekiwanej średniej wielkiej na podstawie średnich krańcowych. Pierwsza macierz to średnia wielka, 10,5. Druga opiera się na odchyleniu średnich rzędów od średniej średniej. Pierwszy rząd jest o 5,5 wyższy niż średnia średnia itp.)
Po usunięciu głównych efektów interakcję można opisać w wynikach efektu z średniej średniej lub w wyniku różnic w odwróceniu. Przykładem tego drugiego w powyższym przykładzie byłoby „interakcja polega na tym, że efekt B w A1 wynosi 7, a efekt B w A2 wynosi –7”. To stwierdzenie pozostaje prawdziwe niezależnie od wielkości głównych efektów. Podkreśla również, że interakcja dotyczy różnic w efektach, a nie samych efektów.
Teraz rozważ różne wykresy pod linkiem. Głęboko, interakcja ma taki sam kształt, jak opisano powyżej i na wykresie 8, symetryczny X. W takim przypadku efekt B występuje w jednym kierunku na A1, a na drugim w A2 (zauważ, że użycie zwiększonego A w twoim opis sugeruje, że wiesz, że A nie jest kategoryczne). Po dodaniu głównych efektów dzieje się tak, że zmieniają się one wokół ostatecznych wartości. Jeśli właśnie opisujesz interakcję, to ta dla 8 jest odpowiednia dla wszystkich, w których interakcja jest obecna. Jeśli jednak planujesz opisywać dane, najlepszym sposobem jest opisanie efektów i różnic w skutkach. Na przykład dla wykresu 7 może to być: „Oba główne efekty zwiększają się z poziomu 1 do 2,
Jest to zwięzły, dokładny opis danych, danych, w których występuje interakcja, który nie zawiera rzeczywistego opisu interakcji jako takiego. To opis, w jaki sposób główne efekty są modyfikowane przez interakcję. Co powinno wystarczyć, gdy nie podano liczb.
źródło
Kiedy istnieje efekt interakcji między dwoma czynnikami, nie ma sensu mówić o głównych efektach. Nie ma żadnego głównego efektu dla tego rodzaju rozważań, o których wspominasz w swoim poście. Masz rację: efekt poziomu B znasz tylko wtedy, gdy znasz poziom A - więc żadnych efektów głównych.
Na powyższym wykresie, jeśli byłyby główne efekty, ale bez interakcji, twoje dwie linie byłyby równoległe.
źródło
Jeśli Twój model przewiduje odpowiedźY z predyktorów x1 I x2 , oczekiwanej odpowiedzi udziela
Jeśli współczynnikiβ1 I β2 nazywacie „efektami głównymi”, a następnie zauważcie, że β1 daje zmianę w EY kiedy x1 zmienia się o jeden (jednostka tego, co jest mierzone) i kiedy x2=0 . Nie zawsze - a nawet nie często - przypadek ten jest szczególnie interesujący: jeślix2 oznacza temperaturę, znaczenie zera będzie zależeć od arbitralnego wyboru pomiaru w stopniach Celsjusza lub Fahrenheita, jeśli jest to płeć, wówczas znaczenie zero będzie zależeć od arbitralnego wyboru, aby użyć jako płci męskiej lub żeńskiej jako kategorii odniesienia; i dlatego „główny efekt”x1 zależy od arbitralnego wyboru. Czasami ludzie kodują lub tłumaczą predyktory tylko po to, aby te parametry miały dość rozsądną interpretację, co jest dość uczciwe, ale nie ma to istotnej różnicy w stosunku do modelu - do jego prognoz lub prawdopodobieństwa. @ Przykład Johna odpowiada użyciu -1 do kodowaniaA1 I B1 , I 1 do kodu A2 I B2 : następnie β0 jest wielkim środkiem dla wszystkich czterech kombinacji A I B , β1 różnica między średnią odpowiedzią dla A2 na obu poziomach B i wielki środek, i tak dalej.
Podejrzewam, że na wykresie, który pokazuje, że można założyć, lub gdzie indziej powiedziano, że zeroA leży w połowie drogi między A1 I A2 ; dokładnie w tym punkcie, z którego tylko się ruszamB1 do B2 nie ma znaczenia dla odpowiedzi.
źródło
Ze względu na intuicyjną prostotę udawaj, że nie jest to problem statystyczny, ale tylko problem matematyczny. Powiedzmy, że „dane” obejmuje każdy pojedynczy punkt dokładnie na tych liniach w przykładzie, tak, że zadaniem jest opisanie tych linii w całości jako funkcji A i B . Prawdopodobnie tak jest i nie ma potrzeby udawania, ponieważ twój przykład nie zawiera informacji o standardowym błędzie lub resztkach. Następnie, zakładając, że B 1 idealnie dzieli B 2 , i że ( B 1 , A 2 ) jest dokładnie tak daleko powyżej ( B 2 , A 2 ) jak ( B 1 ,A 1 ) jest poniżej ( B 2 , A 1 ) i ignorowanie myślników (tj. Ich wypełnienie, w zasadzie) ...
Połowa punktów na B 1 jest powyżej B 2 , a połowa poniżej, a ich różnice skutecznie się znoszą. Oznacza to, że DV ( B 1 ) = DV ( B 2 ), gdy we wszystkich uśredniania wartości A . Tak, jeśli trzymać A na stałym poziomie A 1 lub A 2 , B 1 i B 2 będą się różnić, ale ponieważ różnice są równe i przeciwnie w przeciwnych wartościach A , nie ma główny wpływ pensjonatów . Różnice w DV( B ), które zależą od wartości A, są całkowicie opisane przez efekt interakcji. Podobną logikę można zastosować do wykresów 6–8, aby dojść do zamierzonych wniosków.
źródło