Czy dodatni termin interakcji sugeruje korelację między jego zmiennymi składowymi?

9

Załóżmy, że korzystam z regresji liniowej, która ma postać .y=β0+β1A+β2B+β3AB+ϵ

Jeśli jest dodatnia, czy oznacza to dodatnią korelację między i ? (Odwrotnie, korelacja ujemna, jeśli jest ujemna?)β3ABβ3

zthomas.nc
źródło
5
To dobry przykład pytania, w którym symulacje mogą pomóc. Generując losowe dane , powinieneś być w stanie dość szybko znaleźć kilka kontrprzykładów. Należy również pamiętać, że dwuliniowy interpolacji jest zazwyczaj wykonywane na sieciach elektrycznych gdzie i są prostopadłe, a „Termin interakcja” może mieć dowolny znak. A,B,yxy
GeoMatt22
5
W rzeczywistości sam pomysł stworzenia zestawu danych zgodnie z tym modelem powinien ostatecznie odpowiedzieć na pytanie. Dlaczego nie wygenerować nieskorelowanych zmiennych , niezależnych błędów i wybrać dowolne wartości bet, które chcesz. Czy jest jakaś przeszkoda w obliczeniu wartości dla każdego ? Jeśli nie, wówczas wartość oznacza nic na temat korelacji i . (cc @ GeoMatt22)(Ai,Bi)ϵiyiiβ3AB
whuber

Odpowiedzi:

12

Nie, niezerowa nie oznacza, że i są skorelowane. Oznacza to, że jest skorelowany z .β3AByAB

Prosty przykład:

Wyobraź sobie, że mamy dane o wizytach osób na stacji benzynowej.

  • Niech będzie objętością czyjegoś zbiornika gazu w galonach.A
  • Niech będzie ceną gazu w czasie wizyty.B
  • Niech będzie wydatki na gazie ta wizyta.y

AB jest kosztem napełnienia zbiornika paliwa danej osoby. prawie na pewno jest skorelowane z , wydatkami na gaz podczas tej wizyty.ABy

Dodatni w tym trywialnym przykładzie nie oznacza, że ​​wielkość czyjegoś zbiornika gazu jest skorelowana z ceną gazu. Dodatnia oznaczałaby, że wydatki są dodatnie związane z pojemnością czyjś zbiornika gazu mierzoną w dolarach (tj. ).β3β3yAB

Matthew Gunn
źródło
9

Oto potencjalnie zastosowany kontrprzykład: załóżmy, że to płeć, to lata nauki, a to zarobki na rynku pracy. Po 12 latach szkoły podstawowej i średniej i trzyletnim licencjacie ukończyłbyś 15 lat nauki.ABy

Zatem nie jest całkowicie wykluczone, że i są nieskorelowane - w przeszłości mężczyźni mieli wyższe stopnie, a obecnie kobiety. Prawdopodobnie był (nie tak odległy) moment, w którym płeć i lata nauki były nieskorelowane, a korelacja z pewnością nie jest dziś silna.AB

A jednak nie jest trudno uzasadnić, że , jako dodatkowy rok nauki, może mieć różny wpływ na zarobki mężczyzn niż kobiet.β30

Tak byłoby na przykład w przypadku „dyskryminacji płacowej” (w cudzysłowie, ponieważ jest to bardzo gorąca kwestia), głównie w przypadku miejsc pracy dla lepiej wykształconych pracowników. Anegdotyczne dowody sugerują, że może tak być, ponieważ mężczyźni na stanowiskach kierowniczych są zwykle lepiej wynagradzani niż kobiety. Z drugiej strony, wynagrodzenia na stanowiskach wymagających mniejszego wykształcenia mogą być częściej określane przez szerokie porozumienia między związkami zawodowymi i stowarzyszeniami pracodawców (przynajmniej na przykład w Europie kontynentalnej), pozostawiając mniej miejsca na dyskryminację płacową.

(Znaki cudzysłowu można na przykład uzasadnić faktem, że ta prosta historia nie uwzględnia sektorów, doświadczenia itp.)

Christoph Hanck
źródło
Czym jest „szkolnictwo” w twoim przykładzie? Zajrzałem do słownika i słowo to ma wiele znaczeń.
ttnphns
1
Dzięki, dokonałem edycji. Jestem zbyt
głęboko
Przepraszam za moje negatywne zdanie, ta odpowiedź dodaje tyle informacji, które nie są potrzebne do wyjaśnienia, że ​​mnie pomylił. Poza tym sprawia, że ​​zakładamy, że A i B mogą być nieskorelowane, co tak naprawdę nie jest prawdą, i dlatego wydało mi się sprzeczne z intuicją.
Dennis Jaheruddin
Cóż ... jeśli chcesz wyjaśnić, które części nie są potrzebne na przykład? Z natury założeń nie można ich przyjąć i jest całkiem jasne, że ten konkretny może się utrzymywać lub nie. Ale poza tym nie ma potrzeby przepraszać, jeśli uważasz, że uzasadnienie głosowania jest uzasadnione.
Christoph Hanck