Confounder - definicja

14

Według M. Katza w jego książce Analiza wieloczynnikowa (sekcja 1.2, strona 6): „ Zdezorientator jest związany z czynnikiem ryzyka i przyczynowo związany z wynikiem. ” Dlaczego ten dezorientator musi być przyczynowo związany z wynikiem? Czy wystarczyłoby, aby osoba wprowadzająca zamieszanie kojarzyła się z wynikiem?

marco
źródło
5
Cześć @marco, witamy na stronie! Miguel Hernan ma bezpłatny plik PDF swojej książki „Wnioskowanie przyczynowe”. Część 1 (rozdział 7 na stronie 83) omawia strukturę zamieszania. To może być ciekawa lektura. W szczególności pisze: „Niepokojące jest nastawienie, które powstaje, gdy leczenie i wynik mają wspólną przyczynę”.
COOLSerdash
2
Ten post rzuca również trochę światła na zamieszanie.
COOLSerdash

Odpowiedzi:

21

Dlaczego zamieszanie musi być przyczynowo związane z wynikiem? Czy wystarczyłoby, aby pomieszacz był powiązany z wynikiem?

Nie, to nie wystarczy.

Zacznijmy od przypadku, w którym możesz mieć zmienną, która jest zarówno związana z wynikiem, jak i leczeniem, ale kontrolowanie jej wpłynęłoby na twoje oszacowanie.

Z

wprowadź opis zdjęcia tutaj

W tym przypadku nie ma żadnych problemów, możesz bezpośrednio oszacować wpływ X na Y.

Zauważ jednak, że Z wiąże się zarówno z leczeniem, jak i z wynikiem. Ale nadal nie jest to mylące. W rzeczywistości, jeśli kontrolujesz Z w tym przypadku, popchnąłbyś swoje oszacowania. Ta sytuacja nazywa się stronniczością M (ze względu na strukturę grafu).

X i wyniku Y. Weź ten prosty wykres zderzacza:

wprowadź opis zdjęcia tutaj

Tutaj znowu Z jest powiązane z X i Y, ale nie jest współzałożycielem. Nie powinieneś tego kontrolować.

Teraz warto zauważyć, że nawet jeśli zmienna jest przyczynowo związana z wynikiem , niekoniecznie jest to również myląca.

Weźmy przypadek mediatorów na prostym wykresie poniżej:

wprowadź opis zdjęcia tutaj

Jeśli chcesz zmierzyć całkowity wpływ D na Y, nie powinieneś kontrolować rzeczy, które pośredniczą w tym efekcie --- w tym przypadku M. albo całkowity wpływ D na Y albo.


Zauważ jednak, że zdefiniowanie konfirmacji jest znacznie łatwiejsze niż zdefiniowanie, czym jest zamieszanie . Aby uzyskać bardziej szczegółową dyskusję na temat definicji konfouder , możesz przeczytać ten artykuł autorstwa VanderWeele i Shpitser.

Dlaczego tak jest? Ponieważ podstawową koncepcją tutaj jest samo zamieszanie, a nie zamieszanie. W przypadku pytania badawczego powinieneś zadać sobie pytanie „w jaki sposób mogę wyeliminować zamieszanie?” zamiast „czy ta zmienna powoduje zamieszanie?”.

Na koniec warto wspomnieć, że te nieporozumienia są nadal powszechne. Aby to zilustrować, weź cytat z artykułu z 2016 roku :

Wnioskowanie przyczynowe przy braku randomizowanego eksperymentu lub silnego quasi-eksperymentalnego projektu wymaga odpowiedniego uwarunkowania wszystkich zmiennych przed leczeniem, które przewidują zarówno leczenie, jak i wynik, znane również jako mylące zmienne towarzyszące.

Jak pokazaliśmy w poprzednich przykładach, jest to niepoprawne. Mylące nie są „wszystkimi zmiennymi sprzed leczenia, które przewidują zarówno leczenie, jak i wynik”. Kontrolowanie wszystkich z nich może nie być konieczne do wyeliminowania nieporozumień lub może nawet wpływać na wyniki. Pearl ma tutaj bardzo dobry przegląd mylących kwestii.

Carlos Cinelli
źródło