Czym różnią się oceny skłonności od dodawania zmiennych towarzyszących w regresji i kiedy są one preferowane w stosunku do tej ostatniej?

41

Przyznaję, że jestem stosunkowo nowy w ocenach skłonności i analizie przyczynowej.

Jedną z rzeczy, która nie jest dla mnie oczywista jako nowicjusz, jest to, że „równoważenie” za pomocą wyników skłonności różni się matematycznie od tego, co dzieje się, gdy dodamy zmienne towarzyszące w regresji? Czym różni się operacja i dlaczego jest (lub jest) lepsza niż dodawanie zmiennych zmiennych subpopulacji w regresji?

Widziałem niektóre badania, które dokonują empirycznego porównania metod, ale nie spotkałem się z dobrą dyskusją dotyczącą matematycznych właściwości tych dwóch metod i dlaczego PSM poddaje się interpretacjom przyczynowym, a nie uwzględnia zmiennych towarzyszących regresji. Wydaje się również, że istnieje wiele zamieszania i kontrowersji w tej dziedzinie, co sprawia, że ​​sprawy są jeszcze trudniejsze do zauważenia.

Wszelkie przemyślenia na ten temat lub jakiekolwiek wskazówki dotyczące dobrych zasobów / dokumentów, aby lepiej zrozumieć różnicę? (Powoli przeglądam książkę przyczynową Judei Pearl, więc nie muszę wskazywać na to)

Frank Barry
źródło
3
Polecam lekturę Morgan and Winship, 2007 . Rozdziały 4 i 5 zawierają wyraźne porównanie i kontrast regresji i dopasowania w celu identyfikacji efektu przyczynowego.
conjugateprior
1
Sprawdzając statystyki równowagi, upewniasz się, że nie ma ekstrapolacji między porównywanymi grupami leczenia w odniesieniu do wielowymiarowej przestrzeni współzmiennej. Regresja po prostu ekstrapoluje bez sprawdzania tego, więc ekstrapolacje mogą dawać złe prognozy.
StatsStudent 21.04.2016

Odpowiedzi:

17

Jedną dużą różnicą jest to, że regresja „kontroluje” te cechy w sposób liniowy. Dopasowywanie przez oceny skłonności eliminuje założenie liniowości, ale ponieważ niektóre obserwacje mogą nie być dopasowane, możesz nie być w stanie powiedzieć nic o niektórych grupach.

Na przykład, jeśli studiujesz program szkolenia pracowników, możesz mieć wszystkich zarejestrowanych mężczyzn, ale kontrolna populacja nieuczestnicząca składa się z mężczyzn i kobiet. Za pomocą regresji można regresować dochód, powiedzmy, na zmiennej wskaźnika uczestnictwa i wskaźniku męskim. Użyłbyś wszystkich swoich danych i mógłbyś oszacować dochód kobiety, gdyby uczestniczyła w programie.

Jeśli pasowałeś, mogłeś dopasowywać mężczyzn tylko do mężczyzn. W rezultacie nie będziesz wykorzystywać żadnych kobiet w swoich analizach, a twoje wyniki nie będą ich dotyczyły.

Regresja może ekstrapolować przy użyciu założenia liniowości, ale dopasowanie nie. Wszystkie pozostałe założenia są zasadniczo takie same między regresją a dopasowaniem. Zaletą dopasowywania w stosunku do regresji jest to, że jest ona nieparametryczna (z tym wyjątkiem, że musisz założyć, że masz prawidłowy wynik skłonności, jeśli w ten sposób dopasowujesz).

Aby uzyskać więcej dyskusji, zobacz moją stronę tutaj na kurs, który był mocno skoncentrowany na metodach dopasowywania. Zobacz w szczególności założenia strategii szacowania skutków przyczynowych .

Pamiętaj także o zapoznaniu się z artykułem Rosenbaum i Rubin (1983), który opisuje dopasowanie wyników skłonności.

Wreszcie, dopasowywanie przeszło długą drogę od 1983 roku. Sprawdź stronę Jasa Sekhona, aby dowiedzieć się o jego algorytmie dopasowania genetycznego.

Charlie
źródło
3
Może to dlatego, że nie jestem statystykiem, ale kiedy wydaje się, że przyjąłeś regresję liniową, gdy OP zapytał o regresję w ogóle. Ale myślę, że sedno polega na tym, że dodanie zmiennych towarzyszących do dowolnego regresora powoduje pewne założenia dotyczące przestrzeni wejściowej, dzięki czemu można ekstrapolować na nowe przykłady, a dopasowanie jest bardziej ostrożne w kwestii tego, jakie rzeczy można ekstrapolować.
rrenaud
2
Przy szacowaniu funkcji skłonności przyjmujesz pewne założenia dotyczące formy funkcjonalnej zmiennych zakłócających. Następnie dopasowujesz również osoby, które mają „bliskie” wartości skłonności, więc nie od razu zakładam, że dopasowanie skłonności rozwiązuje problem nieliniowych efektów zakłócających.
AdamO,
2
Linki są zepsute.
Carlos Cinelli,
11

Krótka odpowiedź jest taka, że ​​wyniki skłonności nie są lepsze niż równoważny model ANCOVA, szczególnie w odniesieniu do interpretacji przyczynowej.

Oceny skłonności najlepiej rozumieć jako metodę redukcji danych. Są skutecznym sposobem zredukowania wielu zmiennych towarzyszących do jednego wyniku, którego można użyć do dostosowania efektu zainteresowania dla zestawu zmiennych. W ten sposób oszczędzasz stopnie swobody, dostosowując jeden wynik skłonności zamiast wielu zmiennych towarzyszących. Jest to z pewnością korzyść statystyczna, ale nic więcej.

Jednym z pytań, które mogą pojawić się przy stosowaniu korekty regresji z wynikami skłonności, jest to, czy istnieje jakikolwiek zysk w stosowaniu wyniku skłonności, zamiast przeprowadzania korekty regresji ze wszystkimi współzmiennymi stosowanymi do oszacowania wyniku skłonności zawartego w modelu. Rosenbaum i Rubin wykazali, że „punktowa ocena efektu leczenia z analizy korekty kowariancji dla wielowymiarowego X jest równa szacunkowi uzyskanemu z jednoznacznej korekty kowariancji dla liniowej dyskryminacji próbki na podstawie X, ilekroć stosowana jest ta sama macierz kowariancji próbki zarówno dla korekty kowariancji, jak i analizy dyskryminacyjnej ". Dlatego wyniki obu metod powinny prowadzić do takich samych wniosków. Jednak, Jedną z zalet wykonywania procedury dwuetapowej jest to, że można dopasować bardzo skomplikowany model oceny skłonności z interakcjami i warunkami wyższego rzędu. Ponieważ celem tego modelu punktacji skłonności jest uzyskanie najlepszego oszacowanego prawdopodobieństwa przypisania leczenia, nie należy przejmować się nadmierną parametryzacją tego modelu.

Od:

METODY WYNIKAJĄCE Z PROPENSITYKI W CELU ZMNIEJSZENIA BIASÓW W PORÓWNANIU LECZENIA DO NIEZRANDOMIZOWANEJ GRUPY KONTROLI

D'Agostino (cytując Rosenbauma i Rubina)

D'agostino, RB 1998. Dopasowanie oceny skłonności do zmniejszenia uprzedzeń w porównaniu leczenia z nie-randomizowaną grupą kontrolną. Medycyna statystyczna 17: 2265–2281.

Brett
źródło
5
(+1) W tym pokrewnym pytaniu pojawił się również interesujący wątek na temat związku przyczynowego: Czy z perspektywy statystycznej można wnioskować o związku przyczynowym za pomocą wyników oceny skłonności do badania obserwacyjnego? .
chl
3
Zgadzam się z ogólną przesłanką tej odpowiedzi, ale kiedy jeden dopasowuje się w oparciu o wyniki skłonności, nie jest to to samo, co wstawianie wszystkich zmiennych towarzyszących do modelu (a zatem nie jest to tylko technika redukcji wymiarów). To nie jest to samo, jeśli się waży według wyników skłonności.
Andy W
1
Nie zgadzam się z tą odpowiedzią. Oszacowane wyniki skłonności są dobre, gdy równoważą zmienne towarzyszące w grupach leczenia i kontroli, a złe, gdy nie. Tak samo jak w przypadku podejścia warunkowego regresji. To, czy są „lepsze”, zależy tylko od tej właściwości, która będzie się różnić w zależności od problemu.
conjugateprior
1
Nie zgadzam się, ponieważ chociaż kryterium równowagi jest takie samo, obie strategie są różne, podobnie jak ich mocne i słabe strony. Można, ale nie musi być lepszym podejściem, w zależności od problemu. Rzeczywiście wydaje mi się , że „ równoważny model ANCOVA” nie jest dobrze zdefiniowany. (Odpowiednik jak?)
sprzężonyprior
1
Dobrze. Rozumiem teraz, co znaczyło „równoważne”, ale zdanie, które zaczyna się od „Jednak” w twoim cytacie, wprowadza istotną różnicę: w praktyce rekwizyt. wyniki są szacowane osobno dokładnie, dzięki czemu mogą być znacznie bardziej szczegółowe niż model analizy. (I jest jeszcze jedna różnica w poniższym akapicie artykułu, nie zacytowany.)
sprzężonyprior
7

Prawdopodobnie tępe odniesienie, ale jeśli przypadkiem masz do niego dostęp, poleciłbym przeczytanie tego rozdziału książki ( Apel i Sweeten, 2010 ). Jest skierowany do naukowców społecznych, a więc może nie tak rygorystycznie matematyczny, jak się wydaje, ale powinien być wystarczająco głęboki, aby był więcej niż zadowalającą odpowiedzią na twoje pytanie.

Istnieje kilka różnych sposobów traktowania wyników skłonności, które mogą prowadzić do różnych wniosków, po prostu włączając zmienne towarzyszące w modelu regresji. Kiedy jeden pasuje do wyników, niekoniecznie ma wspólne poparcie dla wszystkich obserwacji (tzn. Ma pewne obserwacje, które wydają się nigdy nie mieć szansy na znalezienie się w grupie leczenia, a niektóre zawsze są w grupie leczenia). Można również ważyć obserwacje na różne sposoby, co może prowadzić do różnych wniosków.

Oprócz odpowiedzi tutaj proponuję również sprawdzić odpowiedzi na cytowane pytanie chl. Za skłonnością do oceny skłonności kryje się więcej substancji niż po prostu sztuczka statystyczna pozwalająca osiągnąć równowagę współzmienną. Po przeczytaniu i zrozumieniu najczęściej cytowanych artykułów Rosenbauma i Rubina stanie się jasne, dlaczego to podejście jest inne niż zwykłe dodawanie zmiennych towarzyszących w modelu regresji. Myślę, że bardziej zadowalająca odpowiedź na twoje pytanie niekoniecznie opiera się na matematyce wyników skłonności, ale na ich logice.

Andy W.
źródło
@Andy W Zobacz cytat Rosenbauma i Rubina na temat równoważności regresji z współzmiennymi i korekty oceny skłonności w moim zaktualizowanym poście.
Brett,
0

Lubię myśleć o PS jako o części projektu, która całkowicie oddzieliła się od analizy. Oznacza to, że możesz myśleć w kategoriach projektowania (PS) i analizy (regresja itp.). Ponadto PS zapewnia środek wspomagający wymienność w leczeniu binarnym; być może inni mogą komentować, czy uwzględnienie zmiennych towarzyszących w modelu wynikowym może faktycznie wspierać wymienność, lub czy ktoś zakłada wymienność przed włączeniem zmiennych towarzyszących w modelu wynikowym.

Teoria Galois
źródło
-3

Metody statystyczne Med Res. 19 kwietnia 2016.

Ocena uprzedzeń w modelach regresji nieliniowej z korektą skłonności.

Metody oceny skłonności są powszechnie stosowane w celu skorygowania obserwowanego zamieszania podczas szacowania efektu leczenia warunkowego w badaniach obserwacyjnych. Jedną z popularnych metod, korektę zmienną wyniku skłonności w modelu regresji, wykazano empirycznie w modelach nieliniowych jest tendencyjny. Nie przedstawiono jednak żadnych istotnych przyczyn teoretycznych. Proponujemy nowe ramy do badania tendencyjności i spójności efektów leczenia skorygowanych o ocenę skłonności w modelach nieliniowych, które wykorzystują proste podejście geometryczne, aby stworzyć związek między spójnością estymatora oceny skłonności a podatnością modeli nieliniowych. W tych ramach wykazujemy, że dostosowanie wyniku skłonności w modelu wynikowym powoduje rozkład obserwowanych zmiennych towarzyszących na wynik skłonności i pozostały okres. Pominięcie tego pozostałego terminu w modelu regresji nieodwracalnej prowadzi do tendencyjnych oszacowań warunkowego współczynnika szans i warunkowego współczynnika ryzyka, ale nie dla współczynnika warunkowego. Ponadto, poprzez badania symulacyjne, wykazujemy, że stronniczość w estymatorach skorygowanych o ocenę skłonności zwiększa się wraz z większym rozmiarem efektu leczenia, większymi efektami zmiennymi towarzyszącymi i rosnącą różnicą między współczynnikami zmiennych towarzyszących w modelu leczenia w porównaniu z modelem wyniku.

dt2016
źródło