Dlaczego dopasowywanie wyniku oceny skłonności do wnioskowania przyczynowego?

13

Dopasowanie oceny skłonności służy do wnioskowania przyczynowego w badaniach obserwacyjnych (patrz artykuł Rosenbaum / Rubin ). Jaka jest prosta intuicja, dlaczego to działa?

Innymi słowy, dlaczego jeśli upewnimy się, że prawdopodobieństwo uczestniczenia w leczeniu jest równe dla obu grup, znikną zakłócające efekty i możemy wykorzystać wynik, aby wyciągnąć wnioski przyczynowe dotyczące leczenia?

max
źródło
8
Mój jest prawdopodobnie niepopularną opinią, ale myślę, że powiedzenie, że PSM pozwala na wnioskowanie przyczynowe, nieco go rozciąga. Tak, jest to metoda dokładniejszego dopasowywania niż tylko „surowe” dopasowanie do kilku zmiennych, ale pod koniec dnia nadal dopasowujesz tylko te zmienne, które są dla ciebie obserwowalne. Nadal możesz mieć leczenie endogenne, ale zakładasz, że po dopasowaniu leczenie jest egzogenne. Ale z drugiej strony jestem nikim w porównaniu do takich jak Rubin :)
Markiz de Carabas
5
Są tacy, którzy nie zgadzają się z Rosenbaumem i Rubinem. Gary King dość skutecznie argumentował, że wyniki dopasowania za pomocą PSM są gorsze od wyników uzyskanych z dopasowania opartego na odległości Mahalanobisa. Zobacz jego artykuł tutaj ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Ponadto to seminarium internetowe dostarcza jeszcze bardziej przekonujących dowodów ... metody-colloquium.com/…
Mike Hunter
4
Teoretycznie MOŻNA dokonać wnioskowania przyczynowego stosując model przyczynowy Rubina, jeśli wszystkie założenia są spełnione. Ale oczywiście diabeł zawsze tkwi w szczegółach tego założenia, a dla mnie założenie o niezauważonych pomieszaniach jest często trudne. W rzeczywistości nie można tego udowodnić. Ale możesz przynajmniej przeprowadzić analizy wrażliwości, aby określić, co trzeba zrobić, aby twoje wnioski się zmieniły, gdybyś nie zauważył zamieszania.
StatsStudent
5
Dobry punkt @DJohnson. Są też tacy Judea Pearl, Ian Shrier i Arvid Sjolander, którzy są krytyczni wobec Rubin's Potential Outcome Framework dla wnioskowania przyczynowego ze względu na możliwość wprowadzenia „M-stronniczości” poprzez coś, co nazywają „zderzaczem”. Są to interesujące lektury i powinny uzupełniać wszelkie lektury Rubina.
StatsStudent

Odpowiedzi:

12

Spróbuję dać ci intuicyjne zrozumienie przy minimalnym nacisku na matematykę.

Główny problem z danymi obserwacyjnymi i wynikającymi z nich analizami jest mylący. Zamieszanie występuje, gdy zmienna wpływa nie tylko na przypisane leczenie, ale także na wyniki. Gdy przeprowadzany jest randomizowany eksperyment, osobnicy są losowo przydzielani do leczenia, tak aby średnio osoby przypisane do każdego leczenia były podobne w odniesieniu do zmiennych towarzyszących (wiek, rasa, płeć itp.). W wyniku tej randomizacji jest mało prawdopodobne (szczególnie w dużych próbach), że różnice w wynikach wynikają z dowolnych zmiennych towarzyszących, ale z powodu zastosowanego leczenia, ponieważ średnio zmienne towarzyszące w grupach leczenia są podobne.

Z drugiej strony, w przypadku danych obserwacyjnych nie ma losowego mechanizmu, który przypisuje badanych do leczenia. Weźmy na przykład badanie, aby sprawdzić wskaźniki przeżycia pacjentów po nowej operacji serca w porównaniu ze standardową procedurą chirurgiczną. Zazwyczaj nie można randomizować pacjentów do każdej procedury ze względów etycznych. W rezultacie pacjenci i lekarze samodzielnie wybierają jeden z zabiegów, często z wielu powodów związanych z ich współzmiennymi. Na przykład nowa procedura może być nieco bardziej ryzykowna, jeśli jesteś starszy, w wyniku czego lekarze mogą zalecać nowe leczenie częściej młodszym pacjentom. Jeśli tak się stanie i spojrzysz na wskaźniki przeżycia, nowe leczenie może wydawać się bardziej skuteczne, ale byłoby to mylące, ponieważ młodsi pacjenci zostali przydzieleni do tego leczenia, a młodsi pacjenci zwykle żyją dłużej, wszystko inne jest równe. Tutaj przydają się oceny skłonności.

Oceny skłonności pomagają w podstawowym problemie wnioskowania przyczynowego - że możesz mieć zamieszanie z powodu braku randomizacji pacjentów do leczenia i może to być przyczyną „efektów”, które widzisz, a nie samej interwencji lub leczenia. Jeśli byłbyś w stanie w jakiś sposób zmodyfikować swoją analizę, tak aby zmienne towarzyszące (np. Wiek, płeć, płeć, stan zdrowia) były „zrównoważone” między grupami leczenia, miałbyś mocne dowody, że różnica w wynikach wynika z interwencji / leczenia zamiast tych współzmiennych. Oceny skłonności określają prawdopodobieństwo przypisania każdego pacjenta do leczenia, które otrzymali, biorąc pod uwagę zestaw obserwowanych kowarian. Jeśli następnie dopasujesz te prawdopodobieństwa (wyniki skłonności),

Możesz zapytać, dlaczego nie pasują dokładnie do zmiennych towarzyszących (np. Upewnij się, że dopasujesz 40-letnich mężczyzn w dobrym zdrowiu w leczeniu 1 do 40-letnich mężczyzn w dobrym zdrowiu w leczeniu 2)? Działa to dobrze w przypadku dużych próbek i kilku zmiennych towarzyszących, ale staje się to prawie niemożliwe, gdy wielkość próbki jest niewielka, a liczba zmiennych towarzyszących jest nawet umiarkowanie wielkości (dlaczego przekleństwo wymiarów na Weryfikacji krzyżowej, dlaczego tak jest) .

Teraz, gdy to wszystko zostało powiedziane, pięta achillesowa oceny skłonności jest założeniem, że nie zaobserwowano nieporozumień. To założenie stanowi, że nie dostosowałeś żadnych korekt towarzyszących do korekty, które mogłyby potencjalnie zakłócić. Intuicyjnie powodem tego jest to, że jeśli nie uwzględniłeś zamieszania przy tworzeniu wyniku skłonności, jak możesz się do tego dostosować? Istnieją również dodatkowe założenia, takie jak założenie o stabilnej jednostkowej wartości leczenia, które stwierdza, że ​​leczenie przypisane jednemu osobnikowi nie wpływa na potencjalny wynik innych osobników.

StatsStudent
źródło
7

W ścisłym tego słowa znaczeniu korekta wyniku skłonności nie ma więcej wspólnego z wnioskami przyczynowymi niż modelowanie regresji. Jedyną prawdziwą różnicą w stosunku do ocen skłonności jest to, że ułatwiają one dostosowanie do bardziej obserwowanych potencjalnych czynników zakłócających, niż ta wielkość próby może pozwolić na włączenie modeli regresji. Dostosowanie wyniku skłonności (najlepiej w większości przypadków za pomocą dopasowania współzmiennego, za pomocą splajnu w logit PS) można traktować jako technikę redukcji danych, w której zmniejszenie odbywa się wzdłuż ważnej osi - mylące. Nie radzi sobie jednak z heterogenicznością wyników (stronniczość podatności), więc musisz także dostosować się do kluczowych ważnych zmiennych towarzyszących, nawet gdy używasz skłonności (patrz także kwestie związane z brakiem prawdopodobieństwa).

Dopasowywanie wyników skłonności może wykluczyć wiele obserwacji, a zatem może być bardzo nieefektywne. Uważam każdą metodę, która wyklucza odpowiednie obserwacje, za problematyczną. Rzeczywistym problemem związanym z dopasowywaniem jest to, że wyklucza łatwe do dopasowania obserwacje z powodu pewnej postrzeganej potrzeby dopasowania 1: 1, a większość algorytmów dopasowania zależy od kolejności obserwacji.

Zauważ, że bardzo łatwo jest przeprowadzić standardowe dopasowanie regresji w celu pomylenia, aby sprawdzić i wykluczyć regiony, które się nie nakładają. Użytkownicy skłonności do oceny skłonności są do tego nauczani, a jedynym powodem, dla którego modeli regresji nie są, jest to, że nie są nauczeni.

Analiza wyniku skłonności ukrywa wszelkie interakcje z ekspozycją, a dopasowanie wyniku skłonności ukrywa dodatkowo możliwy związek między PS a efektem leczenia.

Analiza wrażliwości (na niezmierzone czynniki zakłócające) została opracowana dla PS, ale jest jeszcze łatwiejsza w przypadku standardowego modelowania regresji.

Jeśli używasz elastycznych metod regresji do oszacowania PS (np. Nie zakładaj, że żadne ciągłe zmienne działają liniowo), nie musisz nawet sprawdzać równowagi - musi istnieć równowaga lub model regresji PS nie został poprawnie określony na początku . Musisz tylko sprawdzić, czy nie nakładają się. Zakłada się, że nie ma istotnych interakcji, które zostałyby pominięte w modelu skłonności. Dopasowywanie przyjmuje to samo założenie.

Frank Harrell
źródło
3

Polecam sprawdzenie w większości nieszkodliwych ekonometrii - mają dobre wytłumaczenie na poziomie intuicyjnym.

Problem, który próbujesz rozwiązać, to stronniczość wyboru. Jeśli zmienna jest skorelowana z potencjalnymi wynikami i prawdopodobieństwem otrzymania leczenia, to jeśli okaże się, że oczekiwany wynik leczenia jest lepszy niż oczekiwany wynik nieleczonego, może to być fałszywym odkryciem, ponieważ leczone zwykle mają wyższe a zatem mają wyższe . Problem powstaje, ponieważ powoduje, że koreluje z leczeniem.xiy0i,y1ixy0i,y1ixy0i,y1i

Ten problem można rozwiązać, kontrolując . Jeśli uważamy, że związek między potencjalnymi wynikami a zmiennymi jest liniowy, po prostu robimy to, włączając do regresji ze zmienną fikcyjną do leczenia, a zmienna fikcyjna wchodzi w interakcję z . Oczywiście regresja liniowa jest elastyczna, ponieważ możemy również uwzględnić funkcje . Ale co, jeśli nie chcemy narzucać formy funkcjonalnej? Następnie musimy zastosować podejście nieparametryczne: dopasowanie.xxxxx

Przy dopasowywaniu porównujemy obserwacje traktowane i nietraktowane z podobnym . Odchodzimy od tego z oszacowaniem efektu leczenia dla wszystkich wartości (lub małych zakresów wartości lub „segmentów”), dla których dokonaliśmy zarówno obserwacji, jak i nieleczonych obserwacji. Jeśli nie mamy wielu takich wartości lub segmentów, w szczególności jeśli jest wektorem wysokowymiarowym, więc trudno jest znaleźć obserwacje blisko siebie, pomocne jest rzutowanie tej przestrzeni na jeden wymiar.xxxx

Właśnie to robi dopasowanie skłonności. Jeśli są skorelowane z leczeniem podanym , wówczas okazuje się, że nie są one również skorelowane z leczeniem podanym gdzie jest prawdopodobieństwem leczenia podanym , tj. Wynikiem skłonności z .y0i,y1ixip(xi)p(x)xx

Oto twoja intuicja: jeśli znajdziemy podpróbkę obserwacji o bardzo podobnym wyniku skłonności , to dla tej podpróbki grupy poddane działaniu i nieleczone nie są skorelowane z parametrem . Każda obserwacja jest jednakowo traktowana lub nieleczona; oznacza to, że każda obserwacja poddana leczeniu jest równie prawdopodobna z dowolnej wartości w próbie częściowej. Ponieważ jest tym, co determinuje potencjalne wyniki w naszym modelu, oznacza to, że dla tej podpróbki potencjalne wynikip(x)xxxy0i,y1isą niezwiązane z leczeniem. Ten warunek zapewnia, że ​​średnia różnica wyniku w podgrupie między badaną i nieleczoną jest spójnym oszacowaniem średniego efektu leczenia na tę próbkę, tj.

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

jest spójnym oszacowaniem lokalnego średniego efektu leczenia.

Dalsza lektura:

Czy naprawdę powinniśmy w praktyce stosować dopasowywanie wyników skłonności?

Powiązane pytanie porównujące dopasowanie i regresję

Nandern
źródło
1

„Działa” z tego samego powodu, dla którego regresja „działa” - kontrolujesz wszystkie mylące czynniki.

Taką kontrolę analityczną można osiągnąć za pomocą w pełni określonego modelu regresji z być może wieloma mylącymi zmiennymi lub modelu regresji z tylko jedną zmienną - wynikiem skłonności (który może, ale nie musi być równie skomplikowanym modelem składającym się z tych samych czynników zakłócających). Możesz trzymać się tej regresji względem wyniku skłonności lub możesz porównać odpowiedź w podobnych grupach, gdzie podobieństwo jest określone przez wynik skłonności. W duchu robisz to samo, ale niektórzy ludzie uważają, że ta druga metoda lepiej uwypukla bieżące zadanie przyczynowe.

Zaktualizuj po otrzymaniu opinii

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
i przeczytaj o jednej wersji dopasowywania najbliższego sąsiada, zwanej „dopasowaniem suwmiarką” (s. 108), w której oceny skłonności do leczenia i najbliższego przypadku kontrolnego muszą znajdować się w pewnej maksymalnej odległości, co powoduje, że niektóre przypadki leczenia bez dopasowania. W tym przypadku metoda nadal działałaby, dostosowując wynik skłonności za pomocą nieparametrycznego analogu do regresji, ale wyjaśnia również, czego nie można poznać na podstawie samych danych (bez modelu, z którego można ekstrapolować) i pozwalając na ponowne zdefiniowanie ilość przyczynowa, biorąc pod uwagę dostępne dane.
Ben Ogorek
źródło
1
Ta odpowiedź ma być nielubiana, ponieważ obniża metody oceny skłonności, porównując je z regresją, brudnym słowem w kręgach przyczynowych. Ale wiodąca odpowiedź przyznaje, że „pięta achillesowa oceny skłonności jest założeniem braku niezauważalnych pomyłek”. To dość duża pięta achillesowa. Powiedzmy, że założenie jest spełnione i mam zestaw danych ze wszystkimi zamieszaniem we wszechświecie. Pomóż mi zrozumieć, dlaczego regresja nie zadziała, aby odkryć przyczynową prawdę, ale dopasowywanie wyników skłonności.
Ben Ogorek
1
Powodem, dla którego regresja jest często problematyczna, jest to, że wyniki regresji są ekstrapolowane. Za pomocą ocen skłonności zapewnia się, podczas sprawdzania równowagi współzmiennej, że istnieje wystarczające nakładanie się pomieszania między grupami leczenia. Nie jest to regułą w przypadku regresji i może prowadzić do niedokładnych szacunków, ponieważ nie ma standardowych kontroli diagnostycznych, które wskazywałyby na ekstrapolację modelu regresji. Dlatego zazwyczaj przeprowadzam kontrole równoważenia wyników skłonności, nawet jeśli tylko korzystam z modelu regresji i nie planuję używać samych wyników skłonności.
StatsStudent