Dopasowanie oceny skłonności służy do wnioskowania przyczynowego w badaniach obserwacyjnych (patrz artykuł Rosenbaum / Rubin ). Jaka jest prosta intuicja, dlaczego to działa?
Innymi słowy, dlaczego jeśli upewnimy się, że prawdopodobieństwo uczestniczenia w leczeniu jest równe dla obu grup, znikną zakłócające efekty i możemy wykorzystać wynik, aby wyciągnąć wnioski przyczynowe dotyczące leczenia?
Odpowiedzi:
Spróbuję dać ci intuicyjne zrozumienie przy minimalnym nacisku na matematykę.
Główny problem z danymi obserwacyjnymi i wynikającymi z nich analizami jest mylący. Zamieszanie występuje, gdy zmienna wpływa nie tylko na przypisane leczenie, ale także na wyniki. Gdy przeprowadzany jest randomizowany eksperyment, osobnicy są losowo przydzielani do leczenia, tak aby średnio osoby przypisane do każdego leczenia były podobne w odniesieniu do zmiennych towarzyszących (wiek, rasa, płeć itp.). W wyniku tej randomizacji jest mało prawdopodobne (szczególnie w dużych próbach), że różnice w wynikach wynikają z dowolnych zmiennych towarzyszących, ale z powodu zastosowanego leczenia, ponieważ średnio zmienne towarzyszące w grupach leczenia są podobne.
Z drugiej strony, w przypadku danych obserwacyjnych nie ma losowego mechanizmu, który przypisuje badanych do leczenia. Weźmy na przykład badanie, aby sprawdzić wskaźniki przeżycia pacjentów po nowej operacji serca w porównaniu ze standardową procedurą chirurgiczną. Zazwyczaj nie można randomizować pacjentów do każdej procedury ze względów etycznych. W rezultacie pacjenci i lekarze samodzielnie wybierają jeden z zabiegów, często z wielu powodów związanych z ich współzmiennymi. Na przykład nowa procedura może być nieco bardziej ryzykowna, jeśli jesteś starszy, w wyniku czego lekarze mogą zalecać nowe leczenie częściej młodszym pacjentom. Jeśli tak się stanie i spojrzysz na wskaźniki przeżycia, nowe leczenie może wydawać się bardziej skuteczne, ale byłoby to mylące, ponieważ młodsi pacjenci zostali przydzieleni do tego leczenia, a młodsi pacjenci zwykle żyją dłużej, wszystko inne jest równe. Tutaj przydają się oceny skłonności.
Oceny skłonności pomagają w podstawowym problemie wnioskowania przyczynowego - że możesz mieć zamieszanie z powodu braku randomizacji pacjentów do leczenia i może to być przyczyną „efektów”, które widzisz, a nie samej interwencji lub leczenia. Jeśli byłbyś w stanie w jakiś sposób zmodyfikować swoją analizę, tak aby zmienne towarzyszące (np. Wiek, płeć, płeć, stan zdrowia) były „zrównoważone” między grupami leczenia, miałbyś mocne dowody, że różnica w wynikach wynika z interwencji / leczenia zamiast tych współzmiennych. Oceny skłonności określają prawdopodobieństwo przypisania każdego pacjenta do leczenia, które otrzymali, biorąc pod uwagę zestaw obserwowanych kowarian. Jeśli następnie dopasujesz te prawdopodobieństwa (wyniki skłonności),
Możesz zapytać, dlaczego nie pasują dokładnie do zmiennych towarzyszących (np. Upewnij się, że dopasujesz 40-letnich mężczyzn w dobrym zdrowiu w leczeniu 1 do 40-letnich mężczyzn w dobrym zdrowiu w leczeniu 2)? Działa to dobrze w przypadku dużych próbek i kilku zmiennych towarzyszących, ale staje się to prawie niemożliwe, gdy wielkość próbki jest niewielka, a liczba zmiennych towarzyszących jest nawet umiarkowanie wielkości (dlaczego przekleństwo wymiarów na Weryfikacji krzyżowej, dlaczego tak jest) .
Teraz, gdy to wszystko zostało powiedziane, pięta achillesowa oceny skłonności jest założeniem, że nie zaobserwowano nieporozumień. To założenie stanowi, że nie dostosowałeś żadnych korekt towarzyszących do korekty, które mogłyby potencjalnie zakłócić. Intuicyjnie powodem tego jest to, że jeśli nie uwzględniłeś zamieszania przy tworzeniu wyniku skłonności, jak możesz się do tego dostosować? Istnieją również dodatkowe założenia, takie jak założenie o stabilnej jednostkowej wartości leczenia, które stwierdza, że leczenie przypisane jednemu osobnikowi nie wpływa na potencjalny wynik innych osobników.
źródło
W ścisłym tego słowa znaczeniu korekta wyniku skłonności nie ma więcej wspólnego z wnioskami przyczynowymi niż modelowanie regresji. Jedyną prawdziwą różnicą w stosunku do ocen skłonności jest to, że ułatwiają one dostosowanie do bardziej obserwowanych potencjalnych czynników zakłócających, niż ta wielkość próby może pozwolić na włączenie modeli regresji. Dostosowanie wyniku skłonności (najlepiej w większości przypadków za pomocą dopasowania współzmiennego, za pomocą splajnu w logit PS) można traktować jako technikę redukcji danych, w której zmniejszenie odbywa się wzdłuż ważnej osi - mylące. Nie radzi sobie jednak z heterogenicznością wyników (stronniczość podatności), więc musisz także dostosować się do kluczowych ważnych zmiennych towarzyszących, nawet gdy używasz skłonności (patrz także kwestie związane z brakiem prawdopodobieństwa).
Dopasowywanie wyników skłonności może wykluczyć wiele obserwacji, a zatem może być bardzo nieefektywne. Uważam każdą metodę, która wyklucza odpowiednie obserwacje, za problematyczną. Rzeczywistym problemem związanym z dopasowywaniem jest to, że wyklucza łatwe do dopasowania obserwacje z powodu pewnej postrzeganej potrzeby dopasowania 1: 1, a większość algorytmów dopasowania zależy od kolejności obserwacji.
Zauważ, że bardzo łatwo jest przeprowadzić standardowe dopasowanie regresji w celu pomylenia, aby sprawdzić i wykluczyć regiony, które się nie nakładają. Użytkownicy skłonności do oceny skłonności są do tego nauczani, a jedynym powodem, dla którego modeli regresji nie są, jest to, że nie są nauczeni.
Analiza wyniku skłonności ukrywa wszelkie interakcje z ekspozycją, a dopasowanie wyniku skłonności ukrywa dodatkowo możliwy związek między PS a efektem leczenia.
Analiza wrażliwości (na niezmierzone czynniki zakłócające) została opracowana dla PS, ale jest jeszcze łatwiejsza w przypadku standardowego modelowania regresji.
Jeśli używasz elastycznych metod regresji do oszacowania PS (np. Nie zakładaj, że żadne ciągłe zmienne działają liniowo), nie musisz nawet sprawdzać równowagi - musi istnieć równowaga lub model regresji PS nie został poprawnie określony na początku . Musisz tylko sprawdzić, czy nie nakładają się. Zakłada się, że nie ma istotnych interakcji, które zostałyby pominięte w modelu skłonności. Dopasowywanie przyjmuje to samo założenie.
źródło
Polecam sprawdzenie w większości nieszkodliwych ekonometrii - mają dobre wytłumaczenie na poziomie intuicyjnym.
Problem, który próbujesz rozwiązać, to stronniczość wyboru. Jeśli zmienna jest skorelowana z potencjalnymi wynikami i prawdopodobieństwem otrzymania leczenia, to jeśli okaże się, że oczekiwany wynik leczenia jest lepszy niż oczekiwany wynik nieleczonego, może to być fałszywym odkryciem, ponieważ leczone zwykle mają wyższe a zatem mają wyższe . Problem powstaje, ponieważ powoduje, że koreluje z leczeniem.xja y0 i, y1 i x y0 i, y1 i x y0 i, y1 i
Ten problem można rozwiązać, kontrolując . Jeśli uważamy, że związek między potencjalnymi wynikami a zmiennymi jest liniowy, po prostu robimy to, włączając do regresji ze zmienną fikcyjną do leczenia, a zmienna fikcyjna wchodzi w interakcję z . Oczywiście regresja liniowa jest elastyczna, ponieważ możemy również uwzględnić funkcje . Ale co, jeśli nie chcemy narzucać formy funkcjonalnej? Następnie musimy zastosować podejście nieparametryczne: dopasowanie.x x x x x
Przy dopasowywaniu porównujemy obserwacje traktowane i nietraktowane z podobnym . Odchodzimy od tego z oszacowaniem efektu leczenia dla wszystkich wartości (lub małych zakresów wartości lub „segmentów”), dla których dokonaliśmy zarówno obserwacji, jak i nieleczonych obserwacji. Jeśli nie mamy wielu takich wartości lub segmentów, w szczególności jeśli jest wektorem wysokowymiarowym, więc trudno jest znaleźć obserwacje blisko siebie, pomocne jest rzutowanie tej przestrzeni na jeden wymiar.x x x x
Właśnie to robi dopasowanie skłonności. Jeśli są skorelowane z leczeniem podanym , wówczas okazuje się, że nie są one również skorelowane z leczeniem podanym gdzie jest prawdopodobieństwem leczenia podanym , tj. Wynikiem skłonności z .y0 i, y1 i xja p ( xja) p ( x ) x x
Oto twoja intuicja: jeśli znajdziemy podpróbkę obserwacji o bardzo podobnym wyniku skłonności , to dla tej podpróbki grupy poddane działaniu i nieleczone nie są skorelowane z parametrem . Każda obserwacja jest jednakowo traktowana lub nieleczona; oznacza to, że każda obserwacja poddana leczeniu jest równie prawdopodobna z dowolnej wartości w próbie częściowej. Ponieważ jest tym, co determinuje potencjalne wyniki w naszym modelu, oznacza to, że dla tej podpróbki potencjalne wynikip ( x ) x x x y0 i, y1 i są niezwiązane z leczeniem. Ten warunek zapewnia, że średnia różnica wyniku w podgrupie między badaną i nieleczoną jest spójnym oszacowaniem średniego efektu leczenia na tę próbkę, tj.
jest spójnym oszacowaniem lokalnego średniego efektu leczenia.
Dalsza lektura:
Czy naprawdę powinniśmy w praktyce stosować dopasowywanie wyników skłonności?
Powiązane pytanie porównujące dopasowanie i regresję
źródło
„Działa” z tego samego powodu, dla którego regresja „działa” - kontrolujesz wszystkie mylące czynniki.
Taką kontrolę analityczną można osiągnąć za pomocą w pełni określonego modelu regresji z być może wieloma mylącymi zmiennymi lub modelu regresji z tylko jedną zmienną - wynikiem skłonności (który może, ale nie musi być równie skomplikowanym modelem składającym się z tych samych czynników zakłócających). Możesz trzymać się tej regresji względem wyniku skłonności lub możesz porównać odpowiedź w podobnych grupach, gdzie podobieństwo jest określone przez wynik skłonności. W duchu robisz to samo, ale niektórzy ludzie uważają, że ta druga metoda lepiej uwypukla bieżące zadanie przyczynowe.
Zaktualizuj po otrzymaniu opinii
źródło