Czy naprawdę musimy uwzględnić „wszystkie istotne predyktory?”

15

Podstawowym założeniem stosowania modeli regresji do wnioskowania jest to, że „wszystkie istotne predyktory” zostały uwzględnione w równaniu predykcyjnym. Uzasadnieniem jest to, że nieuwzględnienie ważnego czynnika w świecie rzeczywistym prowadzi do tendencyjnych współczynników, a tym samym do niedokładnych wniosków (tj. Pominiętej zmienności stronniczości).

Ale w praktyce badawczej nigdy nie widziałem nikogo, w tym czegokolwiek przypominającego „wszystkie istotne predyktory”. Wiele zjawisk ma mnóstwo ważnych przyczyn i uwzględnienie ich wszystkich byłoby bardzo trudne, jeśli nie niemożliwe. Przykładem jest modelowanie depresji jako wyniku: nikt nie zbudował niczego podobnego do modelu, który zawiera „wszystkie istotne zmienne”: np. Historię rodziców, cechy osobowości, wsparcie społeczne, dochód, ich interakcje itp., itp...

Co więcej, dopasowanie tak złożonego modelu prowadziłoby do bardzo niestabilnych szacunków, chyba że byłyby bardzo duże próby.

Moje pytanie jest bardzo proste: czy założenie / rada „uwzględnienia wszystkich istotnych predyktorów” jest po prostu czymś, co „mówimy”, ale nigdy tak naprawdę nie oznacza? Jeśli nie, to dlaczego podajemy to jako rzeczywistą poradę modelowania?

Czy to oznacza, że ​​większość współczynników prawdopodobnie wprowadza w błąd? (np. badanie czynników osobowości i depresji, które wykorzystuje tylko kilka predyktorów). Innymi słowy, jak duży jest to problem dla wniosków naszych nauk?

ATJ
źródło
6
Wersja tego argumentu szalała w psychologii, ekonomii i naukach społecznych w XIX wieku. Naukowcy argumentowali, że metody statystyczne nie mają zastosowania do ludzi i systemów społecznych, ponieważ ludzie są zbyt zróżnicowani i złożeni. Pod koniec tego stulecia użyteczność wygrała z filozofią: nawet jeśli nie uwzględnimy wszystkich predyktorów, nadal możemy wiele się nauczyć. Istnieje mądrość we wpisie „odpowiedni” w zdaniu tytułowym.
whuber

Odpowiedzi:

18

Masz rację - rzadko mówimy „wszystkie istotne predyktory”. W praktyce możemy być zadowoleni z tym czynników predykcyjnych, które wyjaśniają główne źródła zmienności w . W szczególnym przypadku wnioskowania na temat czynnika ryzyka lub leczenia w badaniu obserwacyjnym rzadko jest to wystarczająco dobre. W tym celu korekta ze względu na zamieszanie musi być bardzo agresywna, w tym zmienne, które mogą być związane z wynikiem i mogą być związane z wyborem leczenia lub czynnikiem ryzyka, który próbujesz opublikować.Y

Interesujące jest to, że przy normalnym modelu liniowym pominięte zmienne towarzyszące, zwłaszcza jeśli są ortogonalne do zmiennych towarzyszących, mogą być uważane za po prostu powiększenie terminu błędu. W modelach nieliniowych (logistycznych, Coxa, wielu innych) pominięcie zmiennych może wpływać na skutki wszystkich zmiennych zawartych w modelu (na przykład z powodu nieupadalności ilorazu szans).

Frank Harrell
źródło
Dziękuję za pomocne informacje. Odkładając na bok ocenę efektów leczenia, chciałbym zapytać o pragmatyczne implikacje tego problemu. Jeśli przejrzałeś artykuł i wyraźnie pominięto ważne predyktory, czy mogłoby to być podstawą do odrzucenia? Pytam o to, ponieważ a.) Nigdy nie słyszałem o tym wydarzeniu i b.) Naukowcy społeczni często zawierają TYLKO predyktory, o których chcieliby wiedzieć więcej (tj. Temat badania) i zaniedbują „już znane” czynniki ( w oparciu o potrzebę bardziej wydajnego pomiaru).
ATJ
Na przykład nierzadko można zobaczyć model zmiennej utajonej z tylko predyktorem POJEDYNCZYM dla zmiennej endogennej. Czy świadczy to o przepaści między dziedziną statystyki a jej wdrażaniem w rzeczywistych obszarach tematycznych?
ATJ
6
Prawdopodobnie tak. Do wcześniejszego pytania podstawą do odrzucenia byłoby pominięcie ważnych zmiennych, których włączenie dałoby inną interpretację uwzględnionych zmiennych lub które radykalnie zmieniłoby model. Kiedyś przejrzałem artykuł na temat ryzyka raka płuc, który był dostępny tylko wtedy, gdy osoba kiedykolwiek paliła, a autorzy nie próbowali ocenić dawki palenia (np. Paczkolat). Poleciłem całkowite odrzucenie.
Frank Harrell
9

Tak, musisz uwzględnić wszystkie „odpowiednie zmienne”, ale musisz być inteligentny. Musisz pomyśleć o sposobach konstruowania eksperymentów, które izolowałyby wpływ twojego fenomenu od niepowiązanych rzeczy, co jest dużą ilością badań w świecie rzeczywistym (w przeciwieństwie do badań w klasie). Zanim przejdziesz do statystyk, musisz ciężko podnieść się w swojej domenie, a nie w statystykach.

Zachęcam was, abyście nie zachowywali się cynicznie przy uwzględnianiu wszystkich istotnych zmiennych, ponieważ jest to nie tylko szlachetny cel, ale także dlatego, że często jest to możliwe. Nie mówimy tego tylko po to, żeby to powiedzieć. Naprawdę to rozumiemy. W rzeczywistości projektowanie eksperymentów i badań, które mogą uwzględniać wszystkie istotne zmienne, sprawia, że ​​nauka jest naprawdę interesująca i różni się od „eksperymentów” mechanicznych płyt kotłowych.

Aby uzasadnić moje stwierdzenie, dam ci przykład, w jaki sposób Galileo studiował przyspieszenie. Oto jego opis faktycznego eksperymentu (z tej strony ):

Wzięto kawałek drewnianej listwy lub kantówki o długości około 12 łokci, szerokości pół łokcia i grubości trzech palców; na jego krawędzi rozcięto kanał nieco więcej niż jeden palec; po uczynieniu tego rowka bardzo prostym, gładkim i wypolerowanym, a po wyłożeniu go pergaminem, również tak gładkim i wypolerowanym, jak to możliwe, przetoczyliśmy wzdłuż niego twardą, gładką i bardzo okrągłą brązową kulkę. Po ustawieniu tej deski w pozycji pochyłej, podnosząc jeden koniec o jeden lub dwa łokcie nad drugim, przetoczyliśmy piłkę, jak właśnie mówiłem, wzdłuż kanału, zwracając uwagę, w sposób obecnie opisany, na wymagany czas zrobić zejście. Powtórzyliśmy ten eksperyment więcej niż jeden raz, aby zmierzyć czas z dokładnością taką, aby odchylenie między dwiema obserwacjami nigdy nie przekraczało jednej dziesiątej pulsu. Po wykonaniu tej operacji i upewnieniu się o jej niezawodności, przetoczyliśmy piłkę tylko o jedną czwartą długości kanału; i mierząc czas jego zejścia, znaleźliśmy dokładnie połowę tego pierwszego. Następnie wypróbowaliśmy inne odległości, porównując czas na całej długości z czasem dla połowy, lub z czasem dla dwóch trzecich lub trzech czwartych, a nawet dla dowolnej części; w takich eksperymentach, powtarzanych sto razy, zawsze stwierdziliśmy, że przemierzane przestrzenie były do ​​siebie jak kwadraty czasów, i było to prawdą dla wszystkich nachyleń płaszczyzny, tj. kanału, wzdłuż którego przetoczyliśmy piłka. Zauważyliśmy również, że czasy opadania, dla różnych nachyleń płaszczyzny, miały dokładnie taki stosunek, który, jak zobaczymy później,

Do pomiaru czasu wykorzystaliśmy duże naczynie z wodą umieszczone na podwyższeniu; na dnie tego naczynia przylutowano rurkę o małej średnicy, dającą cienki strumień wody, który gromadziliśmy w małej szklance podczas każdego zejścia, czy to na całej długości kanału, czy na części jego długości; tak zebrana woda była ważona, po każdym zejściu, z bardzo dokładną wagą; różnice i stosunki tych wag dały nam różnice i stosunki czasów, i to z taką dokładnością, że chociaż operacja była powtarzana wiele, wiele razy, nie było znaczącej rozbieżności w wynikach.

d=gt2,
dgtd0=1t0ditid0/dit02/ti2
d0di=t02ti2

Zwróć uwagę na to, jak mierzył czas. Jest tak prymitywny, że przypomina mi, jak w dzisiejszych czasach nienaturalne nauki mierzą swoje zmienne, myślą o „zadowoleniu klienta” lub „użyteczności”. Wspomina, że ​​błąd pomiaru mieścił się w dziesiątej części jednostki czasu, przy okazji.

Czy uwzględnił wszystkie istotne zmienne? Tak, zrobił. Teraz musicie zrozumieć, że wszystkie ciała przyciągają się do siebie grawitacją. Tak więc teoretycznie, aby obliczyć dokładną siłę wywieraną na piłkę, należy dodać do równania każde ciało we wszechświecie. Co ważniejsze, nie uwzględnił oporu powierzchniowego, oporu powietrza, momentu pędu itp. Czy to wszystko wpłynęło na jego pomiary? Tak. Nie miały one jednak związku z tym, co studiował, ponieważ był w stanie zmniejszyć lub wyeliminować ich wpływ, izolując wpływ badanej nieruchomości.

t2

Aksakal
źródło
Co jest tak prymitywnego w jego metodzie pomiaru czasu? Zestaw będzie miał określoną szybkość, z jaką woda opuści duże naczynie i wejdzie do kubka; zakładając, że naczynie zawiera dużą ilość wody, szybkość ta będzie się zmieniać minimalnie. Co ważniejsze, pozostanie spójny we wszystkich eksperymentach. To naprawdę bardzo elegancka metoda, biorąc pod uwagę, że nie mieli wtedy stoperów i fantazyjnych automatycznych zegarów.
JAB
@JAB, rzecz jasna, jest to tylko prymitywne porównanie w celu zatrzymania oglądania lub nowoczesne sposoby pomiaru czasu. Masz całkowitą rację, że jest bardzo elegancki, biorąc pod uwagę najnowocześniejszy pomiar czasu w czasach Galileusza.
Chodziło
@JAB, jednym z moich ulubionych przykładów niedorzecznych metod pomiarowych w fizyce jest sposób, w jaki Czerenkow odkrył swoje promieniowanie . Siedział w ciemnym pokoju, dopóki jego oczy nie przyzwyczają się do ciemności, a następnie otwierał lub zamykał dziurę światłem pochodzącym z niej, dopóki światło nie zniknie. Rejestrowałby, ile dziur było otwartych, aby wykryć poziom promieniowania. Najwyraźniej ludzkie oko potrafi wykryć różnicę światła mierzoną w garstce fotonów! Papier ma 3 strony.
Aksakal
6

Aby założenia modelu regresji działały idealnie, należy uwzględnić wszystkie odpowiednie predyktory. Jednak żadne z założeń w analizie statystycznej nie jest w pełni zgodne, a duża część praktyki statystycznej opiera się na „Close Enough”.

Przy projektowaniu eksperymentów i właściwej randomizacji efekt terminów nieuwzględnionych w modelach można często zignorować (zakładając, że jest równa szansie losowości). Ale regresja jest zwykle stosowana, gdy pełna randomizacja nie jest możliwa do uwzględnienia wszystkich możliwych zmiennych nie uwzględnionych w modelu, więc twoje pytanie staje się ważne.

Prawie w każdym modelu regresji, który kiedykolwiek byłby dopasowany, prawdopodobnie brakuje niektórych potencjalnych predyktorów, ale „Nie wiem” bez dalszych wyjaśnień nie pozwoliłoby pracującym statystykom kontynuować pracę, więc staramy się jak najlepiej, a następnie próbujemy ustalić, jaka jest różnica między założeniami a rzeczywistością wpłynie na nasze wyniki. W niektórych przypadkach różnica w stosunku do założeń robi niewielką różnicę i nie martwimy się o nią, ale w innych przypadkach może być bardzo poważna.

Jedną z opcji, gdy wiesz, że mogą istnieć predyktory, których nie uwzględniono w modelu, które byłyby istotne, jest wykonanie analizy wrażliwości. Mierzy to, ile stronniczości byłoby możliwe w oparciu o potencjalne relacje z nie mierzonymi zmiennymi zmiennymi. Ten papier:

Lin, DY i Psaty, BM i Kronmal, RA. (1998): Ocena wrażliwości wyników regresji na niezmierzone czynniki zakłócające w badaniach obserwacyjnych. Biometrics, 54 (3), wrz, s. 948–963.

podaje niektóre narzędzia (i przykłady) analizy wrażliwości.

Greg Snow
źródło