Czy statystycy z sektora prywatnego próbują ustalić przyczynowość?

12

Ekonometrycy akademiccy są często zainteresowani określeniem związku przyczynowego. Wygląda na to, że wszystkie prace w sektorze statystyki / analizy danych w sektorze prywatnym, o których słyszę, szukają tylko modeli predykcyjnych.

Czy są jakieś miejsca pracy w sektorze prywatnym (lub stanowiska rządowe), które badają związek przyczynowy?

Świetnie 38
źródło
5
Kiedykolwiek chcemy dokonać interwencji, zakładasz się, że nam zależy. Pomyśl o wszystkich testach A / B przeprowadzanych przez Google, aby dokonać prostej zmiany projektu.
Matthew Drury
8
Oczywiście. Prawie każda sprawa prawna ostatecznie zależy od kwestii związku przyczynowego. Prawie każdy porządny system kontroli jakości dotyczy związku przyczynowego. Inżynierom i naukowcom bardzo zależy na tym.
whuber
6
Kolejne klasyczne pytanie sektora prywatnego brzmi: „Czy moje reklamy powodują większą sprzedaż?”
Matthew Gunn,
2
@MatthewGunn: +1. Ogólnie: „Czy ta (kosztowna) zmiana coś zmieni?” Kluczowe jest założenie, że firma musi utrzymać się na powierzchni (i być może dobrze prosperować), mając do pewnego stopnia wiedzę na temat przyczynowej dynamiki rynku.
usεr11852
4
Początkowo powstrzymałem się od konwersji tego wątku na CW, wierząc, że możliwe jest zaoferowanie wiarygodnej odpowiedzi opartej na danych / faktach. Ponieważ nie okazuje się to w ten sposób, z różnych powodów, które wielu może uznać za interesujące i przydatne, przekonwertowałem go na CW. Dziękujemy wszystkim za Twój wkład!
whuber

Odpowiedzi:

15

Jestem ekonomistą w dziedzinie technologii, który działa na podstawie wnioskowania przyczynowego na podstawie danych obserwacyjnych lub błędnych danych eksperymentalnych. Większość dużych firm technologicznych będzie zatrudniać ludzi takich jak ja, którzy zajmą się badaniami stosowanymi w zakresie cen, marketingu i projektowania produktów. W niektórych firmach działają również zespoły ds. Polityki publicznej.

Wiele osób pracuje nad eksperymentami internetowymi. To jest znacznie większa grupa.

Wreszcie, istnieją również szczególne rodzaje konsultacji ekonomicznych, szczególnie antymonopolowych, gdzie to główny nacisk.

Dimitriy V. Masterov
źródło
7

[Pierwsze pięć emocjonalnych odpowiedzi ocenzurowane.]

To jest jedno z najdziwniejszych pytań na stronie. I pokazuje, jak bardzo istnieje rozdźwięk między tym, co mówią twoi profesorowie, a prawdziwym życiem - to znaczy życiem poza wieżą z kości słoniowej. Dobrze, że z tego zerkacie ... ale wy (to znaczy doktoranci ekonomii) zdecydowanie musicie to robić częściej.

Tak, są miejsca pracy poza środowiskiem akademickim, w których ludzie (niespodzianka, niespodzianka) używają metod wnioskowania przyczynowego. I (niespodzianka, niespodzianka) publikuj artykuły. Moje odpowiedzi są specyficzne dla USA, ale jestem pewien, że możesz znaleźć podobne organizacje w innych krajach.

  • Przykład 1 (tylko dlatego, że znam go wewnętrznie w pracy). Pracuję w filii dużej organizacji badawczej kontraktowej, Abt Associates . Zatrudnia około 2300 osób w 50 krajach, a większość z nich pracuje nad prowadzeniem lub wspieraniem badań ewaluacyjnych i wdrażaniem interwencji. Jacob Klerman, jedna z 6 najlepszych osób technicznych (zwanych Senior Fellows ), jest redaktorem oceny, nadzorując zespół redaktorów, z których około 5/6 ma powiązania akademickie. To dla ciebie przykład z sektora prywatnego. (Sprawdź reklamy pozycji firmy, aby zobaczyć, jakich umiejętności może szukać taka firma - nie jestem do końca pewien, że wszyscy reklamują się w JOE, ponieważ jest to kosztowne; z łatwością mogę wymienić kolejny tuzin w USA, który byłby szczęśliwy zatrudnić rzemieślnika ekonometrycznego.)
  • Przykład 2 (Mam dość dobrą znajomość tego, ponieważ znam ludzi, którzy rozpoczęli ten projekt z innych miejsc): What Works Clearinghousew amerykańskim Federalnym Departamencie Edukacji znajduje się strona internetowa poświęcona metaanalizie opublikowanej analizy programów edukacyjnych. WWC działa za pośrednictwem sieci recenzentów, którzy otrzymują szczegółowe instrukcje dotyczące tego, co uważa się za badanie, które ma wystarczającą dyscyplinę, aby poprzeć roszczenia przyczynowe, a co nie. Okazuje się, że większość tych opublikowanych badań to bzdury. Jak w bzdury. Brak grupy kontrolnej. Brak kontroli salda na współzmiennych demograficznych / równoważności odniesienia. Tylko około 3-5% badań (opublikowanych w literaturze naukowej, na litość boską) „spełnia standardy bez zastrzeżeń” - co oznacza, że ​​miały one pozory losowości, kontrolowanego ścierania i zanieczyszczenia krzyżowego ramion eksperymentu, i przeprowadził analizę w mniej lub bardziej akceptowalny sposób. (Twierdzenie Bayesa, kiedy ktoś mówi: „Ale widziałem, że guma do żucia zwiększa osiągnięcia matematyczne”, możesz odpowiedzieć „BS”, a masz rację przez ponad 90% czasu.) W każdym razie jest to federalny projekt departamentu, więc jest to przykład dla ciebie, gdy agencja rządowa dokonuje przeglądu właściwego wykorzystania narzędzi wnioskowania przyczynowego. (Wrzuć swoje imię jako recenzent studiów, będzie to dla ciebie wspaniałe doświadczenie edukacyjne. Gdybym nauczał ewaluacji programu, uczyniłbym to wymaganiem dla moich uczniów.) (Dla biostatystów pracujących z FDA, gdzie muszę przesłać kod analizy przed zebraniem jakichkolwiek danych, standardy WWC są nadal bardzo luźne). d ma rację w 90% przypadków.) W każdym razie jest to projekt departamentu federalnego, więc jest to przykład dla ciebie, gdy agencja rządowa sprawdza właściwe użycie narzędzi wnioskowania przyczynowego. (Wrzuć swoje imię jako recenzent studiów, będzie to dla ciebie wspaniałe doświadczenie edukacyjne. Gdybym nauczał ewaluacji programu, uczyniłbym to wymaganiem dla moich uczniów.) (Dla biostatystów pracujących z FDA, gdzie muszę przesłać kod analizy przed zebraniem jakichkolwiek danych, standardy WWC są nadal bardzo luźne). d ma rację w 90% przypadków.) W każdym razie jest to projekt departamentu federalnego, więc jest to przykład dla ciebie, gdy agencja rządowa sprawdza właściwe użycie narzędzi wnioskowania przyczynowego. (Wrzuć swoje imię jako recenzent studiów, będzie to dla ciebie wspaniałe doświadczenie edukacyjne. Gdybym nauczał ewaluacji programu, uczyniłbym to wymaganiem dla moich uczniów.) (Dla biostatystów pracujących z FDA, gdzie muszę przesłać kod analizy przed zebraniem jakichkolwiek danych, standardy WWC są nadal bardzo luźne).
StasK
źródło
Nie sądzę, żeby profesorowie ekonomii mówili, że nie stosujesz metod przyczynowych w praktyce (nikt nie zaczyna rozmowy z „oto kilka metod statystycznych, na których nikomu nie będzie zależeć”), ale raczej uczeń obawia się, że wnioskowanie przyczynowe jest tylko kością słoniową temat wieży (taki jak szacowanie gęstości wklęsłych kłód: zapewniam cię, że nikt w branży tego nie robi i nie bez powodu). Nie jest również jasne, jak przykład 2 pokazuje ludzi w przemyśle stosujących metody przyczynowe?
Cliff AB
@CliffAB OP poprosił o przykłady branżowe i rządowe, więc nr 2 pasuje do ustawy. Uważam również, że punkt widzenia StasK dotyczący niewielkiej wiedzy na temat życia poza wieżą z kości słoniowej wśród doktorantów ekonomii oraz, w mniejszym stopniu, ich profesorów, jest dość dokładny, chociaż istnieje wiele niejednorodności w różnych dziedzinach i działach, a nawet w czasie.
Dimitriy V. Masterov
@ DimitriyV.Masterov: # 2 wydaje się przykładem niestosowania odpowiednich narzędzi przyczynowych. I przeczytałem (być może źle odczytaną) odpowiedź Staska, sugerując, że profesorowie mówią „nikt poza naukowcami nie stosuje metod przyczynowych”. Jeśli powiedział to profesor specjalizujący się w metodach przyczynowych, przyznaje się do porażki; jeśli tworzysz stosowane metody statystyczne, których nikt poza światem akademickim nie stosuje, nie jest to dobre. Teoria statystyczna to oczywiście inna historia.
Cliff AB
Moje czytanie (znowu, być może błędne) pytania PO jest takie, że profesorowie mówią im, że „statystyki przyczynowe są ważne!”, A ich odpowiedź brzmi „czy to naprawdę ważne? Czy ludzie w branży rzeczywiście używają tych metod?”. Ale znowu, może źle czytam.
Cliff AB
1
@CLIFF WWCH dokonuje przeglądu badań akademickich, oddzielając pszenicę od plew aż do wnioskowania przyczynowego, tak więc jest to naprawdę dobry przykład obszaru, w którym standardy są wyższe w rządzie niż w niektórych częściach środowiska akademickiego.
Dimitriy V. Masterov
6

W statystyce farmaceutycznej i szeregu powiązanych dziedzin związek przyczynowy między interwencją a wynikami zdrowotnymi jest kluczowym zagadnieniem interesującym przy podejmowaniu decyzji, czy należy zastosować interwencję. Istnieje szeroki zakres subpól, takich jak badania randomizowane (kliniczne lub przedkliniczne), badania nierandomizowane lub badania jednoramienne, ćwiczenia laboratoryjne, metaanalizy, nadzór nad bezpieczeństwem leków oparty na spontanicznym zgłaszaniu zdarzeń niepożądanych, epidemiologia (w tym pomysły takie jak randomizacja Mandeliana) i badania skuteczności (np. wykorzystanie danych obserwacyjnych, takich jak bazy danych roszczeń ubezpieczeniowych). Oczywiście w zaprojektowanych randomizowanych eksperymentach (takich jak randomizowane badania kliniczne) przypisywanie związku przyczynowego jest nieco łatwiejsze niż w niektórych innych zastosowaniach.

Björn
źródło
Przypuszczam, że ustawienie rozwoju medycyny byłoby jednym z niewielu miejsc, w których ludzie dbają o przyczynę poprawy zdrowia ludzi, a nie o to, czy poprawi się, ponieważ ostatecznie trzeba „być bezpiecznym” w całej populacji. - Tak, zdecydowanie fajna odpowiedź, ale jak wspomniałeś, dość szczególny przypadek.
Dennis Jaheruddin
4

Jestem naukowcem w A Place for Mom, największej w kraju usłudze polecania osób starszych. Opracowaliśmy ankietę mającą na celu zrozumienie, w jaki sposób przejście do społeczności osób objętych pomocą ma wpływ na jakość życia. Wnioskowanie przyczynowe jest kluczowe dla tych badań, a metody analizy przyczynowej (np. Dopasowanie, modelowanie procesów selekcji, szacowanie średnich efektów leczenia) są niezbędne.

Brash Equilibrium
źródło
-3

W większości sytuacji w sektorze prywatnym nie będzie Cię obchodzić związek przyczynowy

W praktyce, pomimo typowego użycia języka, ludzie są znacznie bardziej zainteresowani dobrze zrozumiałym wpływem niż (dobrze zrozumiałym) przyczynowością.

Z akademickiego punktu widzenia bardzo interesująca jest wiedza:

Jeśli zrobię A, z tego powodu wynikiem będzie B.

Ale z praktycznego punktu widzenia, w prawie wszystkich sytuacjach ludzie naprawdę chcą wiedzieć:

Jeśli zrobię A, wynikiem będzie B.

Pewnie możesz być zainteresowany wpływem A, ale to, czy jest to rzeczywiście przyczyna, czy też istnieje ukryta przyczyna, która akurat tworzy tę korelację, zwykle nie jest tak interesująca.

Uwaga na temat ograniczeń

Możesz pomyśleć: ok, ale jeśli nie wiemy, że A powoduje B, to bardzo ryzykowne jest pracować nad tym założeniem.

Jest to w pewnym sensie prawdą, ale w praktyce znowu będziesz się martwić: czy to zadziała, czy są wyjątki?

Aby to zilustrować, możesz zauważyć, że ta sytuacja:

Jeśli zrobię A, w sytuacji X, z powodu A wynikiem będzie B, a z powodu X wynik będzie odchylać się o deltę

Nie jest dużo bardziej pomocny niż ta sytuacja (zakładając, że można równo oszacować wpływ):

Jeśli zrobię A, w sytuacji X wynikiem będzie B, a wynik będzie odchylał się o wartość delta

Prosty przykład: korelacja z przyczyną

  • Odp .: Uzupełnij olej silnikowy
  • B: Zmniejszone zadziałanie hamulca
  • C: Kontrola samochodu

Logika: C zawsze powoduje A i B.

Wynikająca zależność: Jeśli A rośnie, B rośnie, ale nie ma związku przyczynowego między A i B.

Moja uwaga: możesz modelować wpływ A na B. A nie powoduje B, ale model nadal będzie poprawny, a jeśli masz informacje o A, będziesz mieć informacje o B.

Osoba zainteresowana awarią hamulca z informacją o A będzie dbała tylko o znajomość relacji A do B i dba tylko o to, czy relacja jest poprawna, niezależnie od tego, czy relacja ta jest przyczynowa, czy nie.

rev Dennis Jaheruddin
źródło
1
Nie sądzę, że jestem jedynym, który jest zdezorientowany twoim rozróżnieniem pomiędzy „przyczyną” i „wpływem”. Wydaje się, że twoje przykłady nieco to wyjaśniają: odznaczenie szczegółów łańcucha przyczynowego może nie być szczególnie ważne. Kupowanie większej liczby reklam kosztu kliknięcia spowoduje wzrost sprzedaży - nieważne jak - i to jest ważne dla Twojego klienta.
Scortchi - Przywróć Monikę
@Scortchi Co rozumiem przez przyczynę: „Jeśli A, to z powodu tego B”. Co rozumiem przez wpływ (być może nie jest to najbardziej typowa definicja, ale nie dotyczy języka): „Jeśli A, to B”. - Przykład istotnej różnicy w podręczniku: C powoduje A i B. Dlatego A nie powoduje B, ale powiedziałbym, że sensowne byłoby modelowanie wpływu A na B. - Po ponownym przeczytaniu własnego komentarza, być może „wpływ „można zastąpić„ faktycznym związkiem z opóźnieniem ”.
Dennis Jaheruddin
5
Nie sądzę, że zgadzam się z przykładem reklamy - jeśli muszę zdecydować, czy kupić więcej reklam online, zależy mi na tym, czy spowoduje to większą sprzedaż niż nie kupowanie tych reklam (czy to poprzez większą liczbę kliknięć, czy przez inne oznacza = przyczynowość), co może być czymś innym niż to, czy firmy, które zwiększyły swoje reklamy internetowe w ostatnim roku, odnotowały większy wzrost sprzedaży niż firmy, które tego nie zrobiły (korelacja). Przyczynowość nie polega na dokładnym sposobie, w jaki pojawia się wynik (oczywiście dobrze byłoby wiedzieć), ale raczej na tym, czy coś się dzieje z powodu robienia lub nie robienia A.
Björn
6
ABAB
Nie wydaje mi się, że zgadzam się z tym komentarzem, chociaż z mojego doświadczenia wynika, że ​​nie jest to w pewnym stopniu prawdziwa przyczynowość, chociaż w wielu problemach powinna. W praktyce postrzegam to jako prawie równoważne rozróżnieniu między modelami predykcyjnymi a modelami objaśniającymi.
Thomas Speidel,