Właśnie przebiegłem dwa miliony regresji - zintegrowane prawdopodobieństwo

9

Obecnie pracuję nad wdrożeniem metody stosowanej w popularnym artykule zatytułowanym „I Just Ran Two Million Regressions”. Podstawową ideą jest to, że istnieją pewne przypadki, w których nie jest oczywiste, jakie elementy sterujące powinny być uwzględnione w modelu. Jedną z rzeczy, które możesz zrobić w takim przypadku, jest losowe sterowanie, uruchamianie milionów różnych regresji, a następnie sprawdzanie, jak zareagowała zmienna zainteresowania. Jeśli ogólnie ma ten sam znak we wszystkich specyfikacjach, możemy uznać go za bardziej odporny niż zmienna, której znak zawsze się zmienia.

Większość papieru jest bardzo przejrzysta. Jednak dokument waży wszystkie te różne regresje w następujący sposób: Zintegrowane prawdopodobieństwo danej specyfikacji jest dzielone przez sumę wszystkich zintegrowanych prawdopodobieństw dla wszystkich specyfikacji.

Problem, który mam, polega na tym, że nie jestem pewien, w jaki sposób zintegrowane prawdopodobieństwo odnosi się do regresji OLS, które chciałbym uruchomić (w Stata). Tematy Google, takie jak „prawdopodobieństwo zintegrowanej staty”, są ślepym zaułkiem, ponieważ ciągle napotykam na takie rzeczy, jak regresja logistyczna efektów mieszanych. Przyznaję, że te modele są zbyt skomplikowane, żebym mógł je pojąć.

Moja obecna praca polega na tym, że w literaturze są różne schematy ważenia, które rozumiem (w pewnym sensie). Na przykład możliwe jest ważenie każdej regresji na podstawie wskaźnika współczynnika wiarygodności. Istnieje nawet pakiet R, który używa lri jako odważników. Oczywiście chciałbym również wdrożyć wersję oryginalną.

Jakakolwiek rada?

Link do papieru: http://down.cenet.org.cn/upfile/34/2009112141315178.pdf

NikolaiB
źródło
1
Wątek ten może dotyczyć niektórych twoich obaw ... stats.stackexchange.com/questions/215154/
Mike Hunter,
1
Kiedyś napisałem funkcję w MATLAB-ie replikującą wynik Sala-i-Martina (który, nawiasem mówiąc, nie jest tak naprawdę najnowocześniejszy w wyborze modeli), patrz dropbox.com/s/mqa7qvhn7w5pkag/ ... Zintegrowane prawdopodobieństwo (nie jestem pewien, do czego dokładnie się odnosisz) prawdopodobnie jest po prostu wykładniczym prawdopodobieństwem logarytmicznym.
Christoph Hanck
Dzięki! Mam na myśli równanie 4 na stronie 179. Stwierdzono w nim: „Wagi są proporcjonalne do prawdopodobieństw (zintegrowanych)”
NikolaiB

Odpowiedzi:

1

W przypadku OLS nadal można obliczyć funkcję wiarygodności (prawdopodobieństwo wykładniczego dziennika, jak wspomina Christoph Hanck w komentarzu). Jest to po prostu stary dobry . Stata przechowuje to po uruchomieniu regresji za pomocąLi=i(2πσ2).5exp(.5(yixiβ)2)e(ll)regress

Następnie konstruujesz wagi jako .wi=LijLj

Na koniec konstruujesz średnie ważone współczynników regresji, używając jako wag.wi

Superpronker
źródło