Przewidywanie

7

Mój szacowany model to

ln^(yt)=9.8730.472ln(xt2)0.01xt3

Poproszono mnie o znalezienie predykcyjnego CI z 95% pewnością dla średniej y0, kiedy x02=250, i x03=8. Mamy to założyćs2x0(XTX)1x0T=0.000243952, gdzie x0=(250,8).

Mam rozwiązanie z poprzedniego roku, które wygląda tak:

Znajduję CI formularza CI(E[ln(y0)|x0])=[ln^(yt)tα/2sE,ln^(yt)+tα/2sE], gdzie t jest α/2 górny kwantyl rozkładu t(nk) i sE=0.000243952. To mi daje[7.1563,7.2175].

Następnie autor to robi CI(E[y0|x0])=[e7.1563,e7.2175]=[1282.158,1363.077].

Nie zgadzam się z tym ostatnim krokiem (z powodu nierówności Jensena nie docenimy). W Wooldridge's Intro to Econometrics, na stronie 212, stwierdza, że ​​jeśli jesteśmy pewni, że warunki błędu są normalne, to spójny estymator to:

E^[y0|x0]=es2/2eln^(y0)

Tak więc myślałem o zrobieniu

CI(E[y0|x0])=[es2/21282.158,es2/21363.077]=[1282.314,1363.243]

Czy to jest poprawne?

Również rozwiązanie tego ćwiczenia stwierdza, że CI(E[y0|x0])=[624.020,663.519], co jest dalekie od żadnego z moich rozwiązań.

Każda pomoc będzie mile widziana.

PS: Przeczytałem również, że korekcji nie należy stosować do CI, a jedynie do oszacowania punktowego E^[y0|x0]

Stary człowiek na morzu.
źródło

Odpowiedzi:

3

Nie znajdziesz tej samej odpowiedzi z powodu tego, co podejrzewam o błąd typograficzny, który byłby zatem główną przyczyną twojego problemu: x03 byłoby ustawione na 80, nie 8. Inna możliwość, jeśli zatrzymaszx03=8, jest błędem w drugim szacowanym współczynniku, powiedzmy, β^2=0.1 zamiast 0.01.

W każdym razie jedna z tych modyfikacji rozwiązuje wszystko i daje taki sam wynik jak rozwiązanie tego ćwiczenia.

Biorąc pod uwagę tę zmianę, z tα/2=1.96476138969835, dostaje się

Metoda 1

CI(E[y0|x0])=[e6.43618291164626,e6.49755798189177]=[624.020307335178,663.519326788772] (podane rozwiązanie tego ćwiczenia)

lub

Metoda 2

(jak stwierdzono w Wooldridge's Intro to Econometrics, na stronie 212), jeśli jesteśmy pewni, że warunki błędu są normalne (a jedno ma ogromne szczęście)

CI(E[y0|x0])=[es2/2624.0203,es2/2663.5193]=[624.0960,663.6002]

jednak

metoda 2 jest bardzo mało prawdopodobne, aby być poprawne, ponieważ, jak wspomina w swoim pytaniu [...] The (niedoszacowanie) korekta nie powinna być stosowana do PW, ale tylko dla estymacji punktowej.

Dlaczego ? Powiedziałbym, że z powodu zależności między tymi dwoma terminami, znając oczekiwaniaes2/2 z jednej strony i y0^ z drugiej strony nie oznacza, że ​​jeden z nich zna es22+ln(y0)^.

utrzymać przy życiu
źródło
2

Prognozy punktowe i CI są różne.

Jeśli chodzi o przewidywanie punktów, lepiej jest, jeśli to możliwe, korygując odchylenie w jak największym stopniu. W przypadku CI od samego początku wymagane jest, aby prawdopodobieństwo było równe100(1α)%. Kiedy[a,b] to 95% CI dla ln(y0) na przykład, [ea,eb] jest z pewnością 95% CI dla y0 ponieważ P(alnXb)=P(eaXeb). Więc twój[e7.1563,e7.2175] jest z pewnością prawidłowym CI.

Ale centrum tego CI nie jest ani naiwnym predyktorem (exp [predyktor z lny0]) ani skorygowanego predyktora y0(współczynnik korygujący pomnożony przez naiwny predyktor) z powodu nierówności Jensena, ale tak naprawdę nie ma to znaczenia. W niektórych przypadkach (nie zawsze) zmiana CI może być możliwa[eap,ebq] dla niektórych p i q więc prawdopodobieństwo wynosi nadal 95%, a jego centrum jest predyktorem skorygowanym o błąd systematyczny, ale nie widzę w tym sensu.

Co zasugerowałeś, tj. [es2/2ea,es2/2eb]nie jest 95% CI. Aby zobaczyć dlaczego, niech będzie współczynnik korygującyh (nielosowe i doskonale znane, dla uproszczenia), więc predyktorem skorygowanym o błąd systematyczny jest heθ, gdzie θ jest bezstronnym predyktorem lny0 (β^0+β^2lnx2+β^3x3w twoim przykładzie). To „h”można oszacować według es2/2 na przykład, ale chociaż ta ostatnia jest losowa, hzakłada się, że to nielosowe, aby uprościć. Pozwolić[a,b] być 95% CI dla lny0tzn. P(alny0b)=0.95. Następnie,

P(heay0heb)=P(lnh+alny0lnh+b),
co nie jest równeP(alny0b)=0.95 chyba że dystrybucja lny0 jest jednolity, co zwykle nie jest.

EDYTOWAĆ

Powyższe dotyczy CI y0, nie z E(y|X=x0). Pierwotne pytanie dotyczy CI dlaE(y|X=x0). PozwolićE(y|X=x0)=hexp(x0β), który jest szacowany przez h^exp(x0β^). W takim przypadku myślę, że metoda Delta jest przydatną opcją (patrz odpowiedź Luchonacho).

Aby być rygorystycznym, potrzebujemy wspólnego podziału h^ i β^, a ściślej asymptotyczny rozkład wektora n[(β^β),h^h]. Następnie rozkład limitówn[h^exp(x0β^)hexp(x0β)] jest obliczany przy użyciu metody Delta, a następnie CI dla hexp(x0β) można zbudować.

chan1142
źródło
Dzięki za odpowiedź Chan. Nawiasem mówiąc, w tym ćwiczeniu estymator punktowy dla obuy0 lub E(y|X0)jest równy. Wynikowe oszacowanie znajduje się poza CI dlaE(y|X0) ale w CI dla y0. Czy nie powinni być oboje w swoim CI?
Stary człowiek na morzu.
Tak, to pomaga. Czy mógłbyś sprawdzić moje pytanie? To się z tym wiąże. economics.stackexchange.com/questions/16891/…
Starzec na morzu.
W komentarzu, który napisałem i usunąłem, popełniłem błąd. E(y|X=x0) różni się oczywiście od exp{E(logy|X=x0)}jak stwierdza Alecos Papadopoulos na twoje pytanie. Wielkie dzięki @Anoldmaninthesea i przepraszam za to. Być może myślałem o tymexp(x0β^) jest wystarczająco blisko exp(x0β), co nie jest tym, co wychowałeś. Hmm, w takim przypadku twoja uwaga jest jeszcze bardziej interesująca.
chan1142
1
Nigdy nie myślałem o tym problemie. Teraz zrobię Chodzi więc o CI dlaE(y|X=x0). W tym przypadku przydatna wydaje się metoda Delta wyjaśniona przez luchonacho. Dziękuję @Anoldmaninthesea za podniesienie go.
chan1142
Chan, połączyłem z tym moje inne pytanie. Znajdziesz tam odpowiedź, którą napisałem, która może być dla ciebie interesująca.
Stary człowiek na morzu.
1

Użyj metody delta . Powiedz asymptotyczny rozkład dużych próbek dla jednego parametruβ jest:

β^aN(β,Var(β^)n)

(zakładając, że oszacowanie jest spójne)

Ponadto jesteś zainteresowany funkcją β^, mówić, F(β^). Następnie aproksymacja Taylora pierwszego rzędu powyższego prowadzi do następującego asymptotycznego rozkładu:

F(β^)aN(F(β),(F(β^)β^)2Var(β^)n)

W Twoim przypadku, F(β^) jest eβ^. Stąd możesz zbudować CI w normalny sposób.

Źródło i więcej szczegółów w połączonym dokumencie.

Luchonacho
źródło
lucho, nie mogę użyć do tego metody Delta ... ale i tak dzięki. ;)
Stary człowiek na morzu.
: o dlaczego nie? Jakieś założenia, które błędnie odczytałem lub których nie podałem?
luchonacho
1
Po prostu nie o to chodzi w ćwiczeniu. Naprawdę chcę wiedzieć, która metoda jest poprawna. Ponadto twoja metoda podaje przybliżony rozkład, podczas gdy w ćwiczeniu chcą dokładnego CI.
Stary człowiek na morzu.