Mam teoretyczny model ekonomiczny, który jest następujący,
Więc teoria mówi, że istnieją czynniki , i x 3 do oszacowania y .x 2
Teraz mam prawdziwe dane i muszę oszacować , , . Problem polega na tym, że prawdziwy zestaw danych zawiera tylko dane dla i ; brak danych dla . Tak więc model, który mogę dopasować, to:
- Czy oszacowanie tego modelu jest w porządku?
- Czy tracę coś szacując?
- Jeśli oszacuję , , to dokąd zmierza termin ?
- Czy wynika to z terminu błędu ?
I chcielibyśmy założyć, że nie jest skorelowane z x 1 i x 2 .
Odpowiedzi:
Problem, o który musisz się martwić, nazywa się endogenicznością . Dokładniej, zależy to od tego, czy jest skorelowany w populacji z x 1 czy x 2 . Jeśli tak jest, wówczas związany b j będzie stronniczy s. Jest tak, ponieważ metody regresji OLS zmuszają reszty, u i , do nieskorelowania z twoimi współzmiennymi x js . Jednak twoje pozostałości składają się z pewnym nieredukowalnej przypadkowości, ε ja , i zmiennej niedotrzymanego (ale istotne), x 3 , który przez zastrzeżeniemx3 x1 x2 bj ui xj εi x3 jest skorelowane z i / lub x 2 . Z drugiej strony, jeśli zarówno x 1, jak i x 2 nie są skorelowane z x 3 w populacji, to ich wartości b nie będą przez to tendencyjne (oczywiście mogą być one tendencyjne przez coś innego). Jednym ze sposobów, w jaki ekonometrycy próbują poradzić sobie z tym problemem, jest użycie zmiennych instrumentalnych . x1 x2 x1 x2 x3 b
Dla większej przejrzystości napisałem szybką symulację w R, która pokazuje, że rozkład próbkowania jest bezstronny / wyśrodkowany na prawdziwej wartości β 2 , gdy nie jest on skorelowany z x 3 . Jednak w drugim przebiegu zauważ, że x 3 nie jest skorelowane z x 1 , ale nie x 2 . Nieprzypadkowo b 1 jest bezstronny, ale b 2 jest stronniczy.b2 β2 x3 x3 x1 x2 b1 b2
źródło
Pomyślmy o tym w kategoriach geometrycznych. Pomyśl o „piłce”, powierzchni piłki. Jest to opisane jako . Teraz, jeśli masz wartości x 2 , y 2 , z 2 i masz pomiary r 2 , możesz określić swoje współczynniki „a”, „b” i „c”. (Można to nazwać elipsoidą, ale nazywanie piłki jest prostsze.)r2=ax2+by2+cz2+ϵ x2 y2 z2 r2
Jeśli masz tylko warunki i y 2 , możesz utworzyć koło. Zamiast definiować powierzchnię kuli, opiszemy wypełniony okrąg. Równanie, które zamiast tego pasuje, to r 2 ≤ a x 2 + b y 2 + ϵ .x2 y2 r2≤ax2+by2+ϵ
Projektujesz „piłkę”, bez względu na kształt, w wyrażenie dla koła. Może to być „kulka” zorientowana ukośnie, która ma kształt przypominający igłę do szycia, a zatem elementy całkowicie niszczą oszacowania dwóch osi. Może to być kula, która wygląda jak prawie zmiażdżony m & m, gdzie osie monet to „x” i „y”, a projekcja jest zerowa. Nie możesz wiedzieć, która to jest bez informacji „ z ”.z z
Ten ostatni akapit mówił o sprawie „czystej informacji” i nie uwzględniał hałasu. Pomiary w świecie rzeczywistym mają sygnał z szumem. Hałas wzdłuż obwodu, który jest wyrównany do osi, będzie miał znacznie większy wpływ na dopasowanie. Chociaż masz taką samą liczbę próbek, będziesz mieć więcej niepewności w swoich oszacowaniach parametrów. Jeśli jest to inne równanie niż ten prosty przypadek zorientowany osiowo, wówczas rzeczy mogą wyglądać „w kształcie gruszki ”. Twoje bieżące równania mają kształt płaski, więc zamiast wiązania (powierzchni kuli), dane z mogą po prostu rozejść się po całej mapie - rzutowanie może być poważnym problemem.
Czy można modelować? To jest wyrok sądu. Specjalista, który rozumie szczegóły problemu, może na to odpowiedzieć. Nie wiem, czy ktoś może udzielić dobrej odpowiedzi, jeśli jest daleko od problemu.
Tracisz kilka dobrych rzeczy, w tym pewność w oszacowaniach parametrów i charakter transformowanego modelu.
Oszacowanie dla znika w epsilon i w innych oszacowaniach parametrów. Jest on uwzględniany przez całe równanie, w zależności od systemu podstawowego.b3
źródło
The other answers, while not wrong, over complicate the issue a bit.
Ifx3 is truly uncorrelated with x1 and x2 (and the true relationship is as specified) then you can estimate your second equation without an issue. As you suggest, β3x3 will be absorbed by the (new) error term. The OLS estimates will be unbiased, as long as all the other OLS assumptions hold.
źródło