Moja (bardzo podstawowa) wiedza na temat modelu regresji Tobiasza nie pochodzi z klasy, tak jak wolałbym. Zamiast tego zbierałem tu i ówdzie informacje przez kilka wyszukiwań w Internecie. Moje najlepsze przypuszczenia dotyczące założeń regresji skróconej są takie, że są one bardzo podobne do zwykłych założeń dotyczących najmniejszych kwadratów (OLS). Nie mam jednak pojęcia, czy to prawda.
Stąd moje pytanie: jakie założenia powinienem sprawdzić, wykonując regresję Tobita?
Uwaga: Oryginalna forma tego pytania odnosiła się do regresji skróconej, która nie była modelem, którego używałem lub o który pytałem. Poprawiłem pytanie.
regression
assumptions
Ogień Ogień
źródło
źródło
Odpowiedzi:
Jeśli skorzystamy z prostej odpowiedzi, fragment książki Wooldridge (strona 533) jest bardzo odpowiedni:
... zarówno heteroskedastyczność, jak i nienormalność powodują, że estymator Tobita jest niespójny dla . Ta niespójność występuje, ponieważ gęstość pochodna dla zależy głównie od . Ta brak wiarygodności estymatora Tobita pokazuje, że cenzura danych może być bardzo kosztowna: w przypadku braku cenzury ( ) można konsekwentnie oszacować przy [lub nawet ].β^ β y x y∗|x∼Normal(xβ,σ2) y=y∗ β E(u|x)=0 E(x′u)=0
Notacje w tym fragmencie pochodzą z modelu Tobita:
Podsumowując różnicę między regułą najmniejszych kwadratów a regresją Tobita jest nieodłącznym założeniem normalności w tym drugim.
Zawsze też myślałem, że oryginalny artykuł Amemyi był całkiem dobry w ustanowieniu teoretycznych podstaw regresji Tobiasza.
źródło
Aby powtórzyć komentarz Aniko: Podstawowym założeniem jest istnienie obcięcia. To nie to samo założenie, co dwie inne możliwości, które sugeruje mi Twój post: ograniczoność i dobór próby.
Jeśli masz zasadniczo ograniczoną zmienną zależną zamiast ściętego jeden może chcesz przenieść się do uogólnionego modelu liniowego ramy z jednym z wybranych (rzadziej) rozkładów dla Y np log-normalny, wykładniczy, gamma, itp, które to szacunek Dolna granica.
Alternatywnie możesz zadać sobie pytanie, czy uważasz, że proces, który generuje zerowe obserwacje w twoim modelu, jest taki sam, jak ten, który generuje wartości ściśle dodatnie - myślę, że ceny w twojej aplikacji. Jeśli tak nie jest, to może być odpowiednie coś z klasy modeli doboru próby (np. Modele Heckmana). W takim przypadku byłbyś w sytuacji, gdybyś określił jeden model gotowości do zapłacenia jakiejkolwiek ceny, a drugi model ceny, jaką zapłaciliby ci pacjenci, gdyby chcieli coś zapłacić.
Krótko mówiąc, prawdopodobnie chcesz przejrzeć różnicę między zakładaniem obciętych, ocenzurowanych, ograniczonych i próbkujących wybranych zmiennych zależnych. Który chcesz pochodzić ze szczegółów Twojej aplikacji. Po stworzeniu pierwszego najważniejszego założenia możesz łatwiej określić, czy podoba Ci się konkretne założenia dowolnego modelu w wybranej klasie. Niektóre przykładowe modele wyboru mają założenia, które są raczej trudne do sprawdzenia ...
źródło
@Firefeather: Czy twoje dane zawierają (i mogą naprawdę tylko zawierać) tylko wartości dodatnie? Jeśli tak, zamodeluj go za pomocą uogólnionego modelu liniowego z błędem gamma i łączem logarytmicznym. Jeśli zawiera zera, można rozważyć dwa etapy (regresja logistyczna dla prawdopodobieństwa zera i regresja gamma dla wartości dodatnich). Ten ostatni scenariusz można również modelować jako pojedynczą regresję przy użyciu nadmuchanej zera gamma. Kilka świetnych wyjaśnień na ten temat podano kilka lat temu na liście SAS. Rozpocznij tutaj, jeśli jesteś zainteresowany, i wyszukaj dalsze informacje. tekst linku
Może pomóc skierować cię w innym kierunku, jeśli okrojona regresja okaże się nieprawdopodobna.
źródło
Jak wspomnieli inni, głównym zastosowaniem regresji tobit jest cenzura danych. Tobit jest szeroko stosowany w połączeniu z analizą Data Envelopment Analysis (DEA) i przez ekonomistę. W DEA wynik wydajności mieści się w przedziale od 0 do 1, co oznacza, że zmienna zależna jest ocenzurowana przy 0 od lewej i 1 od prawej. Dlatego zastosowanie regresji liniowej (OLS) nie jest możliwe.
Tobit to połączenie regresji probitowej i okrojonej. Należy zachować ostrożność, różnicując cenzurę i obcinanie:
Tobit = Probit + regresja obcięcia
Model Tobita zakłada normalność, podobnie jak model probit.
Kroki:
Model Probit decyduje, czy zmienna zależna ma wartość 0 czy 1. Jeśli zmienna zależna wynosi 1, to o ile (zakładając, że cenzura wynosi 0) .
Współczynnik jest taki sam dla obu modeli decyzyjnych. to termin korygujący służący do dostosowania wartości ocenzurowanych (zer).β σλ(x′βσ)
Sprawdź także model Cragga, w którym możesz użyć różnych na każdym kroku.β
źródło