Myślałem o tym problemie. Zwykłą funkcją logistyczną do modelowania danych binarnych jest: Jednak czy funkcja logit, która jest krzywą w kształcie litery S, zawsze jest najlepsza do modelowania danych? Być może masz powód, by sądzić, że twoje dane nie są zgodne z normalną krzywą w kształcie litery S, ale z innym rodzajem krzywej z domeną(0,1).
Czy są na to jakieś badania? Może możesz to wymodelować jako funkcję probitową lub coś podobnego, ale co, jeśli jest to coś zupełnie innego? Czy może to prowadzić do lepszego oszacowania efektów? Pomyślałam tylko i zastanawiam się, czy są jakieś badania na ten temat.
logistic
references
link-function
Dolina górska
źródło
źródło
Odpowiedzi:
Ludzie używają różnego rodzaju funkcji, aby utrzymać swoje dane pomiędzy 0 a 1. Szanse logarytmiczne wypływają naturalnie z matematyki, gdy wyprowadzasz model (nazywa się to „funkcją łącza kanonicznego”), ale masz całkowitą swobodę eksperymentowania z inne alternatywy.
Mam nadzieję że to pomoże.
Zredagowano, aby dodać : Dyskusja, z którą powiązany jest Macro, jest naprawdę doskonała. Gorąco polecam przeczytanie go, jeśli jesteś zainteresowany bardziej szczegółowymi informacjami.
źródło
Nie widzę powodu, a-a priori, dlaczego odpowiednią funkcją łącza dla danego zestawu danych musi być logit (chociaż wszechświat wydaje się ogólnie dla nas raczej miły). Nie wiem, czy są to dokładnie to, czego szukasz, ale oto kilka artykułów omawiających bardziej egzotyczne funkcje linków:
Cauchit (itp.):
Koenker, R., i Yoon, J. (2009). Łącza parametryczne dla modeli wyboru binarnego: Fisherian-Bayesian colloquy . Journal of Econometrics, 152, 2 , s. 120–130.
Koenker, R. (2006). Łącza parametryczne dla modeli wyboru binarnego . Rnews, 6, 4 , s. 32–34.
Scobit :
Nagler, J. (1994). Scobit: alternatywny estymator do logowania i sprawdzania . American Journal of Political Science, 38, 1 , ss. 230–255.
Skew-Probit :
Bazan, JL, Bolfarine, H., i Branco, MD (2010). Struktura linków skew-probit w regresji binarnej . Communications in Statistics - Theory and Methods, 39 , s. 678–697.
(To wydaje się być dobrym przeglądem przekrzywionych linków w ramach Bayesian) :
Chen, MH (2004). Modele przekrzywionych linków dla kategorycznych danych odpowiedzi . W Skew-Eliptycznych dystrybucjach i ich zastosowaniach: Podróż poza normalnością , Marc Genton, redaktor. Chapman and Hall.
Ujawnienie: Nie znam dobrze tego materiału. Kilka lat temu próbowałem pogadać z Cauchit i Scobit, ale mój kod ciągle się zawieszał (prawdopodobnie dlatego, że nie jestem świetnym programistą) i nie wydawało się to istotne dla projektu, nad którym pracowałem, więc go porzuciłem .
źródło
Najlepszą strategią jest modelowanie danych w świetle tego, co się dzieje (nic dziwnego!)
Prawdopodobnie nie ma badań nad tymi modelami jako takimi, chociaż przeprowadzono wiele badań nad jednym z tych modeli, a także nad porównaniami między nimi oraz nad różnymi sposobami ich szacowania. W literaturze można zauważyć, że przez pewien czas istnieje wiele działań, ponieważ badacze rozważają szereg opcji dla określonej klasy problemów, a następnie jedna metoda okazuje się lepsza.
źródło
Logit to model, w którym dane wejściowe są produktem ekspertów, z których każdy jest dystrybucją Bernoulliego. Innymi słowy, jeśli weźmiesz pod uwagę wszystkie dane wejściowe jako niezależne rozkłady Bernoulliego z prawdopodobieństwempja których dowody są połączone, przekonasz się, że dodajesz funkcję logistyczną zastosowaną do każdego z nich pja s. (Innym sposobem powiedzenia tego samego jest to, że konwersja z parametryzacji oczekiwanej na naturalną parametryzację rozkładu Bernoulliego jest funkcją logistyczną).
źródło