Mam nadzieję, że ktoś zapewni intuicyjny przegląd tego, czym jest dystrybucja quasibinomial i co robi. Szczególnie interesują mnie następujące punkty:
Jak quasibinomial różni się od rozkładu dwumianowego.
Gdy zmienna odpowiedzi jest proporcją (przykładowe wartości obejmują 0,23, 0,11, 0,78, 0,98), model quasibinomial będzie działał w R, ale model dwumianowy nie.
Dlaczego modele quasibinomialne powinny być stosowane, gdy zmienna odpowiedzi PRAWDA / FAŁSZ jest nadmiernie rozproszona.
R
zglm.fit
,binomial
iquasibinomial
są dokładnie takie same, poza tym, żequasibinomial
(1) usuwa sprawdzanie całkowitej, oraz (2) zwraca AIC Na. Zobacz tę odpowiedź, aby uzyskać więcej informacji.Quasi-dwumian niekoniecznie jest szczególnym rozkładem; opisuje model zależności między wariancją a średnią w uogólnionych modelach liniowych, który jest razy wariancją dla dwumianu pod względem średniej dla dwumianu.ϕ
Istnieje rozkład, który pasuje do takiej specyfikacji (oczywisty - skalowany dwumianowy), ale niekoniecznie jest to cel, gdy dopasowany jest model quasi-dwumianowy; jeśli dopasowujesz do danych, które wciąż wynoszą 0-1, nie można skalować dwumianu.
Tak więc quasi-dwumianowy model wariancji, za pomocą parametru , może lepiej radzić sobie z danymi, dla których wariancja jest większa (lub być może mniejsza) niż w przypadku danych dwumianowych, niekoniecznie będąc faktycznym rozkładem .ϕ
Moim zdaniem model dwumianowy można uruchomić w proporcjach R *, ale trzeba go odpowiednio ustawić.
* Istnieją trzy oddzielne sposoby przekazywania danych dwumianowych do R, o których wiem. Jestem prawie pewien, że to jeden.
źródło