Jaka jest różnica między modelem Logit a modelem Probit ? Bardziej interesuje mnie wiedza o tym, kiedy stosować regresję logistyczną, a kiedy Probit. Jeśli jest jakaś literatura, która definiuje ją za pomocą R , to też byłoby
Odnosi się do dowolnego modelu, w którym zmienna losowa jest powiązana z jedną lub większą liczbą zmiennych losowych przez funkcję, która jest liniowa w skończonej liczbie parametrów.
Jaka jest różnica między modelem Logit a modelem Probit ? Bardziej interesuje mnie wiedza o tym, kiedy stosować regresję logistyczną, a kiedy Probit. Jeśli jest jakaś literatura, która definiuje ją za pomocą R , to też byłoby
Jaka jest różnica między regresją liniową a regresją logistyczną? Kiedy z nich
Korzystam z modeli regresji liniowej i zastanawiam się, jakie są warunki do usunięcia terminu przechwycenia. Porównując wyniki z dwóch różnych regresji, w których jedna ma przecięcie, a druga nie, zauważam, że funkcji bez przecięcia jest znacznie wyższa. Czy są pewne warunki lub założenia,...
W prostym modelu liniowym z jedną zmienną objaśniającą αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Znaleźć że usunięcie termin przechwytujący znacznie poprawia dopasowanie (wartość R2R2R^2 przechodzi od 0,3 do 0,9). Jednak pojęcie przechwytywania wydaje się...
Współczynnik korelacji Pearsona x i y jest taki sam, bez względu na to, czy obliczasz Pearson (x, y) czy pearson (y, x). Sugeruje to, że regresja liniowa y dla x lub x dla y powinna być taka sama, ale nie sądzę, żeby tak było. Czy ktoś może rzucić światło na to, że związek nie jest symetryczny i...
Ogólnie, co należy rozumieć przez powiedzenie, że część wariancji w analizie takiej jak PCA jest wyjaśniona przez pierwszy główny składnik? Czy ktoś może to wyjaśnić intuicyjnie, ale również podać dokładną matematyczną definicję tego, co oznacza „wyjaśniona wariancja” w kategoriach analizy głównego...
Rozkład gamma może przybierać dość szeroki zakres kształtów, a biorąc pod uwagę związek między średnią a wariancją poprzez jego dwa parametry, wydaje się on odpowiedni do radzenia sobie z heteroskedastycznością w danych nieujemnych, w sposób, w jaki transformowany logarytmicznie OLS może nie...
Jakie wykresy diagnostyczne (i być może testy formalne) są najbardziej przydatne dla regresji, w których wynikiem jest zmienna licząca? Szczególnie interesują mnie modele Poissona i modele dwumianowe ujemne, a także ich odpowiedniki zerowe i przeszkodowe. Większość źródeł, które znalazłem, po...
Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29,...
Mam zestaw danych z około 30 zmiennymi niezależnymi i chciałbym zbudować uogólniony model liniowy (GLM) w celu zbadania zależności między nimi a zmienną zależną. Wiem, że metoda, której nauczono mnie w tej sytuacji, stopniowa regresja, jest obecnie uważana za grzech statystyczny . Jakie...
Zauważyłem, że przedział ufności dla przewidywanych wartości w regresji liniowej jest zwykle wąski wokół średniej predyktora, a tłuszcz wokół minimalnych i maksymalnych wartości predyktora. Można to zobaczyć na wykresach tych 4 regresji liniowych: Początkowo myślałem, że dzieje się tak, ponieważ...
Jaka jest różnica między terminami „funkcja łącza” i „kanoniczna funkcja łącza”? Czy są też (teoretyczne) zalety używania jednego nad drugim? Na przykład binarna zmienna odpowiedzi może być modelowana przy użyciu wielu funkcji łącza, takich jak logit , probit itp. Jednak logit tutaj jest uważany...
Jak mogę zinterpretować główne efekty (współczynniki dla fikcyjnego czynnika) w regresji Poissona? Załóżmy następujący przykład: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7,...
Odpowiadając na to pytanie, John Christie zasugerował, że dopasowanie modeli regresji logistycznej należy oceniać poprzez ocenę reszt. Znam sposób interpretowania reszt w OLS, są one w tej samej skali co DV i bardzo wyraźnie różnica między y przewidywana przez model y. Jednak w przypadku regresji...
Często zaleca się, aby wziąć pierwiastek kwadratowy, gdy zliczasz dane. (Aby zapoznać się z niektórymi przykładami CV, patrz odpowiedź @ Harveya Motulsky'ego tutaj lub odpowiedź @ whubera tutaj .) Z drugiej strony, podczas dopasowywania uogólnionego modelu liniowego ze zmienną odpowiedzi...
Na tej stronie znajduje się kilka wątków z zaleceniami dotyczącymi książek na temat statystyk wprowadzających i uczenia maszynowego, ale szukam tekstu na temat zaawansowanych statystyk, w tym w kolejności priorytetów: maksymalne prawdopodobieństwo, uogólnione modele liniowe, analiza głównych...
Staram się zrozumieć filozofię stojącą za używaniem Uogólnionego Modelu Liniowego (GLM) vs Modelu Liniowego (LM). Poniżej utworzyłem przykładowy zestaw danych, w którym: log( y) = x + εlog(y)=x+ε\log(y) = x + \varepsilon W przykładzie nie ma błędu w funkcji wielkości y , więc założyłbym , że...
Mam do czynienia z danymi liniowymi z wartościami odstającymi, z których niektóre są o 5 standardowych odchyleń od szacowanej linii regresji. Szukam techniki regresji liniowej, która zmniejsza wpływ tych punktów. Jak dotąd oszacowałem linię regresji ze wszystkimi danymi, a następnie odrzuciłem...
Powiedzmy, że mam obiekt klasy glm(odpowiadający modelowi regresji logistycznej) i chciałbym zamienić przewidywane prawdopodobieństwa podane za predict.glmpomocą argumentu type="response"na odpowiedzi binarne, tj. lub . Jaki jest najszybszy i najbardziej kanoniczny sposób to zrobić w...
Jak wyglądają wszystkie wersje tej samej podstawowej metody