Widziałem dwa rodzaje formuł logistycznych strat. Możemy łatwo pokazać, że są identyczne, jedyną różnicą jest definicja etykiety yyy . Formułowanie / notacja 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\}
Widziałem dwa rodzaje formuł logistycznych strat. Możemy łatwo pokazać, że są identyczne, jedyną różnicą jest definicja etykiety yyy . Formułowanie / notacja 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\}
Chciałbym dopasować model liniowy (lm), w którym wariancja reszt jest wyraźnie zależna od zmiennej objaśniającej. Wiem, że to robię, używając glm z rodziną Gamma do modelowania wariancji, a następnie umieść odwrotność w wagach funkcji lm (przykład: http://nitro.biosci.arizona.edu/r/chapter31 .pdf...
Szukam zaawansowanego studium przypadku regresji liniowej ilustrującego kroki wymagane do modelowania złożonych, wielu nieliniowych zależności za pomocą GLM lub OLS. Zaskakująco trudno jest znaleźć zasoby wykraczające poza podstawowe przykłady szkolne: większość książek, które przeczytałem, nie...
Rozumiem, że test Walda dla współczynników regresji oparta jest na następujących nieruchomości, które posiada asymptotycznie (np Wasserman (2006): Wszystko statystyk , stron 153, 214-215): gdzieβoznacza oszacowany współczynnik regresji,^se(β)oznacza błąd standardowy współczynnik regresji iβ0jest...
Mam następujący wynik działania funkcji glm. Jak mogę zinterpretować następujące wartości: Odchylenie zerowe Pozostałe odchylenie AIC Czy mają coś wspólnego z dobrością dopasowania? Czy mogę obliczyć wartość dobroci dopasowania na podstawie tych wyników, takich jak kwadrat R lub jakakolwiek...
To pytanie zostało przeniesione z Przepełnienia stosu, ponieważ można na nie odpowiedzieć w ramach weryfikacji krzyżowej. Migrował 5 lat temu . Mam pytanie dotyczące interpretacji parametrów dla GLM ze zmienną zależną od rozkładu gamma. Oto, co R zwraca dla mojego GLM z...
Staram się układać dla siebie, gdy właściwe jest użycie typu regresji (geometrycznej, Poissona, dwumianu ujemnego) z danymi zliczania w ramach GLM (tylko 3 z 8 rozkładów GLM są używane do danych zliczania, chociaż większość z tego Czytałem centra wokół ujemnych rozkładów dwumianowych i...
Próbuję dopasować uogólnione modele liniowe do niektórych zestawów danych zliczania, które mogą być rozproszone lub nie. Dwa obowiązujące tutaj rozkłady kanoniczne to Poisson i ujemny dwumianowy (Negbin), z EV i wariancjąμμ\mu V.rP.= μVarP=μVar_P = \mu V.rN.b= μ + μ2)θVarNB=μ+μ2θVar_{NB} = \mu +...
Krótka wersja: Wiemy, że regresję logistyczną i regresję probitową można interpretować jako obejmującą ciągłą zmienną ukrytą, która jest dyskretyzowana według pewnego ustalonego progu przed obserwacją. Czy dostępna jest podobna interpretacja zmiennej ukrytej dla, powiedzmy, regresji Poissona? Co...
Regresja Poissona jest GLM z funkcją log-link. Alternatywnym sposobem modelowania danych liczbowych o rozkładzie innym niż normalny jest przetwarzanie wstępne, biorąc dziennik (a raczej dziennik (1 + liczba) do obsługi zer). Jeśli wykonasz regresję metodą najmniejszych kwadratów w odpowiedziach na...
Mam pewne dane w [0,1], które chciałbym przeanalizować za pomocą regresji beta. Oczywiście należy coś zrobić, aby uwzględnić wartości 0,1. Nie lubię modyfikować danych, aby pasowały do modelu. również nie uważam, aby inflacja zero i 1 była dobrym pomysłem, ponieważ uważam, że w tym przypadku...
Używam R i analizowałem moje dane za pomocą GLM z łączem dwumianowym. Chcę wiedzieć, jakie jest znaczenie przecięcia w tabeli wyjściowej. Punkt przecięcia dla jednego z moich modeli jest znacząco inny, jednak zmienna tak nie jest. Co to znaczy? Co to jest przechwycenie. Nie wiem, czy po prostu...
Prowadzimy wiele dobrych dyskusji na temat idealnej separacji w regresji logistycznej. Takich jak regresja logistyczna w R doprowadziła do idealnej separacji (zjawisko Haucka-Donnera). Co teraz? a model regresji logistycznej nie jest zbieżny . Osobiście nadal uważam, że nie jest intuicyjne,...
Czy istnieje (silniejsza?) Alternatywa dla transformacji pierwiastka kwadratowego arcsin dla danych procentowych / procentowych? W zbiorze danych, nad którym obecnie pracuję, znacząca heteroscedastyczność pozostaje po zastosowaniu tej transformacji, tj. Wykres wartości resztowych w stosunku do...
Mam do czynienia z bayesowskim hierarchicznym modelem liniowym , tutaj sieć go opisująca. YYY oznacza dzienną sprzedaż produktu w supermarkecie (zaobserwowano). XXX jest znaną matrycą regresorów, w tym cen, promocji, dnia tygodnia, pogody i świąt. S.S.S to nieznany ukryty poziom zapasów...
Mam tabelę danych T1, która zawiera prawie tysiąc zmiennych (V1) i około 200 milionów punktów danych. Dane są rzadkie, a większość wpisów to NA. Każdy punkt danych ma unikalną parę identyfikatora i daty, aby odróżnić je od innych. Mam inną tabelę T2, która zawiera osobny zestaw zmiennych (V2). Ta...
Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że...
Mam wykres wartości resztkowych modelu liniowego w funkcji dopasowanych wartości, w których heteroscedastyczność jest bardzo wyraźna. Jednak nie jestem pewien, jak powinienem postępować teraz, ponieważ o ile rozumiem ta heteroscedastyczność powoduje, że mój model liniowy jest nieważny. (Czy to...
To wydaje się takie elementarne, ale zawsze utknąłem w tym momencie… Większość danych, z którymi mam do czynienia, jest nienormalna, a większość analiz opartych na strukturze GLM. Do mojej obecnej analizy mam zmienną odpowiedzi, która jest „prędkością marszu” (metry / minutę). Łatwo jest mi...
Witaj Mam dwa problemy, które brzmią jak naturalni kandydaci na modele wielopoziomowe / mieszane, których nigdy nie używałem. Prostszy i taki, który mam nadzieję wypróbować jako wprowadzenie, wygląda następująco: Dane wyglądają jak wiele wierszy formularza x y innergroup outergroup gdzie x jest...