Pytania oznaczone «model»

12

Różnica w raportowanych wartościach p między lm i aov w R

Co wyjaśnia różnice w wartościach p poniżej aovi lmwywołań? Czy różnica wynika tylko z różnych rodzajów obliczeń sum

12

Jaki jest oczekiwany rozkład reszt w uogólnionym modelu liniowym?

Wykonuję uogólniony model liniowy, w którym muszę określić rodzinę inną niż normalna. Jaki jest oczekiwany rozkład reszt? Na przykład, czy reszty powinny być rozkładane

generalized-linear-model residuals normality-assumption

12

Modelowanie matematyczne sieci neuronowych jako modeli graficznych

Usiłuję stworzyć matematyczne połączenie między siecią neuronową a modelem graficznym. W modelach graficznych pomysł jest prosty: rozkład prawdopodobieństwa jest rozkładany na czynniki według klików na wykresie, przy czym potencjały zwykle należą do rodziny wykładniczej. Czy istnieje równoważne...

neural-networks markov-process graphical-model deep-learning deep-belief-networks

12

Manipulacja modelem regresji logistycznej

Chciałbym zrozumieć, co robi następujący kod. Osoba, która napisała kod, już tu nie pracuje i jest prawie całkowicie nieudokumentowana. Zostałem poproszony o zbadanie go przez kogoś, kto myśli „ to bayesowski model regresji logistycznej ” bglm <- function(Y,X) { # Y is a vector of binary...

r logistic bayesian generalized-linear-model

12

Jakie są „wartości początkowe” w funkcji glm ()?

Jakie są parametry start, etastart, mustartw GLM function () ? Szukałem w dokumentach i Internecie, ale nie znalazłem jasnego wyjaśnienia, co to oznacza. Przypomina to bayesowskie „wartości początkowe” dla łańcuchów, ale wątpię, aby było to powiązane, ponieważ funkcja glm () w R jest statystyką...

r generalized-linear-model starting-values

12

Kiedy naprawiony efekt jest naprawiony?

Rozważmy liniowe efekty zauważony model typu: , gdzie jest niezauważalna ale czas niezmienny charakterystyczne i błąd, i indeksować odpowiednio indywidualne obserwacje i czas. Typowym podejściem w regresji efektów stałych (FE) byłoby usunięcie poprzez poszczególne manekiny (LSDV) / usunięcie...

fixed-effects-model philosophical

12

Kryteria wyboru „najlepszego” modelu w ukrytym modelu Markowa

Mam zestaw danych szeregów czasowych, do którego próbuję dopasować ukryty model Markowa (HMM) w celu oszacowania liczby stanów ukrytych w danych. Mój pseudo-kod do tego jest następujący: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states =...

r aic hidden-markov-model bic spss manova time-series r lme4-nlme regression modeling negative-binomial bayesian bugs state-space-models hypothesis-testing data-transformation factor-analysis sem

12

Model mieszany z 1 obserwacją na poziom

Dopasowuję model efektów losowych glmerdo niektórych danych biznesowych. Celem jest analiza wyników sprzedaży przez dystrybutora, z uwzględnieniem różnic regionalnych. Mam następujące zmienne: distcode: identyfikator dystrybutora z około 800 poziomami region: identyfikator geograficzny...

r regression mixed-model lme4-nlme

12

Zamieszanie z wartościami lmer i p: jak wartości p z pakietu memisc różnią się od wartości MCMC?

Miałem wrażenie, że funkcja lmer()w lme4pakiecie nie generowała wartości p (patrz lmerwartości p i tak dalej ). Używam MCMC wygenerowane wartości p zamiast, jak na to pytanie: znaczący wpływ w lme4modelu mieszanym i to pytanie: nie można odnaleźć wartości p w wyjściu ze lmer()w lm4opakowaniu wR...

r mixed-model p-value mcmc lme4-nlme

12

Wnioskowanie na temat efektów stałych w modelu efektów mieszanych

Skorelowałem dane i używam modelu mieszanych efektów regresji logistycznej do oszacowania indywidualnego (warunkowego) efektu dla predyktora zainteresowania. Wiem, że w przypadku standardowych modeli brzeżnych wnioskowanie na temat parametrów modelu za pomocą testu Walda jest spójne dla...

logistic mixed-model inference

12

Czy występuje problem z wielokoliniowością i regresją splajnów?

Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek...

multiple-regression generalized-linear-model predictive-models multicollinearity splines

12

Dlaczego test F w Gaussowskich modelach liniowych jest najbardziej wydajny?

W przypadku Gaussowskiego modelu liniowego gdzie zakłada się, że leży w pewnej przestrzeni wektorowej a ma standardowy rozkład normalny na , statystyka testu dla , gdzie jest przestrzeń wektorową, to zwiększa się do jedną z funkcji odchyleń statystyki: Skąd możemy wiedzieć, że ta statystyka...

hypothesis-testing normal-distribution linear-model power likelihood-ratio

12

Dokładny test Fishera i rozkład hipergeometryczny

Chciałem lepiej zrozumieć dokładny test Fishera, więc wymyśliłem następujący przykład zabawki, w którym f i m odpowiada płci męskiej i żeńskiej, a n i y odpowiada takiemu „zużyciu sody”: > soda_gender f m n 0 5 y 5 0 Oczywiście jest to drastyczne uproszczenie, ale nie chciałem, aby...

fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

12

Oblicz prawdopodobieństwo logarytmiczne „ręcznie” dla uogólnionej regresji nieliniowej metodą najmniejszych kwadratów (NLM)

Próbuję obliczyć prawdopodobieństwo logarytmiczne dla uogólnionej regresji nieliniowej metodą najmniejszych kwadratów dla funkcji zoptymalizowanej przez funkcja w pakiecie R , przy użyciu macierzy kowariancji wariancji generowanej przez odległości na drzewie filogenetycznym przy założeniu ruchu...

r maximum-likelihood least-squares nonlinear-regression mixed-model

12

Trudności ze znalezieniem odpowiedniego modelu dopasowanego do danych zliczających z mieszanymi efektami - ZINB czy coś innego?

Mam bardzo mały zestaw danych na temat liczebności pojedynczych pszczół, które mam problemy z analizą. Są to dane zliczania i prawie wszystkie zliczenia są w jednym traktowaniu, a większość zer w drugim traktowaniu. Istnieje również kilka bardzo wysokich wartości (po jednej w dwóch z sześciu...

count-data negative-binomial mixed-model zero-inflation lme4-nlme

12

Jak szkolić HMM do klasyfikacji?

Rozumiem więc, że kiedy trenujesz HMM do klasyfikacji, standardowe podejście to: Rozdziel swoje zestawy danych na zestawy danych dla każdej klasy Wytrenuj jeden HMM na klasę Na zestawie testowym porównaj prawdopodobieństwo każdego modelu w celu sklasyfikowania każdego okna Ale jak mam trenować...

classification hidden-markov-model

12

Sprawdzanie resztek normalności w uogólnionych modelach liniowych

W pracy wykorzystano uogólnione modele liniowe (zarówno dwumianowe, jak i ujemne dwumianowe rozkłady błędów) do analizy danych. Ale w sekcji metod analizy statystycznej znajduje się następujące stwierdzenie: ... i po drugie poprzez modelowanie danych obecności za pomocą modeli regresji...

generalized-linear-model assumptions

12

Raportowanie wyników liniowego modelu efektów mieszanych

Liniowe modele efektów mieszanych nie są powszechnie stosowane w moim kącie biologii i muszę zgłosić test statystyczny, którego użyłem w artykule, który próbuję napisać. Wiem, że świadomość modelowania wielopoziomowego zaczyna pojawiać się w niektórych obszarach nauk biologicznych ( Rozwiązanie...

mixed-model repeated-measures reporting

12

Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace =...

r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

12

Czy można oceniać GLM w Python / scikit-learn przy użyciu rozkładów Poissona, Gammy lub Tweedie jako rodziny dla rozkładu błędów?

Próbuję nauczyć się języka Python i Sklearn, ale do mojej pracy muszę uruchomić regresje, które wykorzystują rozkłady błędów z rodzin Poissona, Gammy, a zwłaszcza Tweediego. Nie widzę nic w dokumentacji na ich temat, ale są one w kilku częściach dystrybucji R, więc zastanawiałem się, czy ktoś...

generalized-linear-model python scikit-learn gradient-descent tweedie-distribution