Statystyki i duże zbiory danych

15
Czy model danych nieujemnych z grupowaniem zer (GLM Tweedie, GLM z zerowym napełnieniem itp.) Może przewidywać dokładne zera?

Rozkład Tweediego może modelować skośne dane z masą punktową równą zero, gdy parametr ppp (wykładnik w relacji średnia-wariancja) wynosi od 1 do 2. Podobnie model z napompowaniem zera (inaczej ciągły lub dyskretny) może mieć dużą liczbę zer. Mam problem ze zrozumieniem, dlaczego jest tak, że...

15
Kiedy przestać udoskonalać model?

Przez ostatnie 3 lata studiowałem statystyki z wielu książek, a dzięki tej stronie wiele się nauczyłem. Niemniej jedno fundamentalne pytanie wciąż pozostaje dla mnie bez odpowiedzi. Może mieć bardzo prostą lub bardzo trudną odpowiedź, ale wiem na pewno, że wymaga dogłębnego zrozumienia...

15
Plik pdf

Załóżmy że będzie oznaczony jako z nieznanym μ ∈ R i σ 2 > 0X1,X2,...,XnX1,X2,...,XnX_1, X_2,...,X_nN(μ,σ2)N(μ,σ2)N(\mu,\sigma^2)μ∈Rμ∈R\mu \in \mathcal Rσ2>0σ2>0\sigma^2>0 Niech Z=X1−X¯S,Z=X1−X¯S,Z=\frac{X_1-\bar{X}}{S},S jest tutaj odchyleniem standardowym. Można wykazać, że ZZZ ma pdf...

15
Przypadkowy problem z parametrem

Zawsze staram się uzyskać prawdziwą istotę problemu dotyczącego parametrów przypadkowych. Kilkakrotnie czytałem, że estymatory efektów stałych modeli danych nieliniowych paneli mogą być poważnie tendencyjne z powodu „dobrze znanego” problemu parametrów przypadkowych. Kiedy proszę o jasne...

15
Dlaczego ta regresja NIE zawodzi z powodu doskonałej wielokoliniowości, chociaż jedna zmienna jest liniową kombinacją innych?

Dzisiaj bawiłem się małym zestawem danych i wykonałem prostą regresję OLS, która, jak się spodziewałem, zawiodła z powodu doskonałej wielokoliniowości. Jednak tak się nie stało. Oznacza to, że moje rozumienie wielokoliniowości jest błędne. Moje pytanie brzmi: gdzie się mylę? Myślę, że mogę...