Wiem, że aurorzy nie muszą być poprawni, a funkcja prawdopodobieństwa również nie jest zintegrowana z 1. Ale czy tylny musi być odpowiednim rozkładem? Jakie są implikacje, jeśli tak jest / nie
Wiem, że aurorzy nie muszą być poprawni, a funkcja prawdopodobieństwa również nie jest zintegrowana z 1. Ale czy tylny musi być odpowiednim rozkładem? Jakie są implikacje, jeśli tak jest / nie
Mam eksperyment z powtarzanymi pomiarami, w którym zmienna zależna jest procentem, i mam wiele czynników jako zmienne niezależne. Chciałbym użyć glmerpakietu R, lme4aby potraktować go jako problem z regresją logistyczną (poprzez określenie family=binomial), ponieważ wydaje się, że bezpośrednio...
W małym zestawie danych ( ), z którym pracuję, kilka zmiennych daje mi idealne przewidywanie / separację . Dlatego do rozwiązania tego problemu używam regresji logistycznej Firtha .n ∼ 100n∼100n\sim100 Jeżeli wybiorę najlepszy model według AIC lub BIC , czy powinienem uwzględnić prawdopodobieństwo...
Jestem matematykiem, samokształcącym się statystyką i walczącym szczególnie z językiem. W książce, której używam, występuje następujący problem: Losowa zmienna jest podana jako -dystrybucja z . (Oczywiście ze względu na to pytanie można wziąć dowolny rozkład w zależności od jednego parametru)....
Próbuję dopasować model wielokrotnej regresji liniowej do moich danych za pomocą kilku parametrów wejściowych, powiedzmy 3. F(x)F(x)=Ax1+Bx2+Cx3+dor=(A B C)T(x1 x2 x3)+d(i)(ii)(i)F(x)=Ax1+Bx2+Cx3+dor(ii)F(x)=(A B C)T(x1 x2 x3)+d\begin{align} F(x) &= Ax_1 + Bx_2 + Cx_3 + d \tag{i} \\ &\text{or}...
Studiuję drzewa klasyfikacji i regresji, a jedną z miar podziału lokalizacji jest wynik GINI. Teraz jestem przyzwyczajony do określania najlepszego podziału lokalizacji, gdy logarytm stosunku prawdopodobieństwa tych samych danych między dwiema dystrybucjami wynosi zero, co oznacza, że...
W mojej klasie prawdopodobieństwa ciągle stosowane są terminy „sumy zmiennych losowych”. Jednak utknąłem na tym, co to dokładnie oznacza? Czy mówimy o sumie wielu realizacji z zmiennej losowej? Jeśli tak, to czy to nie stanowi pojedynczej liczby? W jaki sposób suma realizacji zmiennych losowych...
Jakie metody wykorzystują algorytmy uczenia drzewa decyzyjnego do radzenia sobie z brakującymi wartościami. Czy po prostu wypełniają boks, używając wartości o nazwie
To pytanie zostało przeniesione z Przepełnienia stosu, ponieważ można na nie odpowiedzieć w ramach weryfikacji krzyżowej. Migrował 5 lat temu . Mam pytanie dotyczące interpretacji parametrów dla GLM ze zmienną zależną od rozkładu gamma. Oto, co R zwraca dla mojego GLM z...
Czy jest tak, że w standaryzacji znana jest wariancja, podczas gdy w trakcie studentizacji nie jest znana, a zatem szacowana? Dziękuję
Podczas obliczania AIC AIC=2k−2lnLAIC=2k−2lnLAIC = 2k - 2 ln L k oznacza „liczbę parametrów”. Ale co liczy się jako parametr? Na przykład w modelu y=ax+by=ax+by = ax + b Czy aib są zawsze liczone jako parametry? Co jeśli nie dbam o wartość przechwytywania, czy mogę to zignorować, czy nadal się...
Maksymalna wartość iid Standardnormals zbieżny do standardowa Gumbela rozdzielający według wartości ekstremalnej teorii .X1,…,Xn.∼X1,…,Xn.∼X_1,\dots,X_n. \sim Jak możemy to pokazać? Mamy P(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(maxXi≤x)=P(X1≤x,…,Xn≤x)=P(X1≤x)⋯P(Xn≤x)=F(x)nP(\max X_i...
Rozumiem, że jeśli proces zależy od jego poprzednich wartości, to jest to proces AR. Jeśli zależy to od poprzednich błędów, jest to proces MA. Kiedy wystąpi jedna z tych dwóch sytuacji? Czy ktoś ma solidny przykład, który uwidacznia zasadniczą kwestię dotyczącą tego, co oznacza najlepiej modelować...
Mam 383 próbki, które mają duże odchylenie dla niektórych wspólnych wartości, jak obliczyć 95% CI dla średniej? Obliczony przeze mnie wskaźnik CI wydaje się bardzo odległy, co zakładam, ponieważ moje dane nie wyglądają jak krzywa podczas tworzenia histogramu. Myślę więc, że muszę użyć czegoś...
Zgodnie z tekstem, którego używam, wzór na wariancję reszty podaje:ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) I trudno w wierzyć od końcowa jest różnica pomiędzy obserwowanych wartości i wartość zmontowanym;...
Jaka jest różnica między regresją logistyczną a regresją logit? Rozumiem, że są one podobne (lub nawet takie same), ale czy ktoś mógłby wyjaśnić różnicę między nimi? Czy chodzi o
Większość klasycznych algorytmów grupowania i zmniejszania wymiarów (grupowanie hierarchiczne, analiza głównych składników, średnie k, samoorganizujące się mapy ...) są zaprojektowane specjalnie dla danych liczbowych, a ich dane wejściowe są postrzegane jako punkty w przestrzeni euklidesowej. Jest...
Natknąłem się na uwagę w The Chemical Statistician, że mediana próbki może być często wyborem wystarczającej statystyki, ale poza oczywistym przypadkiem jednej lub dwóch obserwacji, w których jest równa średniej próbki, nie mogę wymyślić innej nietrywialnej i iid przypadek, w którym mediana próbki...
Chciałbym wiedzieć, czy istnieje kod do trenowania splotowej sieci neuronowej do przeprowadzania klasyfikacji szeregów czasowych. Widziałem kilka ostatnich artykułów ( http://www.fer.unizg.hr/_download/repository/KDI-Djalto.pdf ), ale nie jestem pewien, czy coś istnieje lub czy sam to...
Dlaczego w „Metodzie momentów” porównujemy momenty próbne z momentami populacji w celu znalezienia estymatora punktu? Gdzie kryje się za tym