W algorytmie modelu tematycznego LDA widziałem to założenie. Ale nie wiem, dlaczego wybrał dystrybucję Dirichleta? Nie wiem, czy możemy użyć Uniform Distribution na Multinomial jako
W algorytmie modelu tematycznego LDA widziałem to założenie. Ale nie wiem, dlaczego wybrał dystrybucję Dirichleta? Nie wiem, czy możemy użyć Uniform Distribution na Multinomial jako
Niedawno natknąłem się na artykuł „Nieistotność zerowego testowania istotności hipotezy”, Jeff Gill (1999) . Autor podniósł kilka typowych nieporozumień dotyczących testowania hipotez i wartości p, na które mam dwa konkretne pytania: Wartość p jest technicznie...
Powiedzmy, że mamy zmienną zależną z kilkoma kategoriami i zestawem zmiennych niezależnych. YYY Jakie są zalety wielomianowej regresji logistycznej w porównaniu z zestawem binarnych regresji logistycznych (tj. Schemat jeden do reszty )? Przez zestaw binarnej regresji logistycznej rozumiem, że dla...
Niedawno dowiedziałem się o zasadzie rozumowania probabilistycznego zwanej „ wyjaśnianiem ” i staram się pojąć w tym intuicję. Pozwól, że przygotuję scenariusz. Niech AAA będzie wydarzeniem, w którym ma miejsce trzęsienie ziemi. Niech wydarzenie BBB będzie wydarzeniem, gdy wesoły zielony gigant...
plot(density(rexp(100)) Oczywiście cała gęstość na lewo od zera reprezentuje błąd. Chciałbym podsumować niektóre dane dla statystycznych i chcę uniknąć pytań o to, dlaczego dane nieujemne mają gęstość na lewo od zera. Wykresy służą do sprawdzania losowości; Chcę pokazać rozkład zmiennych według...
Czytam książkę o regresji liniowej i mam pewne problemy ze zrozumieniem macierzy wariancji-kowariancji :bb\mathbf{b} Elementy po przekątnej są dość łatwe, ale te o przekątnej są nieco trudniejsze, co mnie że σ( b0, b1) = E( b0b1) - E( b0) E( b1) = E( b0b1) -
Próbuję dopasować wielowymiarowy model regresji liniowej z około 60 zmiennymi predykcyjnymi i 30 obserwacjami, więc używam pakietu glmnet do regresji regularnej, ponieważ p> n. Przeglądałem dokumentację i inne pytania, ale nadal nie mogę zinterpretować wyników, oto przykładowy kod (z 20...
Jaka jest intuicja za tym, że SVM z jądrem gaussowskim ma nieskończoną przestrzeń
Jaka jest najlepsza technika do obliczenia przedziału ufności eksperymentu dwumianowego, jeśli szacujesz, że (lub podobnie ), a wielkość próby jest względnie mała, na przykład ?p = 1 n = 25p = 0p=0p=0p = 1p=1p=1n =
Mam dane z 3 grup biomasy alg ( , , ), które zawierają nierówne wielkości próbek ( n_A = 15 , n_B = 13 , n_C = 12 ) i chciałbym porównać, czy te grupy pochodzą z tej samej populacji.B C n A = 15 n B = 13 n C = 12AAABBBCCCnA=15nA=15n_A=15nB=13nB=13n_B=13nC=12nC=12n_C=12 Jednokierunkowa ANOVA...
Próbuję owinąć głowę wokół różnicy statystycznej między liniową analizą dyskryminacyjną a regresją logistyczną . Czy słusznie rozumiem, że w przypadku problemu klasyfikacji dwóch klas LDA przewiduje dwie funkcje gęstości normalnej (po jednej dla każdej klasy), które tworzą granicę liniową w miejscu...
Próbuję utworzyć wielomian dopasowania drugiego rzędu do niektórych danych, które mam. Powiedzmy, że knuję to dopasowanie z ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Dostaję: Tak więc dopasowanie drugiego rzędu działa całkiem...
Próbuję dowiedzieć się, która metoda weryfikacji krzyżowej jest najlepsza w mojej sytuacji. Poniższe dane są tylko przykładem pracy nad problemem (w R), ale moje rzeczywiste Xdane ( xmat) są skorelowane ze sobą i skorelowane w różnym stopniu ze yzmienną ( ymat). Podałem kod R, ale moje pytanie...
Funkcja kosztu sieci neuronowej to J(W,b)J(W,b)J(W,b) i twierdzi się, że nie jest wypukła . Nie do końca rozumiem, dlaczego tak jest, ponieważ, jak widzę, jest dość podobny do funkcji kosztu regresji logistycznej, prawda? Jeśli nie jest wypukła, to pochodna drugiego rzędu...
Benjamini i Hochberg opracowali pierwszą (i nadal chyba najczęściej stosowaną) metodę kontrolowania wskaźnika fałszywych odkryć (FDR). Chcę zacząć od szeregu wartości P, z których każda służy do innego porównania, i zdecydować, które są wystarczająco niskie, aby nazwać je „odkryciem”, kontrolując...
W bieżącym artykule w NAUCE proponuje się: Załóżmy, że losowo dzielisz 500 milionów dochodów na 10 000 osób. Jest tylko jeden sposób na zapewnienie wszystkim równych 50 000 udziałów. Jeśli więc losujesz pieniądze, równość jest bardzo mało prawdopodobna. Ale istnieją niezliczone sposoby, aby dać...
EffectsPakiet zapewnia bardzo szybki i wygodny sposób kreślenia wyników liniowego modelu efektu mieszanego uzyskanego przez lme4pakiet . Te effectprzedziały ufności oblicza funkcyjne (CIS) bardzo szybko, ale jak wiarygodne są te przedziały ufności? Na
Ten artykuł „ Kursy, ciągle aktualizowane” z NY Times przykuł moją uwagę. Krótko mówiąc, stwierdza to [Statystyka bayesowska] okazuje się szczególnie przydatna w podejściu do skomplikowanych problemów, w tym wyszukiwań takich jak ta przeprowadzona przez Straż Przybrzeżną w 2013 r. W celu...
Mianownik (obiektywnego) estymatora wariancji jest ponieważ istnieje obserwacji i szacowany jest tylko jeden parametr.n−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} Z tego samego powodu zastanawiam...
Korzystając z walidacji krzyżowej w celu dokonania wyboru modelu (np. Strojenia hiperparametrów) i oceny wydajności najlepszego modelu, należy zastosować zagnieżdżoną walidację krzyżową . Pętla zewnętrzna służy do oceny wydajności modelu, a pętla wewnętrzna służy do wyboru najlepszego modelu; model...