Mam na myśli, że niektóre z tych zmiennych są ze sobą ściśle skorelowane. Jak / dlaczego / w jakim kontekście definiujemy je jako zmienne niezależne
Mam na myśli, że niektóre z tych zmiennych są ze sobą ściśle skorelowane. Jak / dlaczego / w jakim kontekście definiujemy je jako zmienne niezależne
Jeśli wspólne prawdopodobieństwo jest przecięciem 2 zdarzeń, to czy wspólne prawdopodobieństwo 2 niezależnych zdarzeń nie powinno wynosić zero, ponieważ w ogóle się nie przecinają? Jestem
W matematyce istnieją takie gałęzie, jak algebra, analiza, topologia itp. W uczeniu maszynowym uczenie się pod nadzorem, bez nadzoru i wzmacniające. W każdej z tych gałęzi są drobniejsze gałęzie, które dodatkowo dzielą metody. Mam problem ze zrównaniem się ze statystykami. Jakie byłyby główne...
W przypadku jednowymiarowych estymatorów gęstości jądra (KDE) używam reguły Silvermana do obliczania hhh : 0,9 min ( s d, JaQ R / 1.34 ) × n- 0,20,9min(sre,jaQR/1.34)×n-0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Jakie są standardowe reguły dla wielowymiarowego KDE...
Jakiego wyboru zmiennych / cech preferujesz do klasyfikacji binarnej, gdy w zestawie do nauki jest o wiele więcej zmiennych / cech niż obserwacji? Celem jest omówienie procedury wyboru funkcji, która najlepiej redukuje błąd klasyfikacji. Możemy poprawić notacje dla spójności: dla , niech będą...
Jakie są podcasty związane z analizą statystyczną? Znalazłem kilka nagrań audio z wykładów uniwersyteckich na ITunes U, ale nie znam żadnych statystycznych podcastów. Najbliższa rzecz, o której wiem, to podcast z badań operacyjnych The Science of Better . Dotyka kwestii statystycznych, ale nie jest...
Porównuję próbkę i sprawdzam, czy rozprowadza się ją jako jakąś dyskretną dystrybucję. Nie jestem jednak pewien, czy Kołmogorow-Smirnov ma zastosowanie. Wikipedia wydaje się sugerować, że tak nie jest. Jeśli nie, to jak mogę przetestować rozkład
W tradycyjnym paradoksie urodzinowym pytanie brzmi: „jakie są szanse, że dwie lub więcej osób w grupie osób będzie miało urodziny”. Utknąłem na problem, który jest przedłużeniem tego.nnn Zamiast znać prawdopodobieństwo, że dwie osoby dzielą urodziny, muszę rozszerzyć pytanie, aby wiedzieć, jakie...
Nauczono mnie, aby stosować dokładny test Fishera tylko w tabelach awaryjnych, które były 2x2. Pytania: Czy sam Fisher kiedykolwiek przewidywał, że ten test zostanie zastosowany w tabelach większych niż 2x2 (Zdaję sobie sprawę z opowieści o tym, że opracował test, próbując zgadnąć, czy stara...
Czy możliwe jest sprawdzenie skończoności (lub istnienia) wariancji zmiennej losowej na podstawie próbki? Jako zero, albo {wariancja istnieje i jest skończona}, albo {wariancja nie istnieje / jest nieskończona} byłoby dopuszczalne. Filozoficznie (i obliczeniowo) wydaje się to bardzo dziwne,...
Jak mogę sprawdzić rzetelność dwudziestostronnej kostki (d20)? Oczywiście porównałbym rozkład wartości z rozkładem jednolitym. Niejasno pamiętam test Chi-kwadrat na studiach. Jak mogę to zastosować, aby sprawdzić, czy kość jest
Tak więc mam zestaw danych takich wartości procentowych: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) Chcę znaleźć standardowe odchylenie procentowe, ale ważone dla ich objętości danych. tzn. pierwszy i ostatni punkt danych powinny dominować w...
Chcę się dowiedzieć, jak działa Gibbs Sampling i szukam dobrego papieru podstawowego do średnio zaawansowanego. Mam wykształcenie informatyczne i podstawową wiedzę statystyczną. Czy ktoś czytał wokół dobry materiał? gdzie się tego
Korzystam z funkcji auto.arima () w pakiecie prognozy , aby dopasować modele ARMAX do różnych zmiennych towarzyszących. Jednak często mam dużą liczbę zmiennych do wyboru i zwykle kończę na ostatecznym modelu, który działa z ich podzbiorem. Nie lubię technik ad hoc do wybierania zmiennych, ponieważ...
Zawsze używam lm()w R do regresji liniowej na . Ta funkcja zwraca współczynnik taki, żeyyyxxxββ\betay=βx.y=βx.y = \beta x. Dzisiaj dowiedziałem się o całkowitej liczbie najmniejszych kwadratów i tej princomp()funkcji (analiza głównego składnika, PCA) można użyć do jej wykonania. To powinno być dla...
Jestem całkiem nowy w statystyce i potrzebuję twojej pomocy. Mam małą próbkę, jak następuje: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Przeprowadziłem test Shapiro-Wilk przy użyciu R: shapiro.test(precisionH4U$H4U) i otrzymałem następujący wynik: W = 0.9502, p-value...
Wydaje mi się, że tylko dwa pakiety R są w stanie wykonać Latent Dirichlet Allocation : Jednym z nich jest ldaautor Jonathan Chang; drugim jest topicmodelsBettina Grün i Kurt Hornik. Jakie są różnice między tymi dwoma pakietami pod względem wydajności, szczegółów implementacji i możliwości...
Czy istnieje sposób w R (funkcja wbudowana) do obliczenia macierzy przejścia dla łańcucha Markowa na podstawie zestawu obserwacji? Na przykład biorąc zestaw danych jak poniżej i obliczyć macierz przejścia pierwszego rzędu? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = 100,...
Zastosowane prawdopodobieństwo jest ważną gałęzią prawdopodobieństwa, w tym prawdopodobieństwem obliczeniowym. Ponieważ statystyki wykorzystują teorię prawdopodobieństwa do konstruowania modeli do przetwarzania danych, w moim rozumieniu zastanawiam się, jaka jest zasadnicza różnica między modelem...
Usiłuję tylko powtórzyć twierdzenie przedstawione w poniższym artykule Finding Correlated Biclusters z Gene Expression Data , czyli: Twierdzenie 4. Jeśli . Następnie mamy:Xjajot= RjadoT.jotXIJ=RICJTX_{IJ}=R_{I}C^{T}_{J} ja. Jeśli jest idealnym biclusterem z modelem addytywnym, to jest...