Załóżmy, że jestem konsultantem i chcę wyjaśnić mojemu klientowi przydatność przedziału ufności. Klient mówi mi, że moje interwały są zbyt szerokie, aby były przydatne, i wolałby stosować te o połowę mniejsze. Jak mam odpowiedzieć?
Załóżmy, że jestem konsultantem i chcę wyjaśnić mojemu klientowi przydatność przedziału ufności. Klient mówi mi, że moje interwały są zbyt szerokie, aby były przydatne, i wolałby stosować te o połowę mniejsze. Jak mam odpowiedzieć?
Spójność jest oczywiście naturalnym i ważnym estymatorem nieruchomości, ale czy są sytuacje, w których lepiej byłoby zastosować niespójny estymator niż spójny? Mówiąc dokładniej, czy istnieją przykłady niespójnego estymatora, który przewyższa rozsądny spójny estymator dla wszystkich skończonych (w...
Chcę wykonać K-oznacza grupowanie obiektów, które mam, ale obiekty te nie są opisywane jako punkty w przestrzeni, tj. Przez objects x featureszestaw danych. Jestem jednak w stanie obliczyć odległość między dowolnymi dwoma obiektami (jest ona oparta na funkcji podobieństwa). Pozbywam się macierzy...
Chcę lepiej zrozumieć pakiety R Larsi Glmnetużywane do rozwiązania problemu Lasso: (dla zmiennych i próbek , patrz www.stanford.edu/~hastie/Papers/glmnet.pdf na stronie 3)m i n( β0β) ∈ Rp + 1[ 12)N.∑ja = 1N.( yja- β0- xT.jaβ)2)+ λ | |β|
Chciałbym dopasować model liniowy (lm), w którym wariancja reszt jest wyraźnie zależna od zmiennej objaśniającej. Wiem, że to robię, używając glm z rodziną Gamma do modelowania wariancji, a następnie umieść odwrotność w wagach funkcji lm (przykład: http://nitro.biosci.arizona.edu/r/chapter31 .pdf...
Drugie pytanie dotyczy tego, że w dyskusji gdzieś w Internecie mówiłem o „nadzorowanym klastrowaniu”, o ile wiem, klastrowanie nie jest nadzorowane, więc jakie jest dokładnie znaczenie „nadzorowanego klastrowania”? Jaka jest różnica w odniesieniu do „klasyfikacji”? Mówi o tym wiele...
Wiem E(aX+b)=aE(X)+bE(aX+b)=aE(X)+bE(aX+b) = aE(X)+b z , b stałych, więc podane E ( X ) , to łatwo rozwiązać. Wiem również, że nie można tego zastosować, gdy jest to funkcja nieliniowa, jak w tym przypadku E ( 1 / X ) ≠ 1 / E ( X ) , i aby to rozwiązać, muszę dokonać aproksymacji z Taylor's. Więc...
Jestem inżynierem oprogramowania, który chce zbudować narzędzie do testowania A / B. Nie mam solidnych statystyk, ale przez ostatnie kilka dni sporo czytałem. Postępuję zgodnie z opisaną tutaj metodologią i streszczę odpowiednie punkty poniżej. Narzędzie pozwoli projektantom i ekspertom domeny...
Oprócz wyjątkowych okoliczności, w których absolutnie musimy zrozumieć zależność średnią, jakie są sytuacje, w których badacz powinien wybrać OLS zamiast regresji kwantylowej? Nie chcę, aby odpowiedź brzmiała „jeśli nie ma sensu rozumieć relacji ogona”, ponieważ moglibyśmy po prostu użyć regresji...
Chciałem eksperymentować z siecią neuronową w związku z problemem klasyfikacji, przed którym stoję. Natknąłem się na dokumenty, które mówią o KMS. Ale z tego, co rozumiem, nie różnią się niczym od posiadania wielowarstwowej sieci neuronowej. Czy to jest dokładne? Ponadto pracuję z R i nie widzę...
Załóżmy, że zmienna losowa ma dolną i górną granicę [0,1]. Jak obliczyć wariancję takiej
Dla wariancji nieważonej istnieje wariancja próbki skorygowana o błąd systematyczny, gdy średnią oszacowano na podstawie tych samych danych: Var(X):=1Var ( X) : = 1n∑ja( xja- μ )2)Var(X): =1n∑ja(xja-μ)2)\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var ( X) := 1n -1∑ja(xja- E[ X] )2)Var(X):...
Pracując z wieloma zmiennymi wejściowymi, często martwimy się wielokoliniowością . Istnieje wiele miar wielokoliniowości, które są wykorzystywane do wykrywania, myślenia i / lub komunikowania wielokoliniowości. Niektóre typowe zalecenia to: Wielokrotność dla danej zmiennej...
Losowy pakiet R. pakietu R nie może obsłużyć współczynnika z więcej niż 32 poziomami. Gdy ma więcej niż 32 poziomy, emituje komunikat o błędzie: Nie obsługuje predyktorów jakościowych z więcej niż 32 kategoriami. Ale dane, które mam, mają kilka czynników. Niektóre z nich mają ponad 1000...
Czy uczenie maszynowe jest ważnym tematem dla każdego statystyki, z którym należy się zapoznać? Wydaje się, że uczenie maszynowe to statystyki. Dlaczego programy statystyczne (licencjackie i magisterskie) nie wymagają uczenia
Rozumiem, że test Walda dla współczynników regresji oparta jest na następujących nieruchomości, które posiada asymptotycznie (np Wasserman (2006): Wszystko statystyk , stron 153, 214-215): gdzieβoznacza oszacowany współczynnik regresji,^se(β)oznacza błąd standardowy współczynnik regresji iβ0jest...
Obecnie przeglądam „Bayesian Reasoning and Machine Learning” Davida Barbera i jest to niezwykle dobrze napisana i wciągająca książka do nauki podstaw. Więc pytanie do kogoś, kto już to zrobił. Jaki zestaw książek powinienem przejrzeć po tym, jak opanuję większość pojęć z fryzjera...
Mam zestaw danych, który jest statystykami z internetowego forum dyskusyjnego. Patrzę na rozkład liczby odpowiedzi, których oczekuje się od tematu. W szczególności utworzyłem zestaw danych, który zawiera listę odpowiedzi na temat, a następnie liczbę tematów, które mają taką liczbę...
Z tego, co niewiele wiem, algorytm EM można wykorzystać do znalezienia maksymalnego prawdopodobieństwa przy zerowaniu pochodnych cząstkowych w odniesieniu do parametrów prawdopodobieństwa daje zestaw równań, których nie można rozwiązać analitycznie. Ale czy algorytm EM jest potrzebny zamiast...
Patrzyłem na pakiet rozruchowy w R i chociaż znalazłem kilka dobrych starterów, jak go używać, to jeszcze nie znalazłem niczego, co dokładnie opisuje to, co dzieje się „za kulisami”. Na przykład w tym przykładzie przewodnik pokazuje, jak używać standardowych współczynników regresji jako punktu...