Próbuję nauczyć się modelu regresji liniowej. Mam jednak pewne zamieszanie związane z normalizacją danych. Znormalizowałem cechy / predyktory do zera średniej i wariancji jednostkowej. Czy muszę zrobić to samo dla celu. Jeśli tak to
Próbuję nauczyć się modelu regresji liniowej. Mam jednak pewne zamieszanie związane z normalizacją danych. Znormalizowałem cechy / predyktory do zera średniej i wariancji jednostkowej. Czy muszę zrobić to samo dla celu. Jeśli tak to
W przypadku tabeli awaryjnej 2 na 2 niektórzy powiedzieli, że dokładny test Fishera wykorzystuje liczbę w komórce (1,1) w tabeli jako statystykę testu, a pod hipotezą zerową będzie mieć rozkład hipergeometryczny.X1 , 1X1,1X_{1,1}X1 , 1X1,1X_{1,1} Niektórzy twierdzą, że jego statystyki testowe to...
W R, jeśli wywołam lm()funkcję w następujący sposób: lm.1 = lm(response ~ var1 + var2 + var1 * var2) summary(lm.1) To daje mi liniowy model zmiennej odpowiedzi z var1, var2oraz interakcji między nimi. Jak jednak dokładnie interpretujemy liczbowo termin interakcji? Dokumentacja mówi, że jest to...
Czy to prawda, że przy założeniach Gaussa Markowa zwykła metoda najmniejszych kwadratów daje wydajne i obiektywne estymatory? Więc: mi(ut) = 0mi(ut)=0E(u_t)=0 dla wszystkich ttt mi(utus) =σ2)mi(utus)=σ2)E(u_tu_s)=\sigma^2 dlat = st=st=s mi(utus) = 0mi(utus)=0E(u_tu_s)=0 dlat ≠ st≠st\neq s...
Używam ukrytej analizy klas do grupowania próbki obserwacji na podstawie zestawu zmiennych binarnych. Używam R i pakietu poLCA. W LCA musisz określić liczbę klastrów, które chcesz znaleźć. W praktyce ludzie zwykle uruchamiają kilka modeli, z których każdy określa inną liczbę klas, a następnie...
Chciałbym owinąć głowę tym tematem, ale uczenie się z oficjalnych dokumentów i samouczków jest trudne, ponieważ istnieje wiele luk, które zwykle są wypełnione w podręcznikach. Jeśli to ważne, mam stosunkowo silne zaplecze matematyczne, podobnie jak doktorat. w matematyce stosowanej (a dokładniej...
Powiedzmy, że przeprowadzam analizę, patrząc na konkretną miarę zdrowia. Interesuje mnie różnica w tym pomiarze między pacjentami a grupą kontrolną oraz to, czy różnica ta różni się od 0. W przeszłości były badania dotyczące tego samego pytania badawczego i miary zdrowia, ale w różnych próbkach...
Większość z tego stanowi tło, przejdź do końca, jeśli wiesz już wystarczająco dużo o mieszaninach procesowych Dirichleta . Załóżmy, że modeluję niektóre dane pochodzące z mieszanki procesów Dirichleta, tj. Pozwól i od załóżmy, żefa∼ D ( α H)fa∼re(αH.)F \sim \mathcal D(\alpha H)fafaFYja∼I I d∫fa( y|...
Próbuję obliczyć krańcowe prawdopodobieństwo modelu statystycznego metodami Monte Carlo: fa( x ) = ∫fa( x ∣ θ ) π( θ )reθfa(x)=∫fa(x∣θ)π(θ)reθf(x) = \int f(x\mid\theta) \pi(\theta)\, d\theta Prawdopodobieństwo jest dobrze zachowane - gładkie, wklęsłe - ale wysokie. Próbowałem ważnego próbkowania,...
Próbuję próbować z tyłu, mając wiele trybów szczególnie daleko od siebie za pomocą MCMC. Wygląda na to, że w większości przypadków tylko jeden z tych trybów zawiera 95% hpd, którego szukam. Próbowałem wdrożyć rozwiązania oparte na hartowanej symulacji, ale nie przynosi to zadowalających rezultatów,...
Czytanie Wikipedii o kanonicznej analizie korelacji (CCA) dla dwóch losowych wektorówXXX i YYY, Zastanawiałem się, czy odpowiedź głównego składnika (PCA) jest taka sama jak CCA, kiedy X=
Nie jestem pewien, czy to pytanie jest w pełni odpowiednie tutaj, jeśli nie, proszę usunąć. Jestem studentką ekonomii. W przypadku projektu badającego problemy z zakresu ubezpieczeń społecznych mam dostęp do dużej liczby administracyjnych spraw (> 200 tys.), Które dotyczą oceny...
EDYCJA: Od czasu opublikowania tego posta śledzę tutaj dodatkowy post . Podsumowanie poniższego tekstu: Pracuję nad modelem i próbowałem regresji liniowej, transformacji Boxa Coxa i GAM, ale nie zrobiłem dużego postępu Korzystając z tej opcji R, pracuję obecnie nad modelem do przewidywania...
Sytuacja Mam zestaw danych z jednym zależnym yyy i jedna zmienna niezależna xxx. Chcę dopasować do ciągłej częściowej regresji liniowejkkk znane / ustalone punkty przerwania występujące w (za1,za2), ... ,zak)(a1,a2,…,ak)(a_{1}, a_{2}, \ldots, a_{k}). Breakpoins są znane bez wątpliwości, więc nie...
Jeśli są identyczne z rozkładami Poissona z parametrem Wypracowałem, że maksymalne oszacowanie prawdopodobieństwa to dla danych . Dlatego możemy zdefiniować odpowiedni estymator Moje pytanie brzmi: jak opracowałbyś wariancję tego estymatora?K1,…,KnK1,…,KnK_1, \dots,...
Mam dokładny randomForestmodel klasyfikacji, którego chciałbym użyć w aplikacji, która przewiduje klasę nowego przypadku. W nowym przypadku nieuchronnie brakuje wartości. Prognozy nie będą działać jako takie dla NA. Jak mam to zrobić? data(iris) # create first the new case with missing...
Mam nadzieję, że jest to właściwe miejsce, aby zapytać, jeśli nie, możesz przenieść je na bardziej odpowiednie forum. Od dłuższego czasu zastanawiam się, jak traktować funkcje całkowite niekwadratowe z integracją Monte Carlo. Wiem, że MC nadal podaje prawidłowe oszacowanie, ale błąd jest nierealny...
Chciałbym zrozumieć zastosowanie symulacji Monte Carlo w chisq.test()funkcji w R. Mam zmienną jakościową, która ma 128 poziomów / klas. Moja próbka to 26 (nie mogłem próbkować więcej „osób”). Więc oczywiście będę mieć kilka poziomów z 0 „osobami”. Ale faktem jest, że mam bardzo małą liczbę klas...
Pracuję nad opracowaniem modelu do przewidywania całkowitej sprzedaży produktu. Mam około półtora roku rezerwacji, więc mógłbym przeprowadzić standardową analizę szeregów czasowych. Mam jednak również wiele danych na temat każdej „możliwości” (potencjalnej sprzedaży), która została zamknięta lub...
Załóżmy, że chcemy wnioskować na podstawie nieobserwowanej realizacji losowej zmiennej , która normalnie jest dystrybuowana ze średnią i wariancją . Załóżmy, że istnieje inna zmienna losowa (której nieobserwowaną realizację podobnie nazywamy ), która jest normalnie dystrybuowana ze średnią i...