Czytając „Elementy uczenia statystycznego ” kilkakrotnie spotkałem się z terminem „wariancja punktowa”. Chociaż mam niejasne pojęcie o tym, co to prawdopodobnie oznacza, byłbym wdzięczny za to Jak to jest zdefiniowane? Jak
Czytając „Elementy uczenia statystycznego ” kilkakrotnie spotkałem się z terminem „wariancja punktowa”. Chociaż mam niejasne pojęcie o tym, co to prawdopodobnie oznacza, byłbym wdzięczny za to Jak to jest zdefiniowane? Jak
Próbuję zbudować model, w którym odpowiedź jest proporcjonalna (w rzeczywistości jest to liczba głosów, jaką partia zdobywa w okręgach wyborczych). Jego rozkład nie jest normalny, więc postanowiłem modelować go z rozkładem beta. Mam też kilka predyktorów. Nie wiem jednak, jak napisać to w BŁĘDACH...
Właśnie (ponownie) czytałem Gelmana Dlaczego (zwykle) nie musimy się martwić wielokrotnymi porównaniami . W szczególności sekcja „Wiele wyników i inne wyzwania” wspomina o zastosowaniu modelu hierarchicznego w sytuacjach, gdy istnieje wiele powiązanych środków od tej samej osoby / jednostki w...
Obecnie pracuję nad szacunkami biomasy przy użyciu zdjęć satelitarnych. Szybko zdefiniuję tło mojego pytania, a następnie wyjaśnię pytanie statystyczne, nad którym pracuję. tło Problem Próbuję oszacować biomasę na obszarze we Francji. Moja odpowiedź to gęstość objętościowa drewna parowego ( ),...
Usiłuję dopasować model mieszany wielowymiarowy (tj. Wiele odpowiedzi) R. Oprócz pakietów ASReml-ri SabreR(które wymagają zewnętrznego oprogramowania) wydaje się, że jest to możliwe tylko w MCMCglmm. w artykule dołączonym do MCMCglmmpakietu (str. 6) Jarrod Hadfield opisuje proces dopasowywania...
Korzystam z modelu regresji Poissona do zliczania danych i zastanawiam się, czy istnieją powody, aby nie używać solidnego standardowego błędu do szacowania parametrów? Jestem szczególnie zaniepokojony, ponieważ niektóre z moich szacunków bez solidnej nie są znaczące (np. P = 0,13), ale z solidną są...
Często w artykułach badawczych, które czytasz, badacze kontrolowali pewne zmienne. Można to zrobić metodami takimi jak dopasowywanie, blokowanie itp. Ale zawsze uważałem, że kontrolowanie zmiennych było czymś statystycznym, mierząc kilka zmiennych, które mogą mieć wpływ, i przeprowadzając analizę...
Przeczytałem kilka artykułów i fragmentów książek, które wyjaśniają, jak wybrać dobrą liczbę interwałów (pojemników) dla histogramu zestawu danych, ale zastanawiam się, czy istnieje twarda maksymalna liczba interwałów na podstawie liczby punktów w zestaw danych lub inne kryterium. Wstęp: Powód,...
Modeluję wpływ ciąży na wynik choroby (martwy-żywy). Około 40% pacjentów zaszło w ciążę po diagnozie, ale w różnych momentach. Do tej pory wykonałem wykresy KM pokazujące wyraźny ochronny wpływ ciąży na przeżycie, a także zwykły model Coxa - jednak zostały one modelowane przy użyciu tylko...
Główny problem to: nie mogę uzyskać podobnych oszacowań parametrów z EViews i R. Z powodów, których sam nie znam, muszę oszacować parametry dla niektórych danych za pomocą EViews. Odbywa się to poprzez wybranie opcji NLS (nieliniowe najmniejsze kwadraty) i użycie następującej formuły:indep_var c...
Czy ktoś może mi wyjaśnić, jak należy zaprojektować funkcję decyzyjną SVM? Lub wskaż mi zasób, który omawia konkretny przykład. EDYTOWAĆ W poniższym przykładzie widzę, że równanie X2=1.5X2=1.5X_2 = 1.5 oddziela klasy z maksymalnym marginesem. Ale jak dopasować wagi i napisać równania dla...
Tytuł podsumowuje moje pytanie, ale dla jasności rozważ następujący prosty przykład. Niech Xi∽iidN(0,1)Xi∽iidN(0,1)X_i \overset{iid}{\backsim} \mathcal{N}(0, 1) , i=1,...,ni=1,...,ni = 1, ..., n . Zdefiniuj: Sn=1n∑i=1nXiSn=1n∑i=1nXi\begin{equation} S_n = \frac{1}{n} \sum_{i=1}^n X_i \end{equation}...
Powodem, dla którego o to pytam, jest to, że wydaje się, że wewnętrznie uczone reszty wydają się mieć ten sam wzór, co surowe szacunkowe reszty. Byłoby wspaniale, gdyby ktoś mógł
Jedną z metod, która została mi zasugerowana, jest spojrzenie na wykres piargowy i sprawdzenie „łokcia” w celu ustalenia prawidłowej liczby komputerów do użycia. Ale jeśli wykres nie jest jasny, czy R ma obliczenia w celu ustalenia liczby? fit <- princomp(mydata,
Postaram się opisać problem tak ogólnie, jak to możliwe. Modeluję obserwacje jako rozkład kategoryczny z parametrem wektor prawdopodobieństwa theta. Następnie zakładam, że wektor parametrów theta podąża za rozkładem Dirichleta z parametrami α1,α2,…,αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k...
Załóżmy, że masz dzienniki serwera WWW. W tych logach masz krotki tego rodzaju: user1, timestamp1 user1, timestamp2 user1, timestamp3 user2, timestamp4 user1, timestamp5 ... Te znaczniki czasu reprezentują np. Kliknięcia użytkowników. Teraz user1będzie odwiedzał witrynę wiele razy (sesji) w...
Mam nadzieję, że ta jest oczywista, ale daj mi znać, jeśli coś jest niejasne: Czy istnieje wielowymiarowa wersja dystrybucji
Mam zestaw 20 zmiennych, które poddałem analizie czynnikowej w SPSS. Na potrzeby badań muszę opracować 6 czynników. SPSS wykazał, że 8 zmiennych (spośród 20) zostało załadowanych niską wagą lub zostało obciążonych jednakowo przez kilka czynników, więc je usunąłem. Pozostałe 12 zmiennych zostało...
Jeśli mamy dwie niezależne zmienne losowe i X 2 ∼ P o i s ( λ ) , jaka jest funkcja masy prawdopodobieństwa X 1 + X 2 ?X1∼ B i n o m ( n , p )X1∼Binom(n,p)X_1 \sim \mathrm{Binom}(n,p)X2)∼ P o i s ( λ )X2∼Pois(λ)X_2 \sim \mathrm{Pois}(\lambda)X1+ X2)X1+X2X_1 + X_2 Uwaga: To nie jest dla mnie praca...
Lee i Lemieux (s. 31, 2009) sugerują badaczowi przedstawienie wykresów podczas analizy analizy nieciągłości regresji (RDD). Sugerują następującą procedurę: ”... w pewnym paśmie , i pewnej liczby pojemników i na lewo i na prawo od wartości odcięcia odpowiednio idea jest budowa zbiorników ( , ]...