Pytania oznaczone «self-study»

Rutynowe ćwiczenie z podręcznika, kursu lub testu stosowane na zajęciach lub do samodzielnej nauki. Polityka tej społeczności polega na „udzielaniu pomocnych wskazówek” w przypadku takich pytań, a nie na udzielaniu pełnych odpowiedzi.

77
Przykład: regresja LASSO z użyciem glmnet dla wyniku binarnego

Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29,...

46
Interpretacja predyktora i / lub odpowiedzi transformowanej logarytmicznie

Zastanawiam się, czy ma to znaczenie w interpretacji, czy transformowane są tylko zmienne zależne, zależne i niezależne, czy tylko zmienne niezależne. Rozważ przypadek log(DV) = Intercept + B1*IV + Error Mogę interpretować IV jako wzrost procentowy, ale jak to się zmienia, kiedy mam log(DV)...

46
Pułapki w analizie szeregów czasowych

Zaczynam dopiero od samodzielnego uczenia się w analizie szeregów czasowych. Zauważyłem, że istnieje wiele potencjalnych pułapek, które nie mają zastosowania do statystyk ogólnych. Opierając się na czym są powszechne grzechy statystyczne? , Chciałbym spytać: Jakie są typowe pułapki lub grzechy...

39
LDA vs word2vec

Próbuję zrozumieć, jakie jest podobieństwo między Latent Dirichlet Allocation i word2vec do obliczania podobieństwa słów. Jak rozumiem, LDA odwzorowuje słowa na wektor prawdopodobieństwa ukrytych tematów, podczas gdy word2vec odwzorowuje je na wektor liczb rzeczywistych (związanych z rozkładem...

38
Jaki jest związek między

Jaki jest związek między i na poniższym wykresie? Moim zdaniem istnieje ujemny związek liniowy, ale ponieważ mamy wiele wartości odstających, związek jest bardzo słaby. Czy mam rację? Chcę się dowiedzieć, jak wyjaśnić wykresy

37
Czy fakt, że mój włoski syn będzie uczęszczał do szkoły podstawowej, zmieni oczekiwaną liczbę włoskich dzieci obecnych w jego klasie?

To pytanie wynika z rzeczywistej sytuacji, na którą naprawdę byłem zaskoczony odpowiedzią. Mój syn ma rozpocząć szkołę podstawową w Londynie. Ponieważ jesteśmy Włochami, byłem ciekawy, ilu włoskich dzieci uczęszcza już do szkoły. Poprosiłem o to urzędnika ds. Przyjęć podczas składania wniosku, a...

34
Znajdź oczekiwaną wartość za pomocą CDF

Zacznę od stwierdzenia, że ​​jest to zadanie domowe od samego początku. Spędziłem kilka godzin, szukając sposobu na znalezienie oczekiwanych wartości i zdecydowałem, że nic nie rozumiem. Niech XXX ma CDF F(x)=1−x−α,x≥1F(x)=1−x−α,x≥1F(x) = 1 - x^{-\alpha}, x\ge1 . Znajdź E(X)E(X)E(X) dla tych...

31
Czy wynik egzaminu jest dwumianowy?

Oto proste pytanie statystyczne, które otrzymałem. Nie jestem pewien, czy to rozumiem. X = liczba zdobytych punktów na egzaminie (wielokrotny wybór i prawidłowa odpowiedź to jeden punkt). Czy X jest dwumianowy? Odpowiedź profesora brzmiała: Tak, ponieważ są tylko dobre lub złe...

30
Jakie są gałęzie statystyki?

W matematyce istnieją takie gałęzie, jak algebra, analiza, topologia itp. W uczeniu maszynowym uczenie się pod nadzorem, bez nadzoru i wzmacniające. W każdej z tych gałęzi są drobniejsze gałęzie, które dodatkowo dzielą metody. Mam problem ze zrównaniem się ze statystykami. Jakie byłyby główne...

29
Pseudo-R2 Interpretacja McFaddena

Mam binarny model regresji logistycznej z pseudo-kwadratem McFaddena wynoszącym 0,192 ze zmienną zależną o nazwie płatność (1 = płatność i 0 = brak płatności). Jaka jest interpretacja tego pseudo R-kwadrat? Czy jest to porównanie względne dla modeli zagnieżdżonych (np. Model 6 zmiennych ma pseudo...

28
Obliczanie powtarzalności efektów z modelu Lmer

Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc =...