Statystyki i duże zbiory danych

39
Tryb, klasa i typ obiektów R.

Zastanawiałem się, jakie są różnice między trybem, klasą i typem R obiektów? Typ obiektu R można uzyskać za pomocą funkcji typeof (), mode by mode () i class by class (). Jakieś inne podobne funkcje i koncepcje, za którymi tęskniłem? Dziękuję i

39
Ranga w R - kolejność malejąca [zamknięty]

Szukam rankingu danych, które w niektórych przypadkach większa wartość ma rangę 1. Jestem stosunkowo nowy w R, ale nie widzę, jak mogę dostosować to ustawienie w funkcji rangi. x <- c(23,45,12,67,34,89) rank(x) generuje: [1] 2 4 1 5 3 6 kiedy chcę, żeby to było: [1] 5 3 6 2 4 1 Zakładam,...

39
Regresja najmniejszego kąta vs. lasso

Regresja przy najmniejszym kącie i lasso mają tendencję do tworzenia bardzo podobnych ścieżek regularyzacji (identycznych, z wyjątkiem przypadków, gdy współczynnik przekracza zero). Oba mogą być skutecznie dopasowane za pomocą praktycznie identycznych algorytmów. Czy jest jakiś praktyczny powód,...

39
Model regresji logistycznej nie jest zbieżny

Mam dane na temat lotów linii lotniczych (w ramce danych o nazwie flights) i chciałbym sprawdzić, czy czas lotu ma jakikolwiek wpływ na prawdopodobieństwo znacznie opóźnionego przybycia (co oznacza 10 lub więcej minut). Uznałem, że użyję regresji logistycznej, z czasem lotu jako predyktorem i czy...

39
Jakie jest znaczenie „.” (Kropka) w R?

Właśnie czytam książkę „R in a Nutshell”. I wygląda na to, że pominąłem część, w której „.” jak w „sample.formula” zostało wyjaśnione. > sample.formula <- as.formula(y~x1+x2) Czy próbka jest przedmiotem z formułą pola jak w innych językach? A jeśli tak, to jak mogę dowiedzieć się, jakie...

39
Powiązania pomiędzy

Powiedzmy, że mam dwie tablice 1-wymiarowe, za1a1a_1 i za2)a2a_2 . Każdy zawiera 100 punktów danych. 1 jest rzeczywiste dane i 2 jest przewidywania modelu. W tym przypadku, R 2 wartość będzie: R 2 = 1 - S S r e sza1a1a_1za2)a2a_2R2)R2R^2R2)= 1 - S.S.r e sS.S.t o t  ( 1 ) .R2=1−SSresSStot  (1). R^2...

39
Replikacja „solidnej” opcji Staty w R.

Próbowałem zreplikować wyniki opcji Stata robustw R. Użyłem rlmpolecenia z pakietu MASS, a także polecenia lmrobz pakietu „robustbase”. W obu przypadkach wyniki są zupełnie inne niż „solidna” opcja w Stacie. Czy ktoś może zasugerować coś w tym kontekście? Oto wyniki, które uzyskałem, gdy...

39
LDA vs word2vec

Próbuję zrozumieć, jakie jest podobieństwo między Latent Dirichlet Allocation i word2vec do obliczania podobieństwa słów. Jak rozumiem, LDA odwzorowuje słowa na wektor prawdopodobieństwa ukrytych tematów, podczas gdy word2vec odwzorowuje je na wektor liczb rzeczywistych (związanych z rozkładem...