Statystyki i duże zbiory danych

11
Prognozy o 1 krok do przodu dzięki pakietowi dynlm R.

Dopasowałem model z kilkoma zmiennymi niezależnymi, z których jedną jest opóźnienie zmiennej zależnej, używając pakietu dynlm. Zakładając, że mam prognozy o krok do przodu dla moich zmiennych niezależnych, w jaki sposób mogę uzyskać prognozy o krok do przodu dla moich zmiennych zależnych? Oto...

11
Symulacja serii ARIMA (1,1,0)

Dopasowałem modele ARIMA do oryginalnej serii czasowej, a najlepszym modelem jest ARIMA (1,1,0). Teraz chcę zasymulować serię z tego modelu. Napisałem prosty model AR (1), ale nie mogłem zrozumieć, jak dostosować różnicę w modelu ARI (1,1,0). Następujący kod R dla serii AR (1) to: phi= -0.7048...

11
Analiza mocy do analizy przeżycia

Jeśli postawię hipotezę, że sygnatura genu pozwoli zidentyfikować osoby o niższym ryzyku nawrotu, to znaczy obniży się o 0,5 (współczynnik ryzyka 0,5), wskaźnik zdarzeń u 20% populacji i zamierzam użyć próbek z retrospektywnego badania kohortowego wielkość próby musi być dostosowana do nierównych...

11
Jak obsługiwać nieistniejące (nie brakujące) dane?

Nigdy tak naprawdę nie znalazłem żadnego dobrego tekstu ani przykładów na temat obsługi „nieistniejących” danych dla danych wejściowych do dowolnego rodzaju klasyfikatora. Dużo czytałem o brakujących danych, ale co można zrobić z danymi, które nie mogą istnieć lub nie istnieją w odniesieniu do...

11
Oznaczanie wykresów pudełkowych w R.

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Muszę zbudować wykres pudełkowy bez żadnych osi i dodać go do bieżącego wykresu (krzywa ROC),...

11
Co oznacza liniowa regresja liniowa?

W R, jeśli napiszę lm(a ~ b + c + b*c) czy nadal byłaby to regresja liniowa? Jak zrobić inne rodzaje regresji w R? Byłbym wdzięczny za jakieś zalecenia dotyczące podręczników lub

11
Jak wybrać liczbę komponentów do analizy niezależnych komponentów?

Wobec braku dobrych wstępnych domysłów na temat liczby komponentów, które należy zamówić w niezależnej analizie komponentów, chcę zautomatyzować proces selekcji. Myślę, że rozsądnym kryterium może być liczba, która minimalizuje globalne dowody korelacji między obliczonymi składnikami. Oto pseudokod...