Statystyki i duże zbiory danych

9
Porady dla absolwentów statystyki

W tym roku rozpocząłem doktorat z statystyki i szukam twoich najlepszych praktyk, porad i (meta-porad) dotyczących tego, jak się rozwijać i zostać dobrym naukowcem w dziedzinie statystyki / ML. Ogólne przemyślenia i linki są mile widziane, ale aby rozpocząć grę, oto kilka pytań zebranych ze...

9
Jak dopasować regresję, taką jak in R?

Mam pewne dane szeregów czasowych, w których mierzoną zmienną są dyskretne dodatnie liczby całkowite (liczby). Chcę sprawdzić, czy z czasem (lub nie) występuje trend wzrostowy. Zmienna niezależna (x) jest w zakresie 0-500, a zmienna zależna (y) jest w zakresie 0-8. Myślałem, że odpowiem na to,...

9
Kiedy wybrać PCA vs. LSA / LSI

Pytanie: Czy istnieją jakieś ogólne wytyczne dotyczące charakterystyki danych wejściowych, które można wykorzystać do podjęcia decyzji między zastosowaniem PCA a LSA / LSI? Krótkie streszczenie PCA vs. LSA / LSI: Zasada analizy składowej (PCA) i analizy utajonej semantycznej (LSA) lub utajonej...

9
Jaka jest różnica między GLM a GEE?

Jaka jest różnica między modelem GLM (regresja logistyczna) ze zmienną odpowiedzi binarnej, która obejmuje podmiot i czas jako współzmienne, a analogicznym modelem GEE, który uwzględnia korelację między pomiarami w wielu punktach czasowych? Mój GLM wygląda następująco: Y(binary) ~ A +...

9
Filtr cząstek stałych w R - przykład trywialnego kodu

Szukam prostego przykładu kodu, w jaki sposób uruchomić filtr cząstek w R. Wydaje się, że pakiet pomp obsługuje bit matematyki w przestrzeni stanów, ale przykłady są nieco trudne do zaprogramowania dla prostego programisty OO, takiego jak ja, szczególnie jak załadować obserwowane dane do obiektu...