Statystyki i duże zbiory danych

17
Jak dodać komponent okresowy do modelu regresji liniowej?

Mam pewne dane o skumulowanej częstotliwości. Linia wygląda tak, jakby bardzo dobrze pasowała do danych, ale w linii występuje cykliczne / okresowe poruszenie. Chciałbym oszacować, kiedy skumulowana częstotliwość osiągnie pewną wartość c . Kiedy wykreślam wartości resztkowe względem dopasowanych,...

17
Nieparametryczna analiza bayesowska w R.

Szukam dobrego samouczka na temat grupowania danych przy Rużyciu hierarchicznego procesu dirichleta (HDP) (jednej z najnowszych i popularnych nieparametrycznych metod bayesowskich). Istnieje DPpackage(IMHO, najbardziej wszechstronny ze wszystkich dostępnych) w Rnieparametrycznej analizie...

17
Jak interpretować Exp (B) w regresji Coxa?

Jestem studentem medycyny próbującym zrozumieć statystyki (!) - więc proszę, bądź delikatny! ;) Piszę esej zawierający sporo analizy statystycznej, w tym analizy przeżycia (regresja Kaplana-Meiera, Log-Ranka i regresji Coxa). Przeprowadziłem regresję Coxa na moich danych, próbując dowiedzieć się,...

17
Miara jakości grupowania

Mam algorytm grupowania (nie k-średnich) z parametrem wejściowym (liczba klastrów). Po wykonaniu grupowanie Chciałbym zaczerpnąć ilościową miarą jakości tego grupowania. Algorytm klastrów ma jedną istotną właściwość. Dla , jeśli karmię punktów danych bez istotnej różnicy między nimi do tego...

17
krajobraz statystyczne

Czy ktoś napisał krótką ankietę na temat różnych podejść do statystyki? Do pierwszego przybliżenia masz statystyki częste i bayesowskie. Ale jeśli spojrzeć bliżej masz też inne podejścia jak likelihoodist i empirycznych Bayesa. A potem masz podziały w grupach, takie jak subiektywny Bayes obiektywny...

17
Regresja logistyczna i zestawu danych Struktura

Mam nadzieję, że mogę zadać to pytanie w prawidłowy sposób. Mam dostęp do play-by-play danych, więc jest to większy problem z najlepszym podejściem i konstruowania dane poprawnie. Co szukam zrobić to obliczyć prawdopodobieństwo wygranej jest NHL gra dany wynik i czas pozostały do ​​rozporządzenia....

17
Czy mediana jest bardziej sprawiedliwa niż średnia?

Niedawno przeczytałem radę, że powinieneś raczej używać mediany, a nie oznaczać eliminacji wartości odstających. Przykład: następujący artykuł http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/ ma w tej chwili 16 opinii: review= c(5, 5, 5, 5,...

17
Czy „każda niebieska osoba w koszulce” jest systematyczną próbą?

Uczę klasę statystyk wprowadzających i przeglądałem rodzaje próbkowania, w tym próbkowanie systematyczne, w którym próbkuje się każdą k-tą osobę lub obiekt. Student zapytał, czy pobieranie próbek od każdej osoby o określonej charakterystyce osiągnęłoby to samo. Na przykład, czy pobieranie...