Statystyki i duże zbiory danych

10
Przypisywanie etykiet klas do klastrów k-oznacza

Mam bardzo podstawowe pytanie dotyczące grupowania. Po znalezieniu k klastrów wraz z ich centroidami, jak przejść do interpretacji klas punktów danych, które zgrupowałem (przypisując znaczące etykiety klas do każdego klastra). Nie mówię o walidacji znalezionych klastrów. Czy można to zrobić,...

10
Analiza linii czasu

Prowadzę badania związku między kolejnością narodzin danej osoby a późniejszym ryzykiem otyłości, wykorzystując dane z kilku rocznych kohort porodowych (np. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ). Kluczowym wyzwaniem jest to, że kolejność urodzeń jest powiązana z innymi cechami,...

10
Modele dyskretnych zagrożeń czasowych (cloglog) w R

Wydaje się, że survivalpakiet Rkoncentruje się na modelach ciągłego przetrwania w czasie. Jestem zainteresowany oszacowaniem dyskretnej wersji proporcjonalnego modelu hazardu w czasie, komplementarnego modelu log-log. Mam dość prosty model przetrwania z prostą cenzurą. Wiem, że jednym ze sposobów...