Statystyki i duże zbiory danych

13
Standardowa miara zlepienia?

Mam dużo danych i chcę zrobić coś, co wydaje się bardzo proste. W tym dużym zestawie danych interesuje mnie, jak bardzo konkretny element zlepia się ze sobą. Powiedzmy, że moje dane są uporządkowanym zestawem w następujący sposób: {A, C, B, D, A, Z, T, C ...}. Powiedzmy, że chcę wiedzieć, czy...

13
Szacowanie odsetków jako zmiennej zależnej w regresji

Mam procentowe stopnie studentów na 38 egzaminach jako zmienną zależną w moim badaniu. Procent rangi jest obliczany na podstawie (rangi studenta / liczby studentów na egzaminie). Ta zmienna zależna ma prawie jednolity rozkład i chcę oszacować wpływ niektórych zmiennych na zmienną zależną. Jakiego...

13
Odpowiednie techniki grupowania danych czasowych?

Mam dane czasowe częstotliwości aktywności. Chcę zidentyfikować klastry w danych, które wskazują różne okresy o podobnych poziomach aktywności. Idealnie chcę zidentyfikować klastry bez określania liczby klastrów a priori. Jakie są odpowiednie techniki klastrowania? Jeśli moje pytanie nie zawiera...

13
Wyprowadzanie negentropy. Utknąć

Pytanie to jest więc nieco związane, ale starałem się, aby było to jak najbardziej proste. Cel: Krótko mówiąc, istnieje pochodna negentropii, która nie obejmuje kumulantów wyższego rzędu, i próbuję zrozumieć, w jaki sposób została wyprowadzona. Tło: (Rozumiem to wszystko) Sam studiuję książkę...

13
Problem optymalizacji

Mój przyjaciel sprzedaje kkk modeli mikserów. Niektóre blendery są bardzo proste i tanie, inne są bardzo wyrafinowane i droższe. Jego dane obejmują, dla każdego miesiąca, ceny każdego miksera (które są przez niego ustalone) oraz liczbę sprzedanych jednostek dla każdego modelu. Aby ustanowić...

13
Nieujemna implementacja lasso w R.

Szukam jakiegoś open source lub istniejącej biblioteki, której mogę użyć. O ile mówię, pakiet glmnet nie jest łatwo rozszerzalny, aby objąć przypadek nieujemny. Mogę się mylić, każdy z wszelkimi pomysłami bardzo cenionymi. Przez nieujemne rozumiem, że wszystkie współczynniki są ograniczone do...

13
regresja poissona a regresja logistyczna

Mam grupę pacjentów z różną długością okresu obserwacji. Do tej pory pomijam aspekt czasowy i po prostu muszę wymodelować wynikową chorobę / brak choroby. W tych badaniach zwykle przeprowadzam regresję logistyczną, ale inny mój kolega zapytał, czy regresja Poissona byłaby równie odpowiednia. Nie...