Statystyki i duże zbiory danych

9
Określenie największego współpracownika w grupie

Nie znam się na statystykach, więc trzymaj się mnie. Powiedzmy, że mam zestaw 1000 pracowników. Chcę dowiedzieć się, kto jest najcięższym pracownikiem, ale mogę tylko zmierzyć ilość pracy wykonywanej w grupach 1-100 w ciągu godziny pracy. Zakładając, że każdy pracownik zawsze wykonuje taką samą...

9
Rozkłady na podzbiory ?

Zastanawiam się, czy istnieją jakieś standardowe rozkłady na podzbiorach liczb całkowitych . Równolegle możemy to wyrazić jako rozkład na wektor długości wyników binarnych, np. Jeśli to odpowiada wektorowi .{1,2,...,J}{1,2,...,J}\{1, 2, ..., J\}JJJJ=5J=5J = 5{1,3,5}{1,3,5}\{1, 3,...

9
Box Cox Transforms do regresji

Próbuję dopasować model liniowy do niektórych danych za pomocą tylko jednego predyktora (powiedzmy (x, y)). Dane są takie, że dla małych wartości x wartości y ściśle dopasowują się do linii prostej, jednak wraz ze wzrostem wartości x wartości y stają się bardziej zmienne. Oto przykład takich danych...

9
Regresja SVM z danymi podłużnymi

Mam około 500 zmiennych na pacjenta, każda zmienna ma jedną stałą wartość i jest mierzona w trzech różnych punktach czasowych (po 2 miesiącach i po 1 roku). Za pomocą regresji chciałbym przewidzieć wynik leczenia nowych pacjentów. Czy można stosować regresję SVM z takimi danymi...