Statystyki i duże zbiory danych

11
Model klasyfikacyjny do przewidywania ocen filmów

Jestem trochę nowy w eksploracji danych i pracuję nad modelem klasyfikacyjnym do przewidywania ocen filmów. Zebrałem zestawy danych z IMDB i planuję użyć drzew decyzyjnych i podejść do najbliższego sąsiada dla mojego modelu. Chciałbym wiedzieć, które swobodnie dostępne narzędzie do eksploracji...

11
Losowy las na zgrupowanych danych

Używam losowego lasu na wielowymiarowych zgrupowanych danych (50 liczbowych zmiennych wejściowych), które mają strukturę hierachiczną. Dane zebrano przy 6 replikacjach w 30 pozycjach 70 różnych obiektów, co dało 12600 punktów danych, które nie są niezależne. Wygląda na to, że losowy las przesadza...

11
Rysowanie zdarzeń na osi czasu w R.

Czy istnieje biblioteka wykresów dla R, która mogłaby zamienić ramkę danych czasów rozpoczęcia i zatrzymania w wykres osi czasu podobny do następującego: Tylko oś Y oznacza, że ​​kumuluje się ze współbieżnością, ale nie zawsze reprezentuje współbieżność (patrz przerwa pośrodku). Każde szare pole...

11
Zagadka fryzjera

Moja fryzjerka Stacey zawsze robi radosną minę, ale często stresuje ją zarządzanie czasem. Dzisiaj Stacey była spóźniona na moje spotkanie i bardzo przepraszała. Podczas strzyżenia zastanawiałem się: jak długo powinny trwać jej standardowe spotkania? (jeśli preferencje klienta dotyczące czystych...