Statystyki i duże zbiory danych

22
Jak grupować szeregi czasowe?

Mam pytanie dotyczące analizy skupień. Istnieje 3000 firm, które muszą być grupowane w zależności od zużycia energii przez 5 lat. Każda firma ma wartości dla każdej godziny przez 5 lat. Chciałbym dowiedzieć się, czy niektóre firmy mają taki sam wzorzec mocy użytkowej w danym okresie. Wyniki należy...

22
Dlaczego PCA danych za pomocą SVD danych?

To pytanie dotyczy skutecznego sposobu obliczania głównych składników. Wiele tekstów na temat liniowego PCA opowiada się za dekompozycją danych w liczbie pojedynczej . Oznacza to, że jeśli mamy dane i chcemy zastąpić zmienne (jego kolumny ) głównymi składnikami, wykonujemy SVD: , wartości...

22
Grupowanie macierzy binarnej

Mam pół-małą macierz funkcji binarnych o wymiarze 250k x 100. Każdy wiersz to użytkownik, a kolumny to binarne „tagi” niektórych zachowań użytkownika, np. „Like_cats”. user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 C 1 0 0 1 0 Chciałbym dopasować użytkowników do 5-10...

22
Czego się nauczyć po Caselli i Berger?

Jestem studentem matematyki z niewielkim doświadczeniem w matematyce stosowanej. Od ostatniej jesieni chodzę na zajęcia z książki Caselli i Bergera i ukończyłem setki (230+) stron z problemami z ćwiczeniami w książce. W tej chwili jestem w rozdziale 10. Ponieważ jednak nie studiowałem statystyki...