Statystyki i duże zbiory danych

19
Materiały do ​​nauki tworzenia wizualizacji danych?

Chciałbym dowiedzieć się, jak tworzyć wizualizacje widoczne na stronie http://flowingdata.com i informationisbeautiful. EDYCJA: Znaczenie, wizualizacje, które są interesujące same w sobie - trochę jak grafika NY Times, w przeciwieństwie do szybkiego czegoś na raport. Jakiego rodzaju narzędzia są...

19
Miary złożoności modelu

Jak możemy porównać złożoność dwóch modeli o tej samej liczbie parametrów? Edytuj 09/19 : Aby wyjaśnić, złożoność modelu jest miarą tego, jak trudno jest uczyć się na podstawie ograniczonych danych. Gdy dwa modele równie dobrze pasują do istniejących danych, model o mniejszej złożoności da...

19
Oznacza przesuwane okno w R.

Mam wektor wartości, które chciałbym zgłosić średnią w oknach wzdłuż mniejszego slajdu. Na przykład dla wektora następujących wartości: 4, 5, 7, 3, 9, 8 Okno o rozmiarze 3 i slajd 2 wykonałyby następujące czynności: (4+5+7)/3 = 5.33 (7+3+9)/3 = 6.33 (9+8)/3 = 5.67 I zwróć wektor tych...

19
Algorytm wstecznej propagacji

Mam lekką dezorientację na wstecznej propagacji błędów algorytmu stosowanego w perceptronu wielowarstwowego (MLP). Błąd jest regulowana przez funkcję kosztów. W wstecznej propagacji błędów, staramy się dostosować ciężar warstw ukrytych. Błąd wyjściowy, który rozumiem, to znaczy e = d - y[Bez...

19
Kalibracja klasyfikatora podwyższonego klasy

Przeczytałem artykuł Alexandru Niculescu-Mizila i Richa Caruany „ Uzyskiwanie skalibrowanych prawdopodobieństw od wzmocnienia ” i dyskusję w tym wątku. Jednak nadal mam problemy ze zrozumieniem i wdrożeniem logistyki lub skalowania Platta, aby skalibrować moc wyjściową mojego wieloklasowego...