Statystyki i duże zbiory danych

37
Analiza szeregów czasowych z walidacją krzyżową

Korzystałem z pakietu Caret w R do budowania modeli predykcyjnych do klasyfikacji i regresji. Caret zapewnia zunifikowany interfejs do dostrajania hiperparametrów modelu poprzez weryfikację krzyżową lub wiązanie rozruchu. Na przykład, jeśli budujesz prosty model „najbliższych sąsiadów” do celów...

37
Jakie są najbardziej przydatne źródła danych ekonomicznych?

Podczas prowadzenia badań w dziedzinie ekonomii często trzeba zweryfikować teoretyczne wnioski dotyczące rzeczywistych danych. Jakie są wiarygodne źródła danych, z których można korzystać i które można cytować? Interesują mnie głównie źródła, które dostarczają różnych danych statystycznych, takich...

37
SVM, Nadmierne dopasowanie, przekleństwo wymiarowości

Mój zestaw danych jest niewielki (120 próbek), jednak liczba funkcji jest duża i waha się od (1000-200 000). Chociaż dokonuję wyboru funkcji, aby wybrać podzbiór funkcji, może się ona nadal nadpisywać. Moje pierwsze pytanie brzmi: w jaki sposób SVM radzi sobie z nadmiernym dopasowaniem, jeśli w...