Statystyki i duże zbiory danych

11
Ocena przewidywalności szeregów czasowych

Załóżmy, że mam trochę ponad 20 000 miesięcznych szeregów czasowych od stycznia do 05 grudnia. Każdy z nich reprezentuje globalne dane dotyczące sprzedaży innego produktu. Co jeśli zamiast obliczać prognozy dla każdego z nich, chciałbym skoncentrować się tylko na niewielkiej liczbie produktów,...

11
Czym jest teraz Drosophila AI?

W połowie lat 60. XX wieku naukowcy nazywali szachy „ Drosophila AI”: podobnie jak mucha owocowa, gra w szachy była dostępna i stosunkowo prosty problem z eksperymentami, który jednak spowodował ważną wiedzę, bardziej złożone problemy. Teraz ludzie mówią, że „szachy to tylko problem wyszukiwania”,...

11
Automatyczny wybór funkcji do wykrywania anomalii

Jaki jest najlepszy sposób automatycznego wybierania funkcji do wykrywania anomalii? Zazwyczaj traktuję Wykrywanie Anomalii jako algorytm, w którym cechy są wybierane przez ludzkich ekspertów: liczy się zakres wyjściowy (jak w „nienormalnym wejściu - nienormalnym wyjściu”), więc nawet przy wielu...

11
Praktyczny samouczek PCA z danymi

Wyszukiwanie w Internecie samouczka PCA daje tysiące wyników (nawet wideo). Wiele samouczków jest bardzo dobrych. Ale nie jestem w stanie znaleźć żadnego praktycznego przykładu, w którym wyjaśniono PCA przy użyciu niektórych zestawów danych, których mogę użyć do demonstracji. Potrzebuję samouczka,...

11
Co to jest „Prior Information Unit”?

Czytałem Wagenmakers (2007) Praktyczne rozwiązanie wszechobecnego problemu wartości p . Intryguje mnie konwersja wartości BIC na czynniki i prawdopodobieństwa Bayesa. Jednak do tej pory nie rozumiem, czym dokładnie jest informacja o jednostce wcześniej . Byłbym wdzięczny za wyjaśnienia ze zdjęciami...