Statystyki i duże zbiory danych

12
średnie k || alias Scalable K-Means ++

Bahman Bahmani i in. wprowadzono k-średnich ||, która jest szybszą wersją k-średnich ++. Algorytm ten pochodzi ze strony 4 ich pracy , Bahmani, B., Moseley, B., Vattani, A., Kumar, R., i Vassilvitskii, S. (2012). Skalowalne k-średnie ++. Postępowanie z VLDB Endowment , 5 (7), 622-633. Niestety...

12
Kiedy MCMC jest przydatne?

Mam problem ze zrozumieniem, w której sytuacji podejście MCMC jest rzeczywiście przydatne. Przechodzę przez zabawkowy przykład z książki Kruschke „Doing Bayesian Data Analysis: A Tutorial with R and BUGS”. Do tej pory rozumiałem, że potrzebujemy rozkładu docelowego, który jest proporcjonalny do...

12
Wymiar VC modeli regresji

W serii wykładów Uczenie się z danych profesor wspomina, że ​​wymiar VC mierzy złożoność modelu na podstawie tego, ile punktów dany model może rozbić. Działa to więc doskonale w przypadku modeli klasyfikacji, w których można by powiedzieć z N punktów, jeśli klasyfikator jest w stanie skutecznie...