Statystyki i duże zbiory danych

29
K-fold vs. walidacja krzyżowa Monte Carlo

Próbuję poznać różne metody walidacji krzyżowej, przede wszystkim z zamiarem zastosowania do nadzorowanych technik analizy wielowymiarowej. Dwa, z którymi się spotkałem, to techniki K-fold i Monte Carlo. Czytałem, że K-fold jest odmianą Monte Carlo, ale nie jestem pewien, czy w pełni rozumiem, co...

29
Różnica między SVM a perceptronem

Jestem trochę zmieszany z różnicą między SVM a perceptronem. Pozwólcie, że spróbuję podsumować moje rozumienie tutaj i proszę o poprawienie tam, gdzie się mylę i uzupełnienie tego, co przegapiłem. Perceptron nie próbuje zoptymalizować „odległości” separacji. Tak długo, jak znajdzie...

29
Obszar pod krzywą ROC a ogólna dokładność

Trochę się mylę co do pola pod krzywą (AUC) ROC i ogólnej dokładności. Czy AUC będzie proporcjonalne do ogólnej dokładności? Innymi słowy, kiedy będziemy mieli większą ogólną dokładność, czy na pewno uzyskamy większy AUC? Czy są z definicji dodatnio skorelowane? Jeśli są pozytywnie skorelowane,...

29
Rozkłady gamma a logarytmiczne

Mam obserwowany eksperymentalnie rozkład, który wygląda bardzo podobnie do rozkładu gamma lub logarytmicznego. Czytałem, że rozkład logarytmiczny jest maksymalnym rozkładem prawdopodobieństwa entropii dla wariantu losowego dla którego ustalona jest średnia i wariancja . Czy rozkład gamma ma podobne...