Chciałbym nauczyć się teorii prawdopodobieństwa, teorii miary i wreszcie uczenia maszynowego. Gdzie zaczynam? [Zamknięte]

9

Chciałbym nauczyć się teorii prawdopodobieństwa, teorii miary i wreszcie uczenia maszynowego. Moim ostatecznym celem jest wykorzystanie uczenia maszynowego w oprogramowaniu.

Studiowałem rachunek różniczkowy i bardzo podstawowe prawdopodobieństwo na studiach, ale to już wszystko. Czy znasz jakieś kursy online lub książki, których mógłbym użyć, aby dowiedzieć się na te tematy. Znalazłem wiele zasobów w Internecie, ale wszystkie wydają się być przeznaczone dla ekspertów. Wiem, że zajmie to trochę czasu, ale od czego zacząć, jeśli chcę uczyć się od samego początku?

Max
źródło
2
Te trzy pytania wydają się całkiem dobrze uwzględnione w duplikatach wymienionych przez @General.
whuber

Odpowiedzi:

13

Wydaje mi się, że istnieją dla ciebie dwa bardzo dobre i popularne odniesienia (zacząłem też od tych posiadających doświadczenie w dziedzinie nauk aktuarialnych):

  1. Wprowadzenie do nauki statystycznej (z zastosowaniem w języku R) autorstwa Garetha Jamesa, Danieli Witten, Trevora Hastiego, Roberta Tibshirani. To jest swobodnie dostępny na stronie, bardzo wszechstronny i łatwy do zrozumienia z praktyczna przykładów. Możesz zacząć uczyć się wielu rzeczy, nawet bez bardzo silnego tła statystycznego, to odniesienie jest dobre dla różnych profili i zawiera odpowiednią liczbę popularnych algorytmów wraz z jego implementacją w R bez zagłębiania się w szczegóły matematyczne.

  2. Elementy uczenia statystycznego Trevora Hastiego, Roberta Tibshirani, Jerome Friedmana . W porównaniu do pierwszego, ta książka zagłębia się w aspekty matematyczne, jeśli chcesz dalej badać poszczególne algorytmy, które są dla Ciebie przydatne. (jest również bezpłatny )

I oczywiście Cross Validated jest dla mnie jednym z najlepszych źródeł, w których możesz nauczyć się wielu rzeczy: najlepszych praktyk, statystycznego nieporozumienia i niewłaściwego użycia i wielu innych. Po kilku latach nauki w szkołach / uniwersytetach, a także uczenia się seft, odkryłem, że moja wiedza jest zbyt ograniczona, kiedy po raz pierwszy poszedłem do Cross Validated. Nadal jeżdżę tu codziennie od pierwszej wizyty i tyle się uczę.

Metariat
źródło
3
Jeśli podobają Ci się te referencje, miej oko na kursy online Stanford. T. Hastie i R. Tibshirani często prowadzą kursy związane z uczeniem maszynowym.
Marcel10,
Przeczytałem około 20% Wstępu do nauki statystycznej z aplikacją w języku R. Właśnie tego szukałem. Świetna książka i dość łatwa do zrozumienia. Dziękuję bardzo! :)
Maks.
6

Oto kilka bezpłatnych kursów online, o których słyszałem, że są wysoce zalecane:

  • http://projects.iq.harvard.edu/stat110/home (W zależności od aktualnego komfortu z teorią prawdopodobieństwa. Kurs dr Blitzsteina stał się bardzo popularny na Harvardzie nawet dla tych, którzy nie byli zainteresowani statystykami / prawdopodobieństwem. Oglądałem kilka wykładów do mojej recenzji i znalazłem je bardzo pomocne).
  • https://www.coursera.org/learn/machine-learning (To jest aktualna wersja jednego z pierwszych ogromnych kursów online Stanforda autorstwa Andrew Ng, który został współzałożycielem Coursera. Chciałem wziąć udział w tym kursie , ale nie miałem czasu.)
ukłucie
źródło
5

nie potrzebujesz teorii miary. Teoria miar jest używana przez matematyków do uzasadnienia innych procedur matematycznych, np. Określania granic przybliżeń całek. Większość inżynierów nie studiowałaby teorii miary, po prostu wykorzystałaby wyniki. Wiedza matematyczna wymagana do ML jest z grubsza scharakteryzowana przez możliwość zintegrowania wielowymiarowego Gaussa. Jeśli jesteś tego pewien, prawdopodobnie potrzebujesz niezbędnego rachunku wielowymiarowego, algebry liniowej i teorii prawdopodobieństwa.

Poleciłbym Think Stats Allena Downeya - którego celem jest nauczenie programistów prawdopodobieństwa / statystyki. Chodzi o wykorzystanie wiedzy programistycznej do przeprowadzania symulacji, a tym samym zrozumienia teorii prawdopodobieństwa / metod statystycznych. Allen Downey Blog (napisał inne) Statystyki myśli (za darmo) pdf )

seanv507
źródło
4
Teoria miar jest przydatna w procesach stochastycznych w czasie ciągłym. W rzeczywistości każdy artykuł w ciągłym finansowaniu w czasie (wycena aktywów) zaczyna się od następującej modlitwy(fa,Ω,P.)
Aksakal
@Aksakal moim zdaniem nie tylko ciągłe procesy!
Metariat
5

Ponieważ interesujesz się uczeniem maszynowym, pominąłbym prawdopodobieństwo i mesaure i wskoczyłem prosto do ML. Cours e Andrew's Ng to świetne miejsce na rozpoczęcie. Możesz dosłownie ukończyć go w dwa tygodnie.

Baw się tym, czego nauczyłeś się przez kilka tygodni, a następnie wróć do korzeni i przestudiuj pewne prawdopodobieństwa. Jeśli jesteś inżynierem, zastanawiam się, jak udało ci się przejść na studia. Był to wymagany kurs inżynierii. W każdym razie możesz to nadrobić, biorąc udział w kursie MIT OCW tutaj .

Nie sądzę, że potrzebujesz teorii miary. Nikt nie potrzebuje teorii miary. Ci, którzy to robią, nie przyjadą tutaj, aby zapytać, ponieważ ich doradca powie im, który kurs wybrać. Jeśli nie masz doradcy, to na pewno go nie potrzebujesz. Tautologia, ale prawdziwa.

W teorii miary jest to, że nie można się jej nauczyć poprzez „łatwą lekturę”. Musisz robić ćwiczenia i problemy, po prostu zrób to ciężko. Moim zdaniem jest to praktycznie niemożliwe poza salą lekcyjną. Najlepszą opcją jest wzięcie lekcji w miejscowym college'u, jeśli oferują taką możliwość. Czasami kurs prawdopodobieństwa na poziomie doktora wykona pomiar i prawdopodobieństwa w jednej klasie, co jest prawdopodobnie najlepszą ofertą. Nie polecałbym wzięcia udziału w zajęciach z teorii czystych miar w dziale matematyki, chyba że naprawdę chcesz się torturować, choć w końcu byłbyś bardzo zadowolony.

Aksakal
źródło
2

Jeśli chodzi o uczenie maszynowe, myślę, że uczenie maszynowe: sztuka i nauka algorytmów, które czynią sens danych Petera Flacha, może być dobrym źródłem na początek. Daje ogólne wprowadzenie do uczenia maszynowego z intuicyjnymi przykładami i jest odpowiedni dla początkujących. Podoba mi się ta książka szczególnie ze względu na ostatni rozdział, który dotyczy eksperymentów uczenia maszynowego. Podczas uczenia się o uczeniu maszynowym poznanie różnych modeli nie wystarczy i należy umieć porównywać różne algorytmy uczenia maszynowego. Myślę, że ta książka ułatwiła zrozumienie, jak porównać te algorytmy. Slajdy z wykładami można znaleźć tutaj .

użytkownik1219801
źródło
2

Aby dodać do powyższych doskonałych sugestii, powiedziałbym, że jeśli chcesz dobrze poznać bardziej podstawowe pojęcia dotyczące prawdopodobieństwa i statystyki, „Od algorytmów do wyników Z: probabilistyczne obliczenia w statystyce” jest doskonałym narzędziem do korzystania z komputerów do zrozumieć niektóre z najważniejszych pojęć początkujących / pośrednich w teorii prawdopodobieństwa i procesach stochastycznych. Będę również popierać „Wprowadzenie do uczenia statystycznego” lub „Elementy uczenia statystycznego” (ESL) jako wprowadzenie do uczenia maszynowego (ML). Myślę, że w szczególności ESL jest niesamowity, ale wymaga dużo bardziej matematycznego spojrzenia na koncepcje ML, więc jeśli uważasz, że jesteś „w porządku” w statystykach, możesz chcieć to przeczytać, gdy zdobędziesz więcej doświadczenie z ML.

Jeśli interesujesz się uczeniem maszynowym ze względu na zatrudnienie lub rozwiązywanie problemów, kluczowe jest zdobycie praktycznego doświadczenia. Zapoznaj się z kursami z zakresu informatyki / uczenia maszynowego. Andrew Ng robi niesamowite wprowadzenie do uczenia maszynowego w jego trakcie na Coursera tutaj . Sugeruję również pobranie niektórych zestawów danych i rozpoczęcie zabawy z nimi. Jeśli jeszcze tego nie zrobiłeś, pobierz R i RStudio (moim zdaniem, bardziej przyjazny dla początkujących niż Python lub Matlab) i zarejestruj się w Kaggle i zrób niektóre z ich problemów dla początkujących. Mają świetne instrukcje, dzięki którym możesz używać ML bez żadnego pojęcia, co się właściwie dzieje, ale daje to wyobrażenie o tym, jakie kroki należy podjąć, aby wdrożyć rozwiązanie ML.

Osobiście zachęciłbym do połączenia korzystania z narzędzi ML, tak naprawdę nie wiedząc, co robią (używając zestawów danych Kaggle lub podobnych); i uczenie się podstawowych pojęć, takich jak walidacja krzyżowa, dopasowanie, używanie macierzy pomieszania, różne miary tego, jak dobry jest model itp. Dla mnie ważniejsze jest wiedzieć, jak korzystać z algorytmów i wiedzieć, jak rozpoznać, kiedy wszystko działa. / nie działają, to znaczy zrozumieć, jak działają algorytmy.

Blue_vision
źródło