Jakie przedmioty matematyczne zaproponowałbyś, aby przygotować się do eksploracji danych i uczenia maszynowego?

30

Staram się stworzyć samokierujący program matematyki, aby przygotować się do uczenia się eksploracji danych i uczenia maszynowego. Jest to motywowane przez rozpoczęcie klasy uczenia maszynowego Andrew Ng na Coursera i odczuwanie, że przed kontynuowaniem muszę poprawić swoje umiejętności matematyczne. Niedawno ukończyłem studia, więc moja algebra i statystyki (szczególnie z nauk politycznych / psychologii) są zardzewiałe.

Odpowiedzi w wątku Czy silne podstawy matematyki są w całości wymagane dla ML? sugeruj tylko książki lub zajęcia bezpośrednio związane z uczeniem maszynowym; Zajrzałem już do niektórych z tych klas i książek i nie wiem dokładnie, jaką matematykę badam (na przykład: jakie pola adresowe matematyki wyprowadzają równanie „minimalizacji funkcji kosztów”?). Drugi sugerowany wątek ( Umiejętności i zajęcia potrzebne do bycia analitykiem danych ) wymienia tylko szerokie kategorie umiejętności potrzebne do analizy danych. Wątek Wprowadzenie do statystyki dla matematyków nie ma zastosowania, ponieważ nie mam jeszcze dyplomu z matematyki; podobny wątek Matematyk chce wiedzy równoważnej do stopnia statystyki jakości ma niewiarygodną listę książek o statystykach, ale znów patrzę na matematykę od zardzewiałego wspomnienia algebry i stamtąd.

Więc dla tych, którzy pracują w uczeniu maszynowym i eksploracji danych, jakie dziedziny matematyki uważasz za niezbędne do wykonywania swojej pracy? Jakie przedmioty matematyczne zaproponowałbyś, aby przygotować się do eksploracji danych i uczenia maszynowego oraz w jakiej kolejności? Oto lista i kolejność, którą mam do tej pory:

  • Algebra
  • Rachunek wstępny
  • Rachunek różniczkowy
  • Algebra liniowa
  • Prawdopodobieństwo
  • Statystyka (wiele różnych sub-pól tutaj, ale nie wiem, jak je rozdzielić)

Jeśli chodzi o eksplorację danych i uczenie maszynowe, dzięki mojej obecnej pracy mam dostęp do rejestrów dotyczących aktywności na stronie internetowej / aplikacji, transakcji klientów / subskrypcji oraz danych dotyczących nieruchomości (zarówno statycznych, jak i szeregów czasowych). Mam nadzieję na zastosowanie eksploracji danych i uczenia maszynowego w tych zestawach danych.

Dziękuję Ci!

EDYTOWAĆ:

Ze względu na potomstwo chciałem podzielić się pomocną oceną matematyczną z Intro do uczenia maszynowego Geoffreya Gordona / Alexa Smoli na CMU.

mierzy wszystkie rzeczy
źródło
3
Jeśli chodzi o warunki wstępne dotyczące zajęć Coursera, informacje te powinny być dostępne gdzieś w ich materiałach. Poza ich klasami / bardziej ogólnie, pytanie, jakiej matematyki potrzebujesz do stat / ML / DM, uderza mnie jako duplikat. W CV znajduje się kilka wątków, które obejmują ten materiał, w tym: jest to silne tło matematyki, wymagane do ml i umiejętności potrzebne do pracy analityka danych ( być może między innymi).
Gung - Przywróć Monikę
1
Przejrzyj te wątki, wątki, które są do nich powiązane jako ściśle powiązane, i być może przeszukaj witrynę. Jeśli po przeczytaniu nadal masz pytanie, wróć tutaj i edytuj to Q, aby uczynić je bardziej wyrazistym / sprecyzuj, co jeszcze musisz wiedzieć, że nie zostało omówione gdzie indziej.
Gung - Przywróć Monikę

Odpowiedzi:

15

Sugestie @gung z pewnością warte są sprawdzenia. Po ukończeniu kursu myślę, że twoja lista to dobry początek. Kilka komentarzy:

  1. Algebra liniowa i algebra macierzowa są tym samym, więc porzuć to drugie.
  2. zxyzxrezrex
  3. w rachunku różniczkowym nie potrzebujesz niczego poza podstawową integracją (a może nawet tego). To szczęście, ponieważ integracja jest trudna.
  4. dodaj podstawową optymalizację, tj. znajdowanie maksimum lub minimum funkcji, zwykle funkcji więcej niż jednej zmiennej. Niezbędna jest przynajmniej ocena spadku gradientu.
  5. pod względem trudności prawdopodobnie chcesz być gdzieś między początkiem a końcem pierwszego roku studiów licencjackich.
  6. postaraj się przeczytać podstawowe teksty prawdopodobieństwa i statystyki, w Internecie lub w inny sposób, ale nie martw się zbytnio (podstawowa matematyka jest warunkiem koniecznym do zrozumienia prawdopodobieństwa i statystyki). Jeśli zrobisz kilka kursów, na przykład ten, który sugerujesz, dowiesz się, czego musisz się nauczyć i gdzie leżą twoje zainteresowania. Jedną z rzeczy, których nie chcesz robić, przynajmniej na początku, jest poświęcenie dużej ilości czasu na naukę testowania hipotez. Wolisz raczej zrozumieć podstawowe statystyki - zmienne losowe, rozkłady prawdopodobieństwa (PFD, CDF), statystyki opisowe - a następnie spróbować zrozumieć regresję.
TooTone
źródło
5

Na tym forum znajduje się kilka doskonałych wątków - w tym TEN JEDEN, który uważam za szczególnie pomocny w zakresie opracowania koncepcyjnego szkicu ważnych umiejętności w pracy z nauką danych.

Jak wspomniano powyżej, dostępnych jest wiele kursów online. Na przykład Coursera ma teraz specjalizację Data Science z szeregiem kursów, które prawdopodobnie obejmowałyby niektóre narzędzia potrzebne do pracy.

GregF
źródło
3

Jeśli chcesz skupić się na uczeniu maszynowym / eksploracji danych, zdecydowanie zachęcam do optymalizacji / algebry liniowej / statystyki i prawdopodobieństwa. Tutaj lista książek dla prawdopodobieństwa. Mam nadzieję, że to pomaga.

brokuły
źródło
3

Jeśli chodzi o szczotkowanie bardzo podstawowych umiejętności matematycznych, korzystam z tych książek:

Elementy matematyki dla ekonomii i finansów. Mavron, Vassilis C., Phillips, Timothy N Książka ta obejmuje podstawowe umiejętności matematyczne (odejmowanie dodatków), częściowe zróżnicowanie, integrację, macierz i wyznaczniki oraz mały rozdział na temat optymalizacji, a także równania różniczkowego. Jest skierowany do ekonomii i finansów, ale jest to mała książka, sekwencja rozdziałów odpowiada mojej potrzebie i jest dla mnie łatwa do przeczytania.

Analiza statystyczna: Microsoft Excel 2010. Conrad Carlberg Obejmuje podstawową analizę statystyczną, regresję wielokrotną i analizę kowariancji, i korzysta z programu Excel.

Odkrywanie statystyk za pomocą R. Andy Field, Jeremy Miles, Zoë Field. Jeszcze go nie przeczytałem. Używa R.

Elementarna algebra liniowa. Ron Larson, David C. Falvo.

Metody macierzowe: stosowana algebra liniowa Richard Bronson, Gabriel B. Costa. obejmuje elementarną algebrę liniową i rachunek macierzowy

Są to podstawowe książki matematyczne, których używam do wyszukiwania danych / uczenia maszynowego

Mam nadzieję że to pomoże

Iwan
źródło
3

Istnieje dość dużo istotnych zasobów wymienionych (i niesklasyfikowane) tutaj , w tak zwanych „open source danych Masters nauka”.

W szczególności dla matematyki wymieniają:

  1. Algebra liniowa i programowanie
  2. Statystyka
  3. Równania różniczkowe i rachunek różniczkowy

Dość ogólne rekomendacje, choć zawierają kilka podręczników, które mogą okazać się przydatne.

anthr
źródło
2
  • Prawdopodobieństwo i statystyki są niezbędne. Niektóre słowa kluczowe to test hipotez, wielowymiarowy rozkład normalny, wnioskowanie bayesowskie (prawdopodobieństwo wspólne, prawdopodobieństwo warunkowe), średnia, wariancja, kowariancja, dywergencja Kullbacka-Leiblera, ...
  • Podstawowa algebra liniowa jest niezbędna do uczenia maszynowego. Tematy, których można się nauczyć, to rozkład własny i rozkład wartości osobliwych. (Oczywiście powinieneś wiedzieć, jak obliczyć produkt macierzowy).
  • Jak już wspomniano TooTone: optymalizacja jest ważna. Powinieneś wiedzieć, czym jest opadanie gradientu, a może rzucić okiem na metodę Newtona, Levenberg-Marquardt, Broyden-Fletcher-Goldfarb-Shanno.
  • Rachunek różniczkowy nie jest tak ważny, ale warto wiedzieć, jak obliczyć częściowe pochodne funkcji (macierz Jacobiego, macierz Hessego ...) i powinieneś wiedzieć, czym jest całka.
alfa
źródło
0

Algebra liniowa, statystyki, rachunek całkowy. Myślę, że możesz się ich nauczyć w tandemie w / ML - lub nawet po podstawach. Kursy / książki dla początkujących świetnie sprawdzają się w rozdziałach dotyczących podstaw matematyki, a nauczysz się podstaw matematyki podczas nauki ML. Zrobiłem odcinek podcastu na temat matematyki potrzebnej do uczenia maszynowego, a zasoby do ich nauczenia: Machine Learning Guide # 8

lefnire
źródło
0

Przed rozpoczęciem jakiegokolwiek kursu uczenia maszynowego należy przejść następujący kurs matematyki. Nie próbuj też kopać za jednym razem. Naucz się podstawowych pojęć, a następnie ponownie popraw swoje umiejętności matematyczne i powtórz:

Tematy matematyki są następujące: -

  • Algebra liniowa
  • Prawdopodobieństwo
  • Podstawowy rachunek różniczkowy
  • Maksima i minima funkcji
Nikhil Agrawal
źródło