Jestem inżynierem informatyki bez doświadczenia w statystyce i zaawansowanej matematyce.
Studiuję książkę Python Machine Learning autorstwa Raschki i Mirjalili, ale kiedy próbowałem zrozumieć matematykę uczenia maszynowego, nie byłem w stanie zrozumieć wspaniałej książki, którą znajomy sugeruje mi Elementy uczenia statystycznego .
Czy znasz jakieś łatwiejsze statystyki i książki matematyczne do uczenia maszynowego? Jeśli nie, jak mam się przenieść?
Odpowiedzi:
Chociaż potrzebujesz książki, polecam odpowiednio następujące kursy, aby zrozumieć statystyki, które są używane do uczenia maszynowego i innych zadań w informatyce. Są wolni.
Jeśli chcę polecić książkę, polecam następującą książkę, która jest bezpłatna na licencji CC . Ma ładne przykłady i jest bardzo praktyczne; ponadto zawiera wiele kodów, które pomagają poczuć statystyki na przykładach z prawdziwego świata.
Pomyśl o Python Allen B. Downey
Podręcznik nauki o języku Python
Pomocny może być również następujący link:
źródło
Wprowadzenie do algebry liniowej https://math.mit.edu/~gs/linearalgebra/ to dobry punkt wyjścia. Upewnij się, że znasz się na teorii prawdopodobieństwa, algebrze liniowej i statystyce. Bardzo dogłębna wiedza może nie być konieczna, ale wymagana jest dobra wiedza.
źródło
Przed ukończeniem studiów magisterskich w usłudze analitycznej moi seniorzy zalecili mi przejrzenie tych kilku książek, aby dowiedzieć się więcej na temat uczenia maszynowego i statystyki.
Mianowicie:
Jeśli nie możesz znaleźć tych książek online, daj mi znać, że udostępni link, mam je na dysku. Te książki pomogły mi zrozumieć podstawy statystyk z przykładami objaśnionymi w sposób laicki.
Jeśli szukasz kursów online, daj mi znać, że mogę zasugerować kilka dobrych kursów (większość z nich jest darmowa).
źródło
Nie mogę powiedzieć z twojego pytania, jak jesteś biegły w matematyce lub gdzie kończysz naukę. Zakładam, że skoro jesteś inżynierem oprogramowania komputerowego, znasz algebrę, geometrię i być może rachunek różniczkowy.
Polecam rozpocząć naukę od czytania statystyk i rozumienia takich pojęć, jak opisy, eksploracyjna analiza danych, korelacja, rozkłady i tak dalej. Widzę, że wolisz książki niż filmy, więc spotkamy się w połowie drogi i dam ci kilka książek online, a także książkę lub dwie, które możesz kupić w formie drukowanej.
Po pierwsze, poleciłbym internetowy program studiów Penn State w zakresie statystyki . Możesz przeglądać każdy z ich kursów, korzystając z menu po lewej stronie. Po wybraniu kursu przewiń w dół jego stronę internetową i kliknij link z napisem „notatki z kursu online”. Notatki z tych kursów są czymś więcej niż notatkami i są czytane jak pełne książki. Są bardzo pouczające. Sprawdź także internetowy program studiów licencjackich Penn State w statystyce , na wypadek, gdybyś znalazł coś na kursie dla absolwentów, który jest zbyt zaawansowany i potrzebujesz „prostszego” wyjaśnienia.
Po drugie, przejrzyj Handbook of Biological Statistics autorstwa John H. McDonald. Nie daj się zwieść tytułowi; ta książka jest doskonałym podkładem do statystyki i analizy danych, które można zastosować w każdej dziedzinie.
Po trzecie, przejrzyj The Little Handbook of Statistics autorstwa Gerarda Dallala. Ponownie, nie daj się zwieść tytułowi; ta książka to kolejny klejnot, który poprowadzi cię przez kilka ważnych podstaw statystyki.
Po czwarte, sprawdź książkę Think Stats Allena Downeya. Istnieje darmowa wersja online wcześniejszej edycji; najnowsza edycja, którą musisz kupić. Warto jednak, szczególnie jeśli pracujesz w Pythonie. W tej książce autor uczy statystyki i analizy danych przy użyciu Pythona do analizy zestawów danych w świecie rzeczywistym (zabawkowych). To naprawdę świetna książka do opracowania.
Na koniec sprawdź Data Science od zera Joela Grusa. Ta książka koncentruje się bardziej na analizie danych (zamiast podstaw statystyki) i kładzie większy nacisk na uczenie maszynowe i modelowanie. Wykorzystuje Python (i stos nauki danych w Pythonie), aby przeprowadzić Cię przez analizę i analizę predykcyjną zestawów danych w świecie rzeczywistym (zabawkowych). Kolejna świetna książka do opracowania.
źródło
Pamiętaj, że chociaż mam tytuł magistra statystyki stosowanej, dam ci bardzo prostą odpowiedź: weź kurs na temat prawdopodobieństw.
Większość współczesnych ram programowania ML zabiera znaczną większość matematyki z nauk o danych; naprawdę nie potrzebujesz go w większości scenariuszy. Ale zawsze będziesz potrzebować umiejętności zrozumienia swoich wyników, a większość wyników wyrażona jest w prawdopodobieństwach. Gdybym był nowy w nauce o danych, wziąłbym (krótki) kurs na temat prawdopodobieństw, starałbym się zrozumieć, co naprawdę oznaczają proporcje i procenty, a następnie pracowałbym, aby naprawdę dobrze poznać ramy (takie jak Tensorflow). Jeśli możesz to zrobić, możesz napisać kilka naprawdę interesujących algorytmów i nie musisz mieć obsesji na punkcie matematyki.
źródło