Książka kucharska maszynowego uczenia się / karta referencyjna / ściągawka?

57

Uważam, że zasoby takie jak książka prawdopodobieństwa i statystyki oraz karta referencyjna R do wyszukiwania danych są niezwykle przydatne. Służą oczywiście jako odniesienia, ale także pomagają mi uporządkować myśli na dany temat i uzyskać ukształtowanie terenu.

P: Czy istnieją podobne zasoby do metod uczenia maszynowego?

Wyobrażam sobie kartę referencyjną, która dla każdej metody ML obejmuje:

  • Ogólne właściwości
  • Kiedy metoda działa dobrze
  • Kiedy metoda źle się sprawdza
  • Z których lub do jakich innych metod metoda się uogólnia. Czy został w większości zastąpiony?
  • Artykuły na temat metody
  • Otwarte problemy związane z metodą
  • Intensywność obliczeniowa

Wszystkie te rzeczy można znaleźć przy minimalnym przekopywaniu podręczników, jestem pewien. Byłoby po prostu bardzo wygodnie mieć je na kilku stronach.

lowndrul
źródło
5
Dobry cel, ale „minimalne przekopywanie się przez niektóre podręczniki”? Jak można zacząć kompresować, powiedzmy, że te 20 książek do nauki statystycznej i eksploracji danych + mloss.org/software/rating ?
denis
2
(+1) dla chuzpy, gdyby taki przegląd istniał, zapłaciłbym za to. Kluczowym problemem jest to, że oprócz niektórych właściwości, które można wyprowadzić z samego algorytmu, większość takich właściwości lub reguł jest uzyskiwana z doświadczenia, tj. Z zastosowania. Jestem prawie pewien, że zahartowany w boju badacz stosowany lub programista / konsultant ML-framework mógłby napisać coś takiego ... ale tu i teraz?
steffen
@Denis: link „20 książek ..” nie działa, możesz to sprawdzić?
lmsasu
6
Nie jestem ekspertem od uczenia maszynowego, więc odłożę się do innych, aby opublikować odpowiedzi, ale uważam, że elementy uczenia statystycznego są uważane za dobry tekst na ten temat i napisane przez jedne z największych nazwisk w tej dziedzinie. Powinienem dodać, że ta książka jest napisana na wysokim poziomie i ci, których słyszałem, zalecają, że ma doktoraty z statystyki.
Makro

Odpowiedzi:

25

Niektóre z najlepszych i swobodnie dostępnych zasobów to:

Co do pytania autora, nie spotkałem rozwiązania „Wszystko na jednej stronie”

Siergiej
źródło
Siergiej, czy książka Barbera jest związana z Matlabem?
denis
2
Tak, spójrz na link do książki: Pudełko BRMLtool ma na celu pomóc czytelnikom zobaczyć, jak modele matematyczne przekładają się na rzeczywisty kod MAT-LAB.
Sergey
31

Jeśli chcesz nauczyć się uczenia maszynowego, zdecydowanie radzę zapisać się na bezpłatny kurs ML online zimą prowadzony przez prof. Andrew Ng .

Zrobiłem poprzedni na jesieni i wszystkie materiały do ​​nauki są wyjątkowej jakości i nastawione na praktyczne zastosowania, i o wiele łatwiej jest udawać, że sam zmaga się z książką.

Zrobił też dość nisko wiszący owoc z dobrymi intuicyjnymi wyjaśnieniami i minimalną ilością matematyki.

clyfe
źródło
Właśnie ukończyłem ten kurs i jest niesamowity! Dało mi to także dobry początek zrozumienia książek na temat uczenia maszynowego.
B, 7
1
Myślę, że ten link to teraz coursera.org/course/ml
n611x007
14

Tak, wszystko w porządku; „Rozpoznawanie wzorców i uczenie maszynowe” Christophera Bishopa to doskonała książka, do której można się odwoływać, naprawdę nie można się z nią pomylić.

Dość nową książką, ale także bardzo dobrze napisaną i równie szeroką, jest „ Bayesian Reasoning and Machine Learning ” Davida Barbera ; książka, którą uważam, jest nieco bardziej odpowiednia dla początkujących w tej dziedzinie.

Użyłem „elementów statystycznego uczenia się” Hastie i in. (wspomniane przez Macro) i chociaż jest to bardzo mocna książka, nie poleciłbym jej jako pierwszego odniesienia; może lepiej posłuży ci jako drugi punkt odniesienia dla bardziej specjalistycznych tematów. W tym aspekcie książka Davida MacKaya, Teoria informacji, Wnioskowanie i Algorytmy uczenia się również może zrobić świetną robotę.

usεr11852 mówi Reinstate Monic
źródło
2
+1 dla Biskupa. Przejrzysty rozwój z równym poziomem szczegółowości. Chociaż wciąż dobrze, zawsze znajdowałem Hastie i in. trochę niepewnie.
conjugateprior
1
+1 - Hastie, Tibshirani i Friedman to mój osobisty faworyt.
StasK
1
+1 również za polecenie Hastie, Tibshirani i Friedmana, mojego osobistego faworyta. I dzięki za inne rekomendacje; Dam im lekturę, bo naprawdę potrzebuję dobrej książki, która poleciłaby niestatystom (lub osobom dopiero wchodzącym na boisko).
Néstor
1
+1 dla Biskupa. To także świetne źródło klasycznych statystyk, ale zaktualizowane i ukryte.
przypuszcza
10

Ponieważ wydaje się, że konsensus jest taki, że to pytanie nie jest duplikatem, chciałbym podzielić się moim ulubionym dla początkujących uczniów maszyn:

Programowanie Kolektywna Inteligencja uważam za najłatwiejszą książkę dla początkujących, ponieważ autor Toby Segaran koncentruje się na tym, aby środkowy twórca oprogramowania mógł jak najszybciej zabrudzić ręce hakowaniem danych.

Typowy rozdział: Problem danych jest jasno opisany, a następnie z grubsza wyjaśnione, jak działa algorytm, a na koniec pokazuje, jak stworzyć pewne spostrzeżenia za pomocą zaledwie kilku wierszy kodu.

Zastosowanie Pythona pozwala zrozumieć wszystko dość szybko (nie trzeba znać Pythona, tak naprawdę, nie znałem go też wcześniej). NIE myśl, że ta książka koncentruje się tylko na tworzeniu systemu rekomendacji. Zajmuje się także eksploracją tekstu / filtrowaniem spamu / optymalizacją / klastrowaniem / sprawdzaniem poprawności itp., A zatem zapewnia uporządkowany przegląd podstawowych narzędzi każdego eksploratora danych.

steffen
źródło
6

Witten i Frank, „Data Mining”, Elsevier 2005 to dobra książka do samodzielnego uczenia się, ponieważ istnieje biblioteka kodu Java (Weka), która jest zgodna z książką i jest bardzo praktyczna. Podejrzewam, że istnieje nowsza edycja niż ta, którą posiadam.

Dikran Torbacz
źródło
1
Tak, ta książka miała być nazywana „uczeniem maszynowym”, ale wydawcy zmienili jej nazwę na „eksploracja danych”, aby w tym czasie korzystać z szumu eksploracji danych, niemniej jednak książka dotyczy ML, a nie DM (dwa podstawowe podobieństwa, ale są różne pola!).
clyfe,
1
Książka Toma Mitchella „Uczenie maszynowe” jest również bardzo dobra; styl jest nieco stary, ale treść jest doskonała.
Dikran Torbacz
Tak, ML Toma Mitchella jest jak Biblia ML, naprawdę wszechstronna na polu!
clyfe,
5

„Elementy statystycznego uczenia się” byłyby świetną książką do twoich celów. Piąte wydanie książki, które zostało opublikowane na początku 2011 r., Jest dostępne bezpłatnie pod adresem http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf

DanB
źródło
2
jest to ciężka książka z matematyki, dlatego samokształcenie może być trudne do naśladowania.
Atilla Ozgur
Czy wiesz, jak to się dzieje, że można bezpłatnie pobrać na osobiste strony Trevora Hastiego, gdy Springer pobiera za to 70 $?
Alfred M.,
Nie wiem na pewno, ale wyobrażam sobie, że Springer chce pieniędzy, a autorzy głównie chcą szeroko rozpowszechnić swoją książkę. Wydaje się to bardzo podobne do tego, w jaki sposób Springer będzie sprzedawał Ci opublikowane artykuły, podczas gdy wiele „roboczych wersji papierowych” jest dostępnych bezpłatnie na stronie internetowej autora.
DanB
Do pobrania, jest do 5. wydruku drugiej edycji. Uwielbiam przypis do e-grafiku „W Bogu ufamy, wszyscy inni przynoszą dane”, które przypisuje się Demingowi. Przypis wskazuje na ironię, że nie można znaleźć „danych” potwierdzających, że Deming to powiedziała.
HeatfanJohn
Powinieneś wspomnieć Wprowadzenie do statystycznego uczenia się za pomocą R - to coś w rodzaju ich literatury ESL (jeśli matematyka w ESL jest zbyt zniechęcająca).
Steve S,
5

wprowadź opis zdjęcia tutaj

Często najtrudniejszą częścią rozwiązania problemu uczenia maszynowego może być znalezienie odpowiedniego estymatora dla zadania. Różne estymatory lepiej nadają się do różnych typów danych i różnych problemów. Poniższy schemat blokowy ma na celu przybliżenie użytkownikom sposobów podejścia do problemów dotyczących tego, które estymatory mają wypróbować dane. Kliknij dowolny estymator na poniższym wykresie, aby zobaczyć jego dokumentację.

Anton Tarasenko
źródło
3

Większość książek wymienionych w innych odpowiedziach jest bardzo dobra i tak naprawdę nie można się pomylić z żadną z nich. Dodatkowo uważam, że poniższy ściągawka dla Pythona jest scikit-learndość przydatny.

Marc Claesen
źródło
2

Lubię „Klasyfikację wzorów” Dudy, Harta i Bociana. To najnowsza wersja klasycznego tekstu, który bardzo dobrze wyjaśnia wszystko. Nie jestem pewien, czy został zaktualizowany, aby mieć duży zasięg sieci neuronowych i SVM. Książka Hastie, Tibshirani i Friedmana jest o najlepszych, jakie istnieją, ale może być nieco bardziej techniczna niż to, czego szukasz i jest bardziej szczegółowa niż przegląd tematu.

Michael Chernick
źródło
2

Microsoft Azure zapewnia także podobny ściągawka do scikit-learn opublikowanego przez Antona Tarasenko.

Ściągawka z algorytmem uczenia maszynowego Microsoft Azure

(źródło: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-alameterm-cheat-sheet )

Towarzyszą mu zawiadomienie:

Sugestie oferowane w tym ściągu algorytmów są przybliżonymi zasadami. Niektóre mogą być wygięte, a niektóre rażąco naruszone. Ma to sugerować punkt wyjścia. (...)

Microsoft dodatkowo udostępnia artykuł wprowadzający zawierający dalsze szczegóły.

Zwróć uwagę, że materiały te koncentrują się na metodach wdrożonych na Microsoft Azure.

Tim
źródło
1

Nie zaczynaj od elementów uczenia statystycznego. Jest świetny, ale jest to książka informacyjna, która nie brzmi tak, jak tego szukasz. Zacznę od programowania kolektywnej inteligencji, ponieważ jest to łatwa lektura.

Neil McGuigan
źródło
Nie jestem pewien, czy scharakteryzowałbym ESL jako tekst referencyjny. Wydaje mi się to raczej ogólnym przeglądem, tzn. Nie nauczysz się drobiazgowych szczegółów (prawie) niczego. Zobaczysz szerokie techniki i nadrzędne tematy.
kardynał
1

Jeśli chodzi o pierwszą książkę o uczeniu maszynowym, która dobrze wyjaśnia zasady, zdecydowanie polecam

Rogers and Girolami, A First Course in Machine Learning , (Chapman & Hall / CRC Machine Learning & Recognition), 2011.

Książka Chrisa Bishopa lub David Barber dokonują dobrego wyboru książki o większej szerokości, gdy tylko dobrze zrozumiesz zasady.

Dikran Torbacz
źródło
0

Dobrym cheatheetem jest ten z książki Maxa Kuhna Applied Predictive Modeling . W książce znajduje się dobra tabela podsumowująca kilka modeli uczenia się ML. Tabela znajduje się w załączniku A strona 549.

PolBM
źródło