Każdy podręcznik, który do tej pory widziałem, opisuje algorytmy ML i sposoby ich implementacji.
Czy istnieje także podręcznik, który buduje twierdzenia i dowody na zachowanie tych algorytmów? np. stwierdzenie, że w warunkach , opadanie gradientu zawsze prowadzi do ?A , B , C.
machine-learning
mathematical-statistics
references
algorithms
użytkownik56834
źródło
źródło
Odpowiedzi:
Podstawy uczenia maszynowego autorstwa Mehryara Mohriego, Afshina Rostamizadeha i Ameeta Talwalkara, to książka z 2012 roku poświęcona teorii uczenia maszynowego.
Zrozumienie uczenia maszynowego: od teorii do algorytmów autorstwa Shai Shalev-Shwartz i Shai Ben-David jest podobną książką z 2014 roku, która jest dość dobrze znana i skierowana nieco bardziej wprowadzająco niż Mohri / Rostamizadeh / Talwalkar, ale wciąż ma wiele teorii w to. Jest darmowo dostępny online.
Uczenie się w sieci neuronowej: Teoretyczne podstawy , autorstwa Martina Anthony'ego i Petera Bartletta, to książka z 1999 roku na temat teorii ML sformułowana jako związana z sieciami neuronowymi, ale (jak sądzę, że jej nie przeczytałem) dotyczy głównie teorii ML.
Te trzy książki zajmują głównie dominujący punkt widzenia teorii uczenia statystycznego. Istnieje również interesujący punkt widzenia zwany obliczeniową teorią uczenia się, inspirowaną bardziej teorią informatyki. Myślę, że standardową książką wprowadzającą w tej dziedzinie jest An Introduction to Computational Learning Theory , książka z 1994 roku autorstwa Michaela Kearnsa i Umesh Vazirani.
Inną doskonałą i często polecaną darmową książką jest Trevor Hastie, Robert Tibshirani i drugie wydanie Jerome Friedmana z 2009 roku The Elements of Statistics Learning . Jest to może nieco mniej teoretyczne niż inne i bardziej z punktu widzenia statystyki niż uczący się maszyny, ale wciąż cieszy się dużym zainteresowaniem.
Ponadto, jeśli szczególnie zależy Ci na spadku gradientu, standardowym odniesieniem jest Optymalizacja wypukła autorstwa Stephena Boyda i Lieven Vandenberghe. Ta książka z 2004 roku jest dostępna bezpłatnie online.
Żadna z tych książek nie zawiera zbyt wielu informacji na temat współczesnej teorii sieci głębokich, jeśli na tym ci zależy. (Na przykład większość teorii optymalizacji dotyczy przypadków wypukłych, którymi zdecydowanie nie są sieci głębokie.) To dlatego, że ta teoria jest bardzo nowa; większość wyników pojawiła się dopiero w ciągu ostatnich kilku lat i wciąż wiele się zastanawia. Ale jako przegląd dotychczasowego zrozumienia tej dziedziny, każdy z nich dobrze cię przygotuje do zrozumienia dokumentów, w których ta praca jest wykonywana (z wyjątkiem być może Kearns / Vazirani, który koncentruje się na różnych aspektach analizy, które ja ” Nie jestem pewien, czy zostały z powodzeniem zastosowane w sieciach głębokich - jeszcze).
źródło
Uczenie maszynowe: perspektywa probabilistyczna Kevina P. Murphy'ego wyjaśnia wiele teorii z perspektywy bayesowskiej (użyłem jej tylko do regresji logistycznej, ale myślałem, że była całkiem dobra). Cała książka jest dostępna online w formacie PDF, wyszukując w Google.
źródło
W dodatku,
źródło
Projektowanie sieci neuronowych (Martin T. Hagan, Howard B. Demuth, Mark Hudson Beale, Orlando De Jesús) ma przyjemną dyskusję na temat optymalizacji w kontekście sieci neuronowych.
źródło