Jestem nowicjuszem, który zacznie czytać o eksploracji danych. Mam podstawową wiedzę na temat sztucznej inteligencji i statystyki. Ponieważ wielu twierdzi, że uczenie maszynowe odgrywa również ważną rolę w eksploracji danych, czy konieczne jest przeczytanie o uczeniu maszynowym, zanim będę mógł kontynuować eksplorację danych?
14
Odpowiedzi:
Będąc trochę w tej pozycji, postaram się dać wgląd.
Najpierw pobierz elementy uczenia statystycznego . Zakłada rachunek różniczkowy i algebrę liniową i chociaż jest bardzo techniczny, jest również wyjątkowo dobrze napisany.
Po drugie (lub po pierwsze) zapoznaj się z samouczkami Andrew Ng dotyczącymi uczenia maszynowego.
Po trzecie, zdobądź trochę danych i rozpocznij próbę ich analizy. Musisz podzielić na zestawy treningowe i testowe, a następnie zbudować modele na zestawie treningowym i przetestować je na zestawie testowym. Uważam, że pakiet karetki dla R jest bardzo przydatny do tego wszystkiego. Po tym ćwiczeniu ćwicz ćwiczenie (jak prawie wszystko inne).
źródło
Wprowadzenie do Data Mining autorstwa Tan, Steinbech, Kumar jest najlepszą dostępną książką intro
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
zachowaj EoSL, gdy chcesz głębiej kopać. To bardziej odniesienie.
źródło
Eksploracja danych może mieć charakter opisowy lub predykcyjny.
Z jednej strony, jeśli interesuje Cię opisowe wyszukiwanie danych, uczenie maszynowe nie pomoże.
Z drugiej strony, jeśli jesteś zainteresowany predykcyjnym eksploracją danych, to uczenie maszynowe pomoże ci zrozumieć, że próbujesz zminimalizować nieznane ryzyko (oczekiwanie funkcji straty) przy minimalizacji ryzyka empirycznego: będziesz pamiętać o przeładowaniu, uogólnieniu błąd i weryfikacja krzyżowa. Na przykład dla zachowania spójności wartość -NN dla próbki szkoleniowej o rozmiarze powinna być taka, aby:k n
źródło
Dodam tylko kolejne bardzo dobre źródło samouczków dotyczących eksploracji danych / uczenia maszynowego autorstwa Toma Mitchella .
Wyjaśnia to bardzo wyraźnie i możesz również pobrać jego prezentacje ze swojej strony internetowej (wraz z oglądaniem tam jego wykładów).
źródło