Cześć. Chciałem wiedzieć, czy są jakieś dobre książki na temat eksploracji tekstu i klasyfikacji z niektórymi studiami przypadków ?. Jeśli nie, wystarczyłyby niektóre dokumenty / czasopisma dostępne publicznie. Jeśli zilustrują swoje przykłady R jeszcze lepiej. Nie szukam instrukcji krok po kroku, ale czegoś, co ilustruje zalety i wady różnych podejść do eksploracji tekstu do różnych klas problemów.
źródło
Niedawno przeczytałem cztery książki z tego zakresu:
Ten koncentruje się na praktycznych przykładach, oprogramowaniu i stosowanym eksploracji tekstu. Daje wiele przykładów praktycznego wykorzystania eksploracji tekstu. Może to być interesujące, jeśli chcesz przeczytać o komercyjnych zastosowaniach narzędzi do eksploracji tekstu.
Jest to seria prac badawczych, które są wykorzystywane jako przykłady użycia różnych narzędzi do eksploracji tekstu. Jest raczej zbyt skoncentrowany jak na test wprowadzający.
Bardzo wprowadzający tekst opisujący niektóre ogólne problemy.
To najlepsza książka, którą już przeczytałem na ten temat. Jest dobrze napisane, jasne, wnika głębiej w teorię, ale w sposób przyjazny dla praktyki. Zaczyna się od ogólnego wprowadzenia, ale od przeglądu niektórych najczęściej używanych metod i algorytmów. Jeśli musiałbyś wybrać tylko jedną książkę, poleciłbym tę.
Możesz również łatwo znaleźć wiele książek na temat przetwarzania języka naturalnego i eksploracji tekstu, które koncentrują się na użyciu R ( biblioteka tm ) lub Python ( biblioteka nltk ).
źródło
To może nie być dokładnie to, czego szukasz, ale opanowanie wyrażeń regularnych przez Jeffreya Friedla jest doskonałym źródłem do nauki, jak używać wyrażeń regularnych do analizowania tekstu. Nie dyskutuje o technikach modelowania, ale uzbrojony w liczenia wynikające ze stosowania wyrażeń regularnych można zastosować szereg standardowych metod modelowania.
źródło
Jedną książką, do której wracam wielokrotnie, jest Text Mining: Predictive Methods ... autorstwa Sholom Weiss. Ma wiele pomysłów na rozwiązywanie problemów, które uważam za przydatne, ponieważ czasami eksploracja tekstu polega na wypróbowywaniu różnych rzeczy - słownik globalny kontra lokalny, liczba funkcji, które należy zachować itp. Uważam tę książkę za dobry generator pomysłów. Ma także studia przypadków.
źródło
Sugeruję, że NLP na http://www.nltk.org/ jest bezpłatny i łączy się z NLTK w Pythonie. wszystkiego najlepszego
źródło