Chciałbym wiedzieć, czy ludzie mają dobre tutoriale (szybkie i proste) na temat modeli tematów i LDA, ucząc intuicyjnie, jak ustawić niektóre parametry, co oznaczają i jeśli to możliwe, z prawdziwymi przykładami.
topic-model
lda
pedrobisp
źródło
źródło
Odpowiedzi:
Jeśli pracujesz w R, samouczek Carsona Sieverta na temat używania LDA do modelowania tematów w recenzjach filmów jest doskonałym punktem wyjścia:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
W tym samouczku wykorzystano LDAvis, interaktywną wizualizację dystrybucji tematów i słów, która może naprawdę pomóc w intuicji.
Ponadto, choć nie krótkie, wykłady David M. Blei na temat modeli tematycznych są doskonałym źródłem do zrozumienia znaczenia parametrów: http://videolectures.net/mlss09uk_blei_tm/
źródło
Bardzo polecam ten samouczek: Pierwsze kroki z modelowaniem tematów i MALLETEM
Oto kilka dodatkowych linków, które pomogą Ci zacząć ...
Dobre materiały wprowadzające (w tym linki do artykułów naukowych): http://www.cs.princeton.edu/~blei/topicmodeling.html
Oprogramowanie:
Jeszcze więcej tutaj na blogu Biased Estimates: Lista modeli do czytania
źródło
Jeśli szukasz czegoś prostego na początek i łatwego do wdrożenia, polecam to.
Przewodnik dla początkujących po modelowaniu tematów
źródło
W ramach projektu CLARIN-D zebrano kilka dobrych wskazówek do samouczków dotyczących modelowania tematów i LDA na stronie TeLeMaCo (Teaching and Learning Materials Collection) prowadzonej przez centrum CLARIN Universität des Saarlandes .
źródło
Proponuję wypróbować samouczek Gensim dotyczący uczenia maszynowego . Zapewni to całościowy przegląd NLP i LDA, w tym: w jaki sposób wstępnie przetwarzać dane, wykonywać funkcje techniczne i stosować LDA.
źródło