Samouczki na temat modeli tematycznych i LDA

8

Chciałbym wiedzieć, czy ludzie mają dobre tutoriale (szybkie i proste) na temat modeli tematów i LDA, ucząc intuicyjnie, jak ustawić niektóre parametry, co oznaczają i jeśli to możliwe, z prawdziwymi przykładami.

pedrobisp
źródło
Nie jest to bezpośrednia odpowiedź i nie tutoriale, ale jeśli interesują Cię modele hierarchiczne, moja ostatnia odpowiedź na ten temat może okazać się pomocna (zbiór prac naukowych).
Aleksandr Blekh
2
Zasadniczo pytania, które dotyczą jedynie zasobów zewnętrznych, są uważane za nie na temat. Może możesz zawęzić to, czego szukasz w samouczku. Co wiesz, co chcesz wiedzieć, czy chcesz kodować w określonym języku itp.
Sean Owen

Odpowiedzi:

9

Jeśli pracujesz w R, samouczek Carsona Sieverta na temat używania LDA do modelowania tematów w recenzjach filmów jest doskonałym punktem wyjścia:

http://cpsievert.github.io/LDAvis/reviews/reviews.html

W tym samouczku wykorzystano LDAvis, interaktywną wizualizację dystrybucji tematów i słów, która może naprawdę pomóc w intuicji.

Ponadto, choć nie krótkie, wykłady David M. Blei na temat modeli tematycznych są doskonałym źródłem do zrozumienia znaczenia parametrów: http://videolectures.net/mlss09uk_blei_tm/

Jeremy Salfen
źródło
7

Bardzo polecam ten samouczek: Pierwsze kroki z modelowaniem tematów i MALLETEM

Oto kilka dodatkowych linków, które pomogą Ci zacząć ...

Dobre materiały wprowadzające (w tym linki do artykułów naukowych): http://www.cs.princeton.edu/~blei/topicmodeling.html

Oprogramowanie:

Jeszcze więcej tutaj na blogu Biased Estimates: Lista modeli do czytania

Charlie Greenbacker
źródło
1

Proponuję wypróbować samouczek Gensim dotyczący uczenia maszynowego . Zapewni to całościowy przegląd NLP i LDA, w tym: w jaki sposób wstępnie przetwarzać dane, wykonywać funkcje techniczne i stosować LDA.

Argyris
źródło