Pracuję nad małym (200 mln) fragmentem tekstu, który chcę zbadać za pomocą analizy skupień. Jakie książki lub artykuły na ten temat poleciłbyś?
Pracuję nad małym (200 mln) fragmentem tekstu, który chcę zbadać za pomocą analizy skupień. Jakie książki lub artykuły na ten temat poleciłbyś?
Warto spojrzeć na książki MW Berry:
Składają się z serii prac aplikacyjnych i przeglądowych. Najnowsze wydaje się być dostępne w formacie PDF pod następującym adresem: http://bit.ly/deNeiy .
Oto kilka linków związanych z CA w zastosowaniu do eksploracji tekstu:
Możesz także spojrzeć na Latent Semantic Analysis , ale zobacz moją odpowiedź: Praca przez problem klastrowania .
Znajdowanie grup w danych. Wprowadzenie do analizy skupień autorstwa profesorów Leonarda Kaufmana i Petera J. Rousseeuw.
Czytam książkę i uważam ją za bardzo przydatną, ponieważ:
Naszym celem było napisanie stosowanej książki dla ogólnego użytkownika. Chcieliśmy udostępnić analizę skupień osobom, które niekoniecznie mają silne zaplecze matematyczne lub statystyczne.
Zapewnia treść teoretyczną, aby zrozumieć funkcje dostępne w R
pakiecie Cluster .
Rozdziały można czytać indywidualnie zgodnie z interesującą metodą klastrową.
wyjątkiem jest rozdział 3, który jest oparty na rozdziale 2
Rozdziały książki to:
Bibliografia:
Kaufman, L., i Rousseeuw, PJ (2005). Znajdowanie grup w danych. Wprowadzenie do analizy skupień (s. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Analiza skupień Rozszerzona Rousseeuw i in. CRAN.
Ten rozdział wstępu do eksploracji danych jest dostępny online i zawiera ładny przegląd.
źródło
Analiza skupień autorstwa Briana S. Everitta to ładne podejście do analizy skupień o długości książki.
źródło
Nie specjalnie o eksploracji tekstu, ale podobało mi się „Analiza danych eksploracyjnych z MATLAB” autorstwa Martineza i Martineza.
źródło
Kolejna szczegółowa książka, na którą warto spojrzeć: Handbook of Cluster Analysis autorstwa Henniga i in. (2015)
źródło