Spędziłem trzy dni, bawiąc się tm
po przeczytaniu dokumentu roboczego przez znajomego, w którym zbadał korpus tekstowy za pomocą UCINET, pokazując chmury tekstowe, dwumodowe wykresy sieciowe i rozkład pojedynczej wartości (z grafiką, przy użyciu Staty). Wystąpiło wiele problemów: w systemie Mac OS X występują problemy z Javą za bibliotekami takimi jak Snowball (tworzenie) lub Rgraphviz (wykresy).
Może ktoś punkt się nie pakiety - Mam spojrzał na tm
, wordfish
i wordscores
, i wiedzą o NLTK - ale badania, jeśli jest to możliwe z kodem, na danych tekstowych, które z powodzeniem używa tm
lub coś innego do analizy danych takich debat parlamentarnych lub dokumentów prawnych? Nie mogę znaleźć dużo na ten temat, a jeszcze mniej kodu do nauki.
Mój własny projekt to dwumiesięczna debata parlamentarna z tymi zmiennymi zawartymi w pliku CSV: sesja parlamentarna, mówca, grupa parlamentarna, tekst ustnej interwencji. Szukam rozbieżności między mówcami, a zwłaszcza między grupami parlamentarnymi, w stosowaniu rzadkich i mniej rzadkich terminów, np. „Rozmowa w sprawie bezpieczeństwa” przeciwko rozmowie o „wolnościach obywatelskich”.
źródło
Odpowiedzi:
Rozprawa doktorska autora tm, Ingo Feinerer z Austrii, napisana jest w języku angielskim. Rozdziały 7-10 tego dokumentu zawierają aplikacje pakietu tm o coraz większej złożoności.
http://epub.wu.ac.at/1923/
Przeczytaj całą dokument od deski do deski. Należy jednak pamiętać, że dokument został napisany w 2008 roku i od tego czasu wprowadzono kilka zmian API, na przykład praca doktorska wspomina o funkcji
tmMap()
, której nazwa została zmienionatm_map()
. Tak więc przykłady kodu nie będą działać tak, jak są, nie można użyć wycinania i wklejania, aby je wypróbować.Możesz także przejść do
http://tm.r-forge.r-project.org/users.html
i wyszukaj na tej stronie frazę „napisał artykuł”, a znajdziesz wiele linków. Przeczytałem tylko jeden artykuł: „automatyczne wykrywanie tematu w tekstach piosenek”. Całkiem interesujące i zabawne.
źródło
Dobrym miejscem na początek może być lista publikacji na stronie internetowej
tm
, takich jak ta:Lista referencji na końcu każdej z tych publikacji zawiera udane aplikacje
tm
, a tego właśnie szukasz. Jest ich wiele - szczególnie, jeśli postępujesz zgodnie z referencjami referencji.Na przykład oto jeden, który może mieć znaczenie:
Powodzenia.
źródło
tm
po mojej stronie. Mimo wszystko bardzo dziękuję :)