Co to są pakiety do eksploracji tekstu dla R i czy istnieją inne programy do eksploracji tekstu typu open source?

12

Czy możesz polecić pakiet do eksploracji tekstu w języku R, który może być używany w przypadku dużych ilości danych?
Po drugie, czy jest dostępny GUI dla któregokolwiek z pakietów eksploracji tekstu w R?
Po trzecie, czy istnieje inny program do eksploracji tekstu typu open source, który jest łatwy i intuicyjny w obsłudze?


źródło
@mbq: cóż, „czy istnieje pakiet do eksploracji tekstu typu open source z graficznym interfejsem użytkownika?” prawdopodobnie całkiem dobrze obejmowałby wszystkie trzy pytania, to już jest jedno pytanie ...
naught101

Odpowiedzi:

4

Oto dwa kolejne zintegrowane projekty:

  • Python Natural Language Toolkit (łatwa instalacja, dobra dokumentacja)
  • Java MALLET (bez doświadczenia, ale wygląda obiecująco; zawarty w linku podanym przez @Nick)

Oba są oprogramowaniem typu open source.

chl
źródło
3

Jasne, RapidMiner z rozszerzeniem do eksploracji tekstu.

Istnieje wiele filmów, które pokazują, jak to się robi.


źródło
2
Oto 5-częściowy serial: vancouverdata.blogspot.com/2010/11/…
Neil McGuigan
1

GATE jest bardzo wszechstronny. Pozwala także na pracę z różnymi językami i ma edytor ontologii.

Ralph Winters
źródło
0

Andrew McCallum (UMass) ma na swojej stronie kilka projektów związanych z NLP . Wszystkie są w Javie (myślę) z dostępnym kodem źródłowym.

Nacięcie
źródło