Zainstalowałem python-nltk na Ubuntu Server 12.04 za pomocą apt-get.
Ale kiedy próbuję pobrać korpus, pojawia się następujący błąd:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import nltk
>>> nltk.download('brown')
[nltk_data] Error loading brown: HTTP Error 401: Authorization
[nltk_data] Required
False
Czy brakuje mi konfiguracji lub dodatkowego pakietu?
wget https://github.com/nltk/nltk/archive/develop.zip; unzip develop.zip; cd nltk-develop; python setup.py install
. Ale problem został podniesiony w github.com/nltk/nltk/issues/747Odpowiedzi:
Zastosowane
DEFAULT_URL
w wersjidownloader.py
pakietu Ubuntu nadal używa:Ale obecny serwer danych to:
Możesz oczywiście zainstalować ze źródła lub ... zmodyfikować już zainstalowaną wersję, aby wskazywała na nowy serwer w następujący sposób:
Następnie możesz zainstalować „brązowy” korpus:
źródło
Można to naprawić bez zmiany kodu źródłowego. Utwórz niestandardowy program do pobierania w Pythonie:
następnie otworzysz okno dialogowe GUI:
Sprawdź, czy masz dostęp do zapisu w katalogu pobierania i pobierz to, czego potrzebujesz.
źródło
Ten aktualizuje nltk, a następnie
nltk.download()
działa ponownie.źródło