Plik tekstowy słownika [zamknięty]

222

Piszę program, który potrzebuje DUŻO słów w języku angielskim. Próbuję znaleźć plik słownika zawierający wiele słów. Czy ktoś wie o dobrym źródle? Próbowałem wielu źródeł, ale wydaje się, że nie mają.

SuperString
źródło
3
@DWright Nie usunąłem go, zamknąłem go, ponieważ nie dotyczy on aktualnych oczekiwań przepełnienia stosu. To wyraźnie prosi o rekomendacje, linki, które nie są na temat.
Taryn
Prawdą jest, że zapomniałem, że Wstrzymanie przechodzi do Zamknięte, a nie usunięte.
DWright
Tak więc, @bluefeet, przepraszam za mój „protestujący” komentarz, który został źle poinformowany, twoje działanie jest prawidłowe i nie odejmuje wartości.
DWright
15
Po co przepraszać? Oczywiście ma to wartość dla społeczności SO. „Obecne oczekiwania” SO wyraźnie tracą na znaczeniu.
Andrew

Odpowiedzi:

224

A co /usr/share/dict/wordsz dowolnym systemem uniksowym? Ile słów mówimy? Jak OED-Unabridged?

Robert
źródło
20
dzięki ! Ponad 200000 słów, bardzo mile widziane! cat /usr/share/dict/words > words.txtwszystkie rzeczy !
Jokoon
7
Jeśli brakuje tego pliku, możesz zainstalować go na Debian / Ubuntu, wpisującsudo apt-get install wbritish
airstrike
17
Czy ktoś przez przypadek zna miejsce, z którego można go pobrać na systemy inne niż Unix?
Tom
2
@Tom Tak, www.FreeBSD.org (zainstaluj gdzieś FreeBSD i boom, masz go). W przeciwnym razie myślę, że ta lista jest podobna: raw.githubusercontent.com/eneko/data-repository/master/data/… .
Greg Schmit,
2
Na wypadek, gdybyś nie wiedział: To też będzie działać na macOS :)
Lewis
44

W przypadku pliku .txt słownika angielskiego można użyć słownika niestandardowego .

Możesz także wygenerować listę aspell lub listę słów z własnymi ustawieniami.

Możesz także zajrzeć na http://wordlist.sourceforge.net/

Tylko angielskie słowa: http://www.math.sjsu.edu/~foster/dictionary.txt

Sujith PS
źródło
Chociaż ten link może odpowiedzieć na pytanie, lepiej jest dołączyć tutaj istotne części odpowiedzi i podać link w celach informacyjnych. Odpowiedzi zawierające tylko łącze mogą stać się nieprawidłowe, jeśli połączona strona ulegnie zmianie.
DeanOC
21
@DeanOC: Myślę, że dość jasne jest, że „istotnymi częściami” słownika byłby cały słownik. Nie jest to praktyczne wklejanie tutaj. Jest również dość jasne, jakie jest użycie: wyciąganie z niego słów. W rzeczywistości nie jest to tylko link. Jest to uzasadniona odpowiedź na zalecenie w sprawie pytania, które powinno (i teraz jest) zamknięte.
Nathan Tuggy,
@NathanTuggy Ta odpowiedź pojawiła się w kolejce LQP i uważam, że pasuje ona do definicji odpowiedzi tylko do łącza. Jako użytkownik <3K rep, mój głos na usunięcie nie robi nic innego, niż tylko pomaga zwrócić uwagę kogoś, kto może.
DeanOC,
1
@DeanOC: Wiem, że pojawił się w LQP. Uderzyłem Wygląda OK, z podanych powodów: po prostu, że „tylko link” jest o wiele bardziej subtelne niż „ma link, ale nie ma kodu ani cytatu? PALIĆ Z OGNIEM”. Zauważ, że wystarczy poleca wyborów usunięcia przez użytkowników nawet 2k będzie usuwać posty. (Ja osobiście byłem odpowiedzialny za
wysypywanie
@NathanTuggy Możesz oczywiście głosować według własnego uznania. Głosowałem za usunięciem, ponieważ nie widzę żadnej wartości w tej odpowiedzi, jeśli link się zepsuje.
DeanOC
35

http://www.math.sjsu.edu/~foster/dictionary.txt

350 000 słów

Bardzo późno, ale może być przydatny dla innych.

Rajendra Uppal
źródło
24
Patrząc na kilka pierwszych, wiele z nich nie jest zwykłymi angielskimi słowami.
tripleee
8
nie było to pożyteczne, ponieważ brakowało wielu prostych słów, takich jak grzech, w ...
FernandoZ
7
Tak, i ma takie słowa jak „wwwwwww”. Nie słowo.
Jared Forsyth
1
Uwaga, ten link powoduje awarię mojego Firefoksa, ponieważ próbuje załadować cały plik ahahahaha
Andrew
@Andrew nie ulega awarii w Chrome 50.
Bogdan M.
11

Istnieje również WordNet . Format plików danych jest dobrze udokumentowany.
Użyłem go do zbudowania biblioteki słowników do osadzenia dla programistów iOS ( www.lexicontext.com ), a także w jednej z moich aplikacji.

Lub ja
źródło
2
Pula. Jeśli ktoś szuka słów odwzorowanych na ich części mowy, wystarczy pobrać główny pakiet WordNet.
Andrew
10

@ Przyszli poszukiwacze: możesz użyć aspell do sprawdzenia słownika, ma on powiązania w Ruby i Pythonie. To znacznie uprości twoją pracę.

Khaja Minhajuddin
źródło