Lista (lub metoda uzyskania) listy każdego słowa w każdym języku [zamknięte]

-2

Szukam listy słów z każdego języka, w tym slangu. Czy istnieje taka wspaniała lista?

Wiem, że moim najlepszym rozwiązaniem jest zdobycie /usr/share/dict/wordskażdego z języków i wypełnienie slangu później (bez slangu w słowie / słowie), ale nie jestem pewien, jak pobrać te pliki. Nie jestem pewien, skąd wziąć slang.

Widzę, że Wikisłownik ma wiele tego, czego potrzebuję, ale nie ma slangu. Poza tym nie jestem jeszcze gotowy do napisania scenariusza, aby przejść przez tę stronę.

[EDYCJA] Nadal potrzebujesz tego 2019. Oto jedno źródło. https://github.com/dwyl/english-words

Chrips
źródło
Hasło składające się z każdego słowa w każdym języku? To byłoby absolutnie odporne na włamanie. Ale jak kiedykolwiek to zapamiętasz i czy nie zajmie to wieczności za każdym razem?
fixer1234
1
Każdy język ???? Zdajesz sobie sprawę, że istnieje ponad 200 języków. Czy twoja lista zawiera również Cherokee? czy Eskimos? Powodzenia w pracy doktorskiej.
LDC3
1
Wyobrażam sobie, że łatwą odpowiedzią byłoby stwierdzenie, że można założyć, że dowolna kombinacja liter o długości 2-5 znaków jest słowem w jakimś języku, jeśli zastosujesz się do kilku zasad fonicznych, takich jak nie więcej niż 2 samogłoski w rząd. Prawdopodobnie także większość kombinacji 6 i 7 znaków. To dba o większość z nich. Resztę
wymyślisz
1
Nie jest to możliwe w językach, takich jak angielski, które nie mają władzy nad tym, co jest „słowem”, a co nie. Byłoby lepiej, gdybyś wyjaśnił, dlaczego chcesz czegoś takiego.
Dour High Arch
Czy ma to związek z tym zamkniętym pytaniem dotyczącym przepełnienia stosu? stackoverflow.com/questions/2213607/…
JakeGould

Odpowiedzi:

1

Nie jestem pewien co do innych języków, ale na początek powinieneś spojrzeć na angielską listę otwartych słów :

EOWL zawiera obecnie około 128 985 słów. Aby EOWL był bardziej użyteczny w komputerowych grach słownych, wszystkie słowa dłuższe niż 10 liter zostały usunięte z listy źródeł UKACD, a wszystkie właściwe rzeczowniki i słowa wymagające symboli diakrytycznych, łączników i apostrofów zostały usunięte. To bardzo przypomina standardową listę słów ENABLE, ale EOWL jest nieco mniejszy (o 44 000 słów), ponieważ nie zawiera słów dłuższych niż 10 znaków.

Spójrz także na SCOWL (listy słów zorientowanych na sprawdzanie pisowni) i znajomych :

SCOWL (Listy słów zorientowanych na sprawdzanie pisowni) i Znajomi to baza danych zawierająca informacje o angielskich słowach, przydatna do tworzenia list słów wysokiej jakości, odpowiednich do sprawdzania pisowni w większości dialektów języka angielskiego. Podstawowa baza danych zawiera informacje o tym, jak często słowo jest używane, różnice w pisowni w dialektach w języku angielskim, informacje o wariantach pisowni oraz (podstawowe) informacje o wymowie i fleksji.

JakeGould
źródło