Pytania oznaczone «nlp»

436

W jaki sposób Google „miałeś na myśli?” Algorytm działa?

Tworzę wewnętrzną stronę internetową dla narzędzia do zarządzania portfelem. Istnieje wiele danych tekstowych, nazw firm itp. Byłem pod wielkim wrażeniem zdolności wyszukiwarek do bardzo szybkiego reagowania na zapytania za pomocą „Czy miałeś na myśli: xxxx”. Muszę być w stanie inteligentnie...

207

Jak obliczyć podobieństwo między dwoma dokumentami tekstowymi?

Patrzę na pracę nad projektem NLP w dowolnym języku programowania (choć wolę Python). Chcę wziąć dwa dokumenty i ustalić ich

nlp

172

Java Stanford NLP: część etykiet mowy?

Stanford NLP, demo'd tutaj , daje moc takiego: Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./. Co oznaczają tagi Część mowy? Nie mogę znaleźć oficjalnej listy. Czy to własny system Stanforda, czy też używają uniwersalnych tagów? (Co to jest JJna przykład?) Ponadto, gdy przeglądam...

java nlp stanford-nlp part-of-speech

138

Wykrywanie sylab w słowie

Muszę znaleźć dość skuteczny sposób wykrywania sylab w słowie. Na przykład, Niewidoczne -> in-vi-sib-le Istnieje kilka zasad sylabowania, których można użyć: V CV VC CVC CCV CCCV CVCC * gdzie V to samogłoska, a C to spółgłoska. Na przykład, Wymowa (5 Pro-nun-ci-a -ation;...

nlp spell-checking hyphenation

137

Jaka jest różnica między lematyzacją a wyprowadzaniem?

Kiedy używam każdego? Ponadto ... czy lematyzacja NLTK jest zależna od części mowy? Czy nie byłoby dokładniejsze, gdyby było?

python nlp nltk lemmatization

131

W jaki sposób Apple znajduje daty, godziny i adresy w wiadomościach e-mail?

W kliencie poczty e-mail na iOS, gdy wiadomość e-mail zawiera datę, godzinę lub lokalizację, tekst staje się hiperłączem i można utworzyć spotkanie lub spojrzeć na mapę, po prostu dotykając łącza. Działa nie tylko w przypadku wiadomości e-mail w języku angielskim, ale także w innych językach....

machine-learning nlp information-extraction named-entity-recognition

125

Jak pozbyć się interpunkcji za pomocą tokenizera NLTK?

Dopiero zaczynam używać NLTK i nie do końca rozumiem, jak uzyskać listę słów z tekstu. Jeśli używam nltk.word_tokenize(), otrzymuję listę słów i znaków interpunkcyjnych. Zamiast tego potrzebuję tylko słów. Jak pozbyć się interpunkcji? Również word_tokenizenie działa z wieloma zdaniami: punkty są...

python nlp tokenize nltk

114

Różnica między składnikiem składniowym a parserem zależności

Jaka jest różnica między analizatorem składniowym części składowej a parserem zależności ? Jakie są różne zastosowania tych

parsing nlp

112

Java lub Python do przetwarzania języka naturalnego [zamknięte]

Zamknięte . To pytanie jest oparte na opinii . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby można było na nie odpowiedzieć, podając fakty i cytaty, edytując ten post . Zamknięte 6 lat temu . Popraw to...

java python nlp

111

Jak mam wywodzić słowa lub lematyzować?

Wypróbowałem PorterStemmer i Snowball, ale oba nie działają na wszystkich słowach, brakuje niektórych bardzo popularnych. Moje słowa testowe to: „ koty biegają w społecznościach kaktusów kaktusów i kaktusów ” i obie mają mniej niż połowę racji. Zobacz też: Algorytm macierzysty, który tworzy...

nlp stemming lemmatization

109

Jak obliczyć precyzję, odtworzenie, dokładność i wynik f1 dla przypadku wieloklasowego za pomocą narzędzia Scikit Learn?

Pracuję nad problemem analizy nastrojów, dane wyglądają następująco: label instances 5 1190 4 838 3 239 1 204 2 127 Więc moje dane są niezrównoważone, ponieważ 1190 instancessą oznaczone 5. Do klasyfikacji używam SVC firmy scikit . Problem polega na tym, że nie wiem, jak zrównoważyć moje...

python machine-learning nlp artificial-intelligence scikit-learn

93

Jak prawidłowo poprzedzić słowo „a” i „an”?

Mam aplikację .NET, w której podając rzeczownik chcę, aby poprawnie poprzedzał to słowo „a” lub „an”. Jak bym to zrobił? Zanim pomyślisz, że odpowiedzią jest po prostu sprawdzenie, czy pierwsza litera jest samogłoską, rozważ wyrażenia takie jak: szczery błąd używany samochód...

c# nlp linguistics

93

Jak trenować Parser Stanforda z Genią Corpus?

Mam pewne problemy z utworzeniem nowego modelu dla Stanford Parser. Pobrałem również ostatnią wersję ze Stanford: http://nlp.stanford.edu/software/lex-parser.shtml A tutaj Genia Corpus w 2 formatach, xml i ptb (Penn Treebank). Standford Parser może trenować z plikami ptd; potem pobrałem...

java nlp stanford-nlp

90

Czy istnieje dobra biblioteka do przetwarzania języka naturalnego [zamknięte]

W obecnym stanie to pytanie nie pasuje do naszego formatu pytań i odpowiedzi. Oczekujemy, że odpowiedzi będą poparte faktami, referencjami lub ekspertyzą, ale to pytanie prawdopodobnie będzie wymagało debaty, argumentów, ankiet lub rozszerzonej dyskusji. Jeśli uważasz, że to...

java nlp

90

Stanford Parser i NLTK

Czy można używać Stanford Parser w NLTK? (Nie mówię o Stanford POS.)

python parsing nlp nltk stanford-nlp

89

word2vec: próbkowanie negatywne (w języku laika)?

Czytam poniższy artykuł i mam problem ze zrozumieniem koncepcji próbkowania ujemnego. http://arxiv.org/pdf/1402.3722v1.pdf Czy ktoś może pomóc, proszę?

machine-learning nlp word2vec

87

Analiza nastrojów na Twitterze w Pythonie [zamknięte]

Zamknięte. To pytanie nie spełnia wytycznych dotyczących przepełnienia stosu . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 5 lat temu . Popraw to pytanie...

python machine-learning nlp open-source sentiment-analysis

85

Jak skonfigurować katalog danych nltk z kodu?

python path directory nlp nltk

83

Tworzenie nowego korpusu za pomocą NLTK

Wydawało mi się, że często odpowiedzią na mój tytuł jest przeczytanie dokumentacji, ale przejrzałem książkę NLTK, ale ona nie daje odpowiedzi. Jestem trochę nowy w Pythonie. Mam kilka .txtplików i chcę móc korzystać z funkcji korpusu, które NLTK zapewnia dla korpusu nltk_data. Próbowałem,...

python nlp nltk corpus

19

Jak zbudować wyszukiwanie semantyczne dla danej domeny

Istnieje problem, który próbujemy rozwiązać, gdy chcemy przeprowadzić wyszukiwanie semantyczne naszego zestawu danych, tj. Mamy dane specyficzne dla domeny (przykład: zdania mówiące o samochodach) Nasze dane to tylko garść zdań, a my chcemy dać frazę i odzyskać zdania, które są: Podobne do tego...

python elasticsearch nlp sentence-similarity huggingface-transformers