Chcę użyć implementacji word2vec Google do zbudowania systemu rozpoznawania nazwanych jednostek. Słyszałem, że rekurencyjne sieci neuronowe z wsteczną propagacją przez strukturę dobrze nadają się do zadań rozpoznawania nazwanych bytów, ale nie byłem w stanie znaleźć porządnej implementacji lub przyzwoitego samouczka dla tego typu modelu. Ponieważ pracuję z nietypowym korpusem, standardowe narzędzia NER w NLTK i podobnych działały bardzo słabo i wygląda na to, że będę musiał wyszkolić własny system.
Krótko mówiąc, jakie zasoby są dostępne dla tego rodzaju problemu? Czy dostępna jest standardowa rekurencyjna implementacja sieci neuronowej?
machine-learning
python
neural-network
nlp
Madison May
źródło
źródło
Odpowiedzi:
Zamiast „rekurencyjnych sieci neuronowych z propagacją wsteczną” można rozważyć podejście zastosowane przez Frantzi i in. glin. w National Center for Text Mining (NaCTeM) na University of Manchester for Termine (patrz: http://www.nactem.ac.uk/index.php i http://personalpages.manchester.ac.uk/staff/sophia. ananiadou / IJODL2000.pdf ) Zamiast głębokich sieci neuronowych „łączą informacje językowe i statystyczne”.
źródło
Dwa ostatnie artykuły wykorzystują architekturę Deep learning o nazwie CharWNN, aby rozwiązać ten problem. CharWNN został po raz pierwszy użyty, aby uzyskać najnowocześniejsze wyniki (bez ręcznie wykonanych funkcji) w tagowaniu części mowy (POS) na angielskim korpusie.
Drugi papier tego samego autora wykorzystuje ten sam (lub podobny) architektura przewidywania tego, czy słowo należy do 10 nazwanych klas podmiotu, z pozorną stanu rezultatów artystycznych.
źródło
Spróbuj http://deeplearning4j.org/word2vec.html . Ma implementację Word2Vec używaną zamiast Bag of Words dla NER i innych zadań NLP.
źródło
Oto kilka pomysłów na to, jak używać wektorów słów dla NER, która przyjmuje przeważnie nienadzorowane podejście skoncentrowane na word2vec.
findCluster(['joy', 'surprise', 'disgust', 'trust', 'fear', 'sadness', 'anger', 'anticipation'])
może zwrócić listę zawierającą setki słów związanych głównie z emocjami. Jeśli nazwiesz tę listę „emocjami”, wówczas masz nazwane pojęcie „emocja” zdefiniowane na podstawie przestrzeni wektorowej.źródło