Jakie funkcje są ogólnie używane z drzew parsowanych w procesie klasyfikacji w NLP?

13

Badam różne typy struktur drzewiastych. Dwie powszechnie znane struktury drzewa analizy składniowej to: a) drzewo analizy składniowej oparte na okręgach wyborczych oraz b) struktury drzewiaste analizy składniowej opartych na zależnościach.

Potrafię używać generowania obu typów struktur drzewiastych przy użyciu pakietu Stanford NLP. Nie jestem jednak pewien, jak wykorzystać te struktury drzewne do mojego zadania klasyfikacji.

Na przykład, jeśli chcę przeprowadzić analizę sentymentu i podzielić tekst na kategorie dodatnie i ujemne, jakie cechy mogę czerpać ze struktur parsowania drzewa dla mojego zadania klasyfikacji?

pracujący
źródło

Odpowiedzi:

9

Korzystając z drzewa analizy, dzielisz zdanie na części. Załóżmy, że w przykładzie analizy sentymentu można użyć tych części, aby przypisać pozytywne / negatywne nastroje każdej części, a następnie przyjąć łączny efekt tych części.

analiza nastrojów

Ten obraz pomoże Ci zrozumieć więcej. Pierwsza połowa ma negatywny sentyment (głównie ze względu na słowo „wytrawny”), ale z powodu słowa „ale” i użycia słowa „cieszył się”, negatywny sentyment zamienia się w sentyment pozytywny.

Jeśli chodzi o ich użycie, możesz po prostu wygenerować wektorową reprezentację poszczególnych słów w zdaniu i użyć neuronów zamiast węzłów rodzicielskich. Każdy neuron powinien być podłączony do innego neuronu za pomocą obciążników. Wszystkie węzły liścia będą wektorowymi reprezentacjami słów zdania. Górny neuron macierzysty (w tym przypadku górny niebieski symbol +) powinien generować pozytywne / negatywne nastroje zgodnie ze zdaniem. Tę strukturę drzewa można trenować w nadzorowany sposób.

Przeczytaj ten artykuł, aby uzyskać więcej zrozumienia.

Zdjęcia: cs224.stanford.edu

Azrael
źródło
1

Myślę, że zależności mogą być wykorzystane do poprawy dokładności twojego klasyfikatora nastrojów. Rozważ następujące przykłady:

E1: Bill nie jest naukowcem

i załóżmy, że token „naukowiec” ma pozytywne nastawienie w określonej dziedzinie.

Znając zależność neg (naukowiec, nie), widzimy, że powyższy przykład ma negatywny sentyment. Bez znajomości tej zależności prawdopodobnie sklasyfikowalibyśmy zdanie jako pozytywne.

Inne typy zależności można prawdopodobnie zastosować w ten sam sposób, aby poprawić dokładność klasyfikatorów.

Pasmod Turing
źródło