Do eksperymentów chcielibyśmy użyć Emoji osadzonego w wielu tweetach jako podstawowych danych o prawdzie / treningu do prostej ilościowej analizy wrażliwości. Tweety są zwykle zbyt nieustrukturyzowane, aby NLP działało dobrze.
W każdym razie w Unicode 6.0 jest 722 Emoji, a prawdopodobnie kolejne 250 zostanie dodanych w Unicode 7.0.
Czy istnieje baza danych (jak np. SentiWordNet), która zawiera adnotacje o nich?
(Zauważ, że SentiWordNet również dopuszcza niejednoznaczne znaczenia. Rozważ np. Zabawne , co nie jest po prostu pozytywne: „to smakuje zabawnie” prawdopodobnie nie jest pozytywne ... to samo ;-)
na przykład. Ale nie sądzę, że jest to trudniejsze dla Emoji niż dla zwykłych słów ...)
Ponadto, jeśli masz doświadczenie w stosowaniu ich do analizy nastrojów, chętnie się o tym dowiemy.
źródło
Odpowiedzi:
W sumie 972 emoji nie jest tak duże, że nie można ich ręcznie opisać, ale wątpię, czy będą działać jako dobra podstawowa prawda. Źródła takie jak Twitter są pełne ironii, sarkazmu i innych trudnych ustawień, w których symbole emocjonalne (takie jak emoji lub emotikony) oznaczają coś innego niż normalna interpretacja. Na przykład ktoś może napisać „xxx oszukał swoich klientów, a teraz sami się oszukują! Ha ha ha!: D”. Jest to zdecydowanie negatywny komentarz, ale autor cieszy się, że firma xxx ma kłopoty, a tym samym dodaje pozytywną emotikon. Te przypadki nie są tak częste, ale zdecydowanie nie są odpowiednie dla prawdziwej prawdy.
Znacznie bardziej powszechnym podejściem jest użycie emotikonu jako zarodka do zbierania rzeczywistego zestawu danych . Na przykład w tym artykule autorzy używają emotikonów i znaczników skrótu emocjonalnego do przechwytywania leksykonu słów przydatnych do dalszej klasyfikacji.
źródło
Uznałem, że to repozytorium Github jest przydatne (dobry początek): https://github.com/wooorm/emoji-emotion Lista emoji ocenionych na wartościowość z liczbą całkowitą od minus pięć (ujemna) do plus pięć (dodatnia).
Zobacz listę obsługiwanych emotikonów Unicode: https://github.com/wooorm/emoji-emotion/blob/master/Support.md
źródło