Czytałem, że reprezentacja dystrybucyjna opiera się na hipotezie dystrybucyjnej, że słowa występujące w podobnym kontekście mają zwykle podobne znaczenie.
Word2Vec i Doc2Vec są modelowane zgodnie z tą hipotezą. Ale w oryginalnym artykule nawet one są zatytułowane jako Distributed representation of words and phrases
i Distributed representation of sentences and documents
. Tak więc, te algorytmy są oparte na reprezentacji dystrybucyjnej lub reprezentacji rozproszonej.
Co powiesz na inne modele, takie jak LDA i LSA.
male
royal
female
royal
Turian, Joseph, Lew Ratinov i Yoshua Bengio. „ Reprezentacje słowne: prosta i ogólna metoda częściowo nadzorowanego uczenia się ”. Materiały 48. dorocznego spotkania stowarzyszenia lingwistyki komputerowej. Association for Computational Linguistics, 2010. zdefiniuj reprezentacje dystrybucyjne i reprezentacje rozproszone w następujący sposób:
FYI: Jaka jest różnica między wektorami słów, reprezentacjami słów i osadzaniem wektorów?
źródło
Distributional
: Ma macierz wielkości WxC, a następnie jest zmniejszona do Wxd, gdzie d jest rozmiarem wektora osadzania. Używa rozmiarów okien do określenia kontekstu.Distributed
: Gęste, nisko wymiarowe wektory. Zachowuje ukryte cechy (właściwości semantyczne) w tych wymiarach.Odpowiedź Andreja Kutuzowa za pośrednictwem grup google była satysfakcjonująca
źródło