Czy ktoś nadal stosuje koncepcyjną teorię zależności?

11

Roger Schank wykonał interesującą pracę nad przetwarzaniem języka w Conceptual Dependency (CD) w latach 70. Potem wyszedł nieco z pola, będąc obecnie w edukacji. Było kilka użytecznych zastosowań w generowaniu języka naturalnego (BABEL), generowaniu historii (TAILSPIN) i innych obszarach, często obejmujących planowanie i odcinki, a nie pojedyncze zdania.

Czy ktoś jeszcze używał CD lub jego wariantów? Nie znam żadnych innych projektów poza PAULINE Hovy'ego, który wykorzystuje CD jako reprezentację dla generowania historii.

Oliver Mason
źródło

Odpowiedzi:

1

Czy ktoś nadal stosuje koncepcyjną teorię zależności?

Tak. Wielu ludzi. Zależności pojęciowe są kluczowe dla przekazywania pomysłów w języku naturalnym.

Oto tylko kilka publikacji w tym stuleciu, które opierają się na twórczości Schanka lub podróżują równolegle z jego kierunkiem w powiązanych dziedzinach.

Spotkałem Rogera Schanka w Hartford w 1992 roku podczas serii wykładów sponsorowanych przez laboratoria AI United Technologies Research Center i kilku innych firm z listy Fortune 500 w regionie. Cały jego wykład był serią opowiadań z badań nad sztuczną inteligencją. Każdą historię pamiętam 26 lat później.

Zabawkowe implementacje NLP, które dziś widzisz w terenie, bledną w porównaniu z opartymi na fabule systemami rozumowania i pamięcią zaproponowanymi przez dr Schank jako prawdopodobne wyjaśnienie obserwacji, które można poczynić na temat ludzkiej komunikacji głosowej.

Łatwo odgadnąć powód, dla którego przeniósł się do edukacji. Jego idee języka naturalnego i sztucznej inteligencji były około stu lat wcześniej i ponad głowami większości ludzi, którzy byli na wykładzie obok mnie.

Jeśli ty i ja uznamy jego uzasadnienia oparte na historii i propozycje pamięci za przekonujące, to prawdopodobnie jesteśmy o sto lat za wcześnie i jesteśmy nieco ponad wszelką wątpliwość w dzisiejszej dziedzinie NLP. Większość osób pracujących w laboratoriach w latach 80. uznało Schank za irytującego, a ludzie, którzy wygodnie pasują do współczesnej kultury technologicznej, uważają go za nieistotnego.

Niektóre z tych, z którymi miałem kontakt z projektem z University of Michigan w Ann Arbor, nie uważają jednak jego pracy za nieistotną, a ich praca jest zgodna z kierunkiem, który wskazał. Niestety klient NDA ogranicza mnie do dalszego komentowania tego projektu.

Powodem, dla którego nie powinniśmy i ostatecznie nie porzucimy idei, którą komunikujemy w opowieściach, jest to, że jest poprawna. Kiedy ktoś mówi: „Sprawia, że ​​chce mi się rzygać” lub „Ja też cię kocham”, bezpośrednia analiza zdań przy użyciu „nowoczesnych” technik nie jest ściśle związana z poprawną rekonstrukcją pomysłu w umyśle głośnik. Oba zdania odnoszą się do konceptualnych stosów współzależności, które nazywamy historią.

Jeśli dwie dziewczyny z imprezy są w damskim pokoju na koncercie w Borgore, a jedna z nich mówi: „Podaj mi bułkę”, interpretacja słowa „bułka” jest koncepcyjnie zależna. Jeśli głośnik stoi w miejscu, oznacza to jedno. Jeśli przy zlewie oznacza to inny.

Zawsze będzie jakiś segment społeczności badawczej, który to rozumie. Te, które nie budują automatów oszczędzających pieniądze, które będą odbierać połączenia telefoniczne z Twojej firmy, ale nie dadzą Ci rady na temat relacji z klientami, która wskazuje na problem z polityką.

Ci zabawkowi agenci NLP, dopóki nie rozwiną możliwości zaproponowanych przez dr Schank, nie rozpoznają po rozmowach telefonicznych z klientami, że ulepszenie produktu lub usługi jest okazją, która czeka na wykorzystanie, i nie opowiedzą historii, która cię przekona że skorzystasz z tego, że jako pierwszy skorzystasz z okazji.

Douglas Daseeco
źródło
1

Chociaż model ten odegrał ważną rolę w naszym obecnym rozumieniu NLP i NLU, nie jest on już użyteczny w systemach produkcyjnych i obecnie żaden udany produkt komercyjny nie stosuje takiego podejścia.

W CDT celem było zaprojektowanie systemu AI, który mógłby wyciągać logiczne wnioski ze zdań. W tym systemie celem było uniezależnienie znaczenia od słów użytych na wejściu.

Zdania modelowane przez CDT przy użyciu tokenów, takich jak: lokalizacje, czas, działania w świecie rzeczywistym i obiekty w świecie rzeczywistym. Jednak gdy moc obliczeniowa stała się bardziej powszechna i tańsza, zainteresowanie skierowano na modele statystyczne, które obecnie przewyższały poprzednie systemy oparte na regułach.

Problem z podejściami opartymi na regułach, takimi jak CDT, polega na tym, że wymagają one ręcznego opracowania reguł językowych, które mogą być kosztowne i które zwykle nie są ogólnie uogólnione na inne języki.

Z drugiej strony, podejścia statystyczne bardziej efektywnie wykorzystują zasoby języka ludzkiego (wielojęzyczne korpusy tekstowe). Zamiast stosować podejście oparte na regułach, modele statystyczne podejmują miękkie decyzje probabilistyczne oparte na dołączaniu rzeczywistych wag do funkcji tworzących dane wejściowe. (Wikipedia NLP)

To efektywne wykorzystanie zasobów języka ludzkiego prowadzi do modelu, który jest bardziej dokładny i niezawodny, zwłaszcza gdy otrzymuje się nieznane dane wejściowe lub dane zawierające błędy. Modele statystyczne również dobrze uogólniają się na inne języki.

Seth Simba
źródło
Dzięki za odpowiedź; Mam świadomość modeli statystycznych i ich właściwości, ale w przypadku tego pytania interesowałem się tylko CDT!
Oliver Mason
Temat był przyjemnością do badań i odpowiedzi. Na końcu przedstawiłem modele statystyczne do porównania, ale rozumiem całkowicie.
Seth Simba