Czy ontologie i sieć semantyczna są martwe? [Zamknięte]

10

Czy sieć semantyczna nie żyje? Czy ontologie są martwe?

Opracowuję plan pracy dla mojej pracy magisterskiej na temat „Baza wiedzy poprzez ustaloną ontologię dla grup interesu wokół mokradeł” . Badam i opracowuję dla niego ontologie, ale wciąż nie jestem pewien, co do wielu rzeczy. Jaki jest język modelowania dla ontologii?

Która metodologia ontologii jest lepsza? OTK czy METONOLOGIA ?

Czy jest jakiś program, który robi to samo?

Cratilo to oprogramowanie do analizy ciał tekstowych i do wydobywania określonych warunków dziedziny studiów (opracowane przez profesorów Jorge Antonio Mejia, Francisco Javiera Alvareza i Johna Albeiro Sáncheza, Institute of Philosophy University of Antioquia). Umożliwia analizę leksykalną tekstów, identyfikację słów, które pojawiają się w tekście pod kątem ich częstotliwości i lokalizacji. Poprzez proces rozpoznawania Cratylus identyfikuje wszystkie słowa w tekście i buduje bazę danych, która staje się szkicową analizą pracy. Czy istnieją inne podobne narzędzia?

Czy terminy znalezione przez Cratilo można wykorzystać do stworzenia bazy wiedzy?

Jakie są istniejące otwarte ramy semantyczne, które można wykorzystać do takich rzeczy?

Czy istnieje oprogramowanie, które automatycznie tworzy RDF, OWL i XML? Jak działa Tails? Jena? Sezam?

Antonio Edgar Martinez
źródło
2
W Twoim poście jest za dużo pytań. Powinieneś spróbować to rozdzielić.
Jakub Kotowski
Przekazałeś to również do opendata. Proszę przeczytać: meta.stackexchange.com/questions/64068/…
Spacedman

Odpowiedzi:

15

(Chociaż uważam, że twoje pytanie zwykle nie jest uważane za dobre pytanie dla tej witryny, myślę, że należy je zachować, ponieważ prawie wszyscy nowi zawodnicy są na początku podobnie zdezorientowani i trudno jest znaleźć proste, trzeźwe i zrównoważone informacje o tym.)

Czy sieć semantyczna nie żyje? Czy ontologie są martwe?

Wiele osób odeszło od Semantic Web. Z drugiej strony nadal wielu go używa. Zawsze istniało wiele zamieszania co do jego wartości. Istnieją przypadki użycia, które rzeczywiście korzystają z semantycznych technologii sieciowych, ale jest ich niewiele i są bardzo odległe.

Połączone otwarte dane

Po części dlatego utworzono podpole Połączonych otwartych danych. Możesz zobaczyć Połączone dane jako bardziej pragmatyczną, pozbawioną dostępu wersję Semantic Web (lub jako niezbędny czynnik umożliwiający lepszą wizję semantycznej sieci).

Powiązane dane, choć bardziej pragmatyczne, wciąż wykorzystują ontologie. Po prostu nie jest tak sprytne używanie OWL i projektowanie najpierw ontologii w bardzo formalny sposób.

Baza wiedzy, taka jak Freebase (obecnie zastępowana przez Wikidata ), nawet nie bazuje na technologiach Semantic Web (zawsze jednak była dostępna również w formie zrzutów RDF). Z drugiej strony nawet Freebase opiera się na koncepcjach podobnych do tych w Semantic Web i ma pewną formę ontologii.

Oprogramowanie do generowania ontologii

Nie ma oprogramowania, które automatycznie tworzyłoby dla ciebie wysokiej jakości ontologie. Przynajmniej nie w sensie ontologii logiki OWL / pierwszego rzędu. Z drugiej strony wiele rodzajów oprogramowania, w tym wspomniane przez ciebie Cratilo, może pomóc Ci zbudować niższy krok w spektrum semantycznym, np. Glosariusz, a może nawet folksonomię, którą później można przekształcić w taksonomię lub ontologię inne algorytmy. Może nawet istnieć oprogramowanie do tworzenia pełnowymiarowych ontologii OWL, ale myślę, że nadal jest to raczej aktywny obszar badań.

Ontologie i metodologie

Jak zawsze, zależy to dokładnie od twoich potrzeb i celów. W dziedzinach takich jak biomedycyna i nauki o życiu generalnie tworzą złożone formalne ontologie, ponieważ mają dane o bardzo zróżnicowanej strukturze, a ontologie pomagają im utrzymać porządek i użyteczność. Natomiast e-sklepowi lepiej byłoby trzymać się normalnego relacyjnego modelowania bazy danych i dodawać tylko globalne identyfikatory (URI) w duchu połączonych danych, jeśli chcą później zbudować odpowiedni wykres wiedzy.

Nawet jeśli potrzebujesz ontologii, możesz najpierw pominąć metodykę. Zwłaszcza jeśli jesteś naprawdę nowy w branży i nie masz pojęcia, jakie są twoje potrzeby.

Jena, Sezam, ...

Jena, Sezam, Virtuoso itp. To potrójne sklepy - służą do przechowywania i wysyłania zapytań RDF. Większość ontologii może być reprezentowanych w RDF. Nawet te napisane w SOW. RDF ma część semantyczną, RDF / S, która pozwala sformułować kilka podstawowych ontologii. To może wystarczyć na początek. Nawet RDF / S może być mylące i zawiłe, kiedy zaczniesz myśleć o pustych węzłach, nazwanych grafach (czy są naprawione? Czy są dynamiczne?) Itp.

Chociaż uważam, że twoje pytanie zwykle nie jest uważane za dobre pytanie dla tej witryny, myślę, że należy je zachować, ponieważ prawie wszyscy początkujący w tej dziedzinie są na początku podobnie zdezorientowani i trudno jest znaleźć proste, trzeźwe i zrównoważone informacje na temat to.

Jakub Kotowski
źródło
bardzo dziękuję, przepraszam za tak wiele pytań, czy po raz pierwszy korzystam z wymiany stosów, jestem zdezorientowany moim projektem dyplomowym, nie mam doradców ani dyrektorów studiów :( i jestem zagubiony na temat ontologii informacji, jestem próbuję ustrukturyzować mój projekt dyplomowy na mokradłach, ontologiach i zarządzaniu wiedzą, ale nie chodzi o to, czy mam się dobrze. Jeszcze raz dziękuję za pomoc. przepraszam za mój angielski, próbuję go poprawić
Antonio Edgar Martinez
@AntonioEdgarMartinez proszę zaakceptować jedną z odpowiedzi. Sugeruję zaakceptowanie odpowiedzi jkbkot, ponieważ jest ona bardziej wyczerpująca niż moja.
Wojciech Walczak
2

W Twoim poście jest zbyt wiele problemów ogólnych.

Zdecydowanie jesteśmy teraz w erze letniej AI (w przeciwieństwie do zimy AI ), a badania nad Semantyczną Siecią przyciągają mniej uwagi.

Nadal istnieje wiele projektów związanych z budowaniem ontologii. Google ma Graf wiedzy i Skarbiec wiedzy . Oba używają Freebase (między innymi źródłami).

Istnieją dziesiątki linków, które mogę podać, aby odpowiedzieć na niektóre pytania, ale najlepszą rzeczą, jaką możesz zrobić, to przeglądać strony W3C Semantic .

Spójrz na RDF, SPARQL, OWL, Virtuoso, Protege - to de facto standardy.

Jeśli chodzi o wydobywanie ontologii z korpusów tekstowych - istnieją różne narzędzia. Żadna z nich nie jest idealna, więc naprawdę musisz przeprowadzić badania i znaleźć coś, co odpowiada Twoim potrzebom. Na przykład istnieje OntoLearn Reloaded (ten artykuł jest stosunkowo nowy, więc możesz sprawdzić bibliografię, aby poszukać innych podejść).

Wojciech Walczak
źródło
bardzo dziękuję, przepraszam za tak wiele pytań, czy po raz pierwszy korzystam z wymiany stosów, jestem zdezorientowany moim projektem dyplomowym, nie mam doradców ani dyrektorów studiów :( i jestem zagubiony na temat ontologii informacji, jestem próbuję uporządkować mój projekt dyplomowy na terenach podmokłych, ontologiach i zarządzaniu wiedzą, ale nie chodzi o to, czy mam się dobrze. Jeszcze raz dziękuję za pomoc. przepraszam za mój angielski, staram się go poprawić
Antonio Edgar Martinez
2

Istnieje również akademicki projekt DBPedia , wersja RDF podzbioru Wikipedii.

Według wyszukiwarki Alexa, która uszeregowuje witryny według popularności w Internecie, znajduje się wśród 100 000 witryn - nieźle, nie bez znaczenia.

Wydaje się, że ogólne zainteresowanie witryną DBpedia.org w latach 2015–2016 było dość stałe. Zobacz zrzut ekranu.

dbpedia timeseries 2015

Inne podobne strony (według Alexy) są znacznie mniej popularne.

Powiedziałbym więc, że semantyczna akceptacja sieci nie jest martwa, po prostu pachnie śmiesznie.

knb
źródło