Jaka jest różnica między używaniem RDFS / OWL a XML?

10

Zastanawiałem się, jakie zalety mają języki ontologiczne RDFS / OWL w porównaniu do używania systemu znaczników / znaczników (takiego jak http://www.schema.org/ ) do zarządzania i tworzenia metadanych?

Tezaurus Webstera
źródło
3
Silnik wnioskowania, właśnie to. O dziwo żadna z poniższych odpowiedzi nie mówi. Silniki takie jak Jena mogą wnioskować nowe dane i korzystać z właściwości przechodnich.
Andrew T Finnell,
2
@AndrewFinnell opublikuj bardziej szczegółowe wyjaśnienie jako odpowiedź
Andrew, zgadzam się i głosowałbym za twoją odpowiedzią. Istniejące obecnie odpowiedzi poniżej są niedoinformowane i niskiej jakości.
Dibbeke
@AndrewFinnell, również chciałbym, abyś opublikował własną odpowiedź, zastanawiam się również, czy wnioskowanie wykracza poza zakres PO, czy nie. (Początkowo tak myślałem, ale może nie jest)
ZJR

Odpowiedzi:

5

Twoje pytanie nie ma sensu. RDFS jest bardzo podstawowym językiem schematu do wyrażania ograniczeń RDF. OWL jest bardziej zaawansowanym schematem do wyrażania skomplikowanej ontologii. Nie mają absolutnie nic wspólnego z XML, poza tym, że mogą być wyrażone w XML.

Stefano Borini
źródło
4

Nie można się bardziej zgodzić z odpowiedzią ZJR. Jest całkowicie niedoinformowany.

  1. Jak analizujesz mikrodane? Co też parsuje? RDFa analizuje RDF, wspólny model danych, o który prosi sieć semantyczna. Mikrodane w zasadzie powstały, ponieważ Hickie nie mógł zadać sobie trudu, aby przeczytać specyfikacje RDF i RDFa. Może to być łatwiejsze dla programisty, ale nie jest lepsze dla sieci (tj. Leniwe )
  2. Lista typowych słowników OWL znajduje się poniżej:

  3. Nadchodzi kolejne wydanie RDF, w tym nowe formaty serializacji, takie jak Turtle i RDFj

  4. SPARQL 1.1 jest również natychmiastowo wymagalny. Federacja zapytań, wyrażenie ścieżki właściwości, aktualizacja SPARQL i wiele więcej.

  5. BBC jest zbudowany na RDF. Interfejs API wykresów Facebooka zapewnia RDF (to prawda, możesz uszanować URI wykresu za pomocą nagłówka text / turtle Accepts i odzyskać RDF) i wielu innych dużych korporacji.

Podsumowując, Semantic Web, RDF, RDFS, OWL, SPARQL i wszystkie standardy Semantic Web są bardzo żywe i ekscytujące. Jeśli mi nie wierzysz, spójrz na całą aktywność na http://www.semanticoverflow.com

William Greenly
źródło
BBC jest zbudowany na RDF, chociaż mapuje na mikrodane, więc? Odbudowali witrynę w dekadzie 2000-2010 w czasie, gdy W3C zapowiadało wspaniałe magiczne narzędzia dla RDF, narzędzia te tak naprawdę się nie zmaterializowały, RDF jest tam spuścizną. Solidna struktura organizacyjna, ale okropne do udostępnienia, mikrodane obejmują ostatnią milę. (i uratuj dzień)
ZJR
a potem kilka: przydatny SPARQL jest już nieuchronny od zawsze, sformułowanie specyfikacji RDF było używane do zasysania dużej ilości czasu i odstraszyło większość potencjalnych implementatorów przez lata. (nie wiem, czy to naprawili, czy naprawili to imho, i tak zbyt późno ), a potem RDF<some-letter>nomenklatura generuje zamieszanie i kłótnie przez cały czas.
ZJR
1
BBC jest zbudowany na RDF przy użyciu BigOWLIM, a nie mikrodanych. Mircodata nie jest kanonicznym formatem danych. Jest dodatkiem do HTML. Nowa platforma olimpijska jest w całości zbudowana na RDF, jak wspomniano w komunikatach prasowych i prezentacjach w ich Akademii.
William Greenly,
4

RDF / OWL vs XML jest fałszywą alternatywą. W rzeczywistości jedną z popularnych serializacji jest użycie XML.

Również RDF / OWL vs mikroformaty jest fałszywą alternatywą. W rzeczywistości istnieją standardy, które pozwalają na użycie RDF jako mikroformatu, eRDF i oficjalny RDFa W3C ze standardowym sposobem osadzania go w HTML5 .

Tak naprawdę pytanie brzmi, jaka jest zaleta korzystania ze standardowych formatów zatwierdzonych przez W3C. Powody są następujące:

  • istnieje już wiele ontologii, w tym najczęściej używanych, takich jak Dublin Core i FOAF .
  • wiele potrójnych sklepów kompatybilnych z RDF / OWL dla większości języków programowania.
  • różne wyżej wspomniane potrójne sklepy zawierają mechanizmy wnioskowania z interfejsem SPARQL .

Ogólnie rzecz biorąc, nie widzę powodu, dla którego warto wybrać niestandardowy mikroformat inny niż W3C.

vartec
źródło
1

RDF i OWL to ustalone standardy kodowania danych semantycznych i ich schematów na znacznie głębszym i ogólnym poziomie niż znaczniki ad-hoc.

Na przykład za pomocą OWL możesz zdefiniować nowy schemat, który będzie przynajmniej częściowo zrozumiany przez inne narzędzia (ponieważ możesz mieszać różne schematy OWL / RDF razem). W ten sposób możesz wyeksportować z jednego zestawu danych różne „widoki” i umożliwić wszystkim współpracę. Możesz także po prostu „odkrywać” połączenia między obiektami i ich właściwościami.

W przypadku mikrodanych jest to w zasadzie doraźny, zaakceptowany zestaw rzeczy, które można zastosować, a nie ogólna platforma semantyczna.

p_l
źródło
Nadal jestem zdezorientowany, w jaki sposób RDF różni się od RDFS różni się od OWL ... Czy te terminy mogą być używane zamiennie ...?
Webster Thesaurus,
@WebsterThesaurus RDF jest dość prostym językiem do opisywania pojęć opartych na trzech potęgach podmiotu-czasownika. RDFS jest schematem RDF, w zasadzie predefiniowanym zestawem terminów, aby ułatwić zdefiniowanie znaczenia relacji. OWL to system opisu ontologicznego, znacznie potężniejszy niż RDFS, ale trudniejszy do wdrożenia
p_l
1

Chciałbym zacząć od zauważenia, że ​​ta odpowiedź nie jest napisana przez eksperta w tej dziedzinie. Chociaż jestem zwolennikiem semantycznych systemów rozproszonych, myślę, że zastosowania OWL są obecnie ograniczone. Chociaż dokładne opisanie niszy, w której można zastosować OWL, wykraczałoby poza zakres tej odpowiedzi, być może uda mi się ujawnić niektóre plusy i minusy.

OWL jest w zasadzie językiem, który pozwala wyrażać konstrukty semantyczne za pomocą klasyfikacji, podobnie jak klasy znane z OOP i ograniczenia między klasami i ich instancjami. Można to postrzegać jako bardziej formalny i bardziej uporządkowany sposób opisywania relacji, które znasz z relacyjnej bazy danych.

Aby opisać i komunikować ten język, należy go zserializować do określonego formatu. Istnieje kilka formatów, z których RDF jest tylko jeden.

Istnieją trzy różne poziomy OWL, pozwalające na zwiększenie ekspresji, ale ograniczające obliczalność (np. Czy możesz znaleźć możliwe rozwiązanie pytań, które zadajesz bazie wiedzy opisanej przez definicję OWL). Są to OWL Lite, DL i Full.

Najważniejszą zaletą korzystania z OWL / RDF jest wymiana wiedzy między różnymi bazami wiedzy (lub hierarchiami klasyfikacji) i tworzenie użytecznych wniosków bez konieczności wcześniejszego opracowywania wszystkich tych baz, aby umożliwić im komunikację. Odbywa się to częściowo poprzez zdefiniowanie klas równoważności. Korzystanie z przestrzeni nazw pozwala inżynierowi ustalić niepowtarzalność; przydatny paradygmat.

Kolejną zaletą jest stale rosnąca liczba mechanizmów wnioskowania i języków zapytań. W naszym sieciowym świecie istnieje zapotrzebowanie na rozproszoną wymianę wiedzy.

Być może istotną wadą jest względnie duża złożoność ustalenia obliczalności wnioskowania oraz ich ograniczeń przestrzennych i czasowych. Na przykład. w OWL full możesz poprosić o wnioski, których nie można udowodnić. Zatem z pewnością istnieje ograniczenie mocy OWL.

Wiedza OWL jest dyskretna ... nie ma półprawd ani systemów wierzeń. Posiadanie ich najprawdopodobniej spowodowałoby, że rozwiązania byłyby zbyt złożone.

Ale najważniejszą wadą mojego gustu jest to, że po prostu nie można znaleźć wielu dobrych inżynierów w tej dziedzinie. Potrzebujesz inżyniera wiedzy, jednego lub dwóch informatyków i małego zespołu programistów, aby zbudować nawet niewielką bazę wiedzy. Dlatego często znacznie tańszym i skuteczniejszym jest używanie tylko języków opisowych, takich jak schemat XML i opisywanie potrzebnej semantyki w dokumencie czytelnym dla człowieka.

Dibbeke
źródło
0

RDFS polega na opisie danych strukturalnych. Byłoby o wiele bardziej przydatne, gdyby zawierał metody lub funkcje, abyśmy mogli opisać interfejsy z nim. Obecnie potrzebujesz dodatkowego słownika, aby to zrobić, na przykład WSDL lub Hydra przez usługi sieciowe. Wydaje mi się, że jest też słownictwo dla OOP, po prostu nie znam wielu słowników.

OWL przypomina XSD, chodzi o sprawdzanie poprawności danych, na przykład jeśli oczekujesz ciągu zawierającego co najwyżej 20 znaków, używasz OWL do opisania tej reguły i wygenerowania walidatora. Teoretycznie możesz zrobić to samo z RDFS i XSD, nie mam pojęcia, dlaczego ludzie musieli wymyślić OWL zamiast po prostu używać XSD. Być może dzieje się tak, ponieważ XSD nie jest oparty na RDFS, więc na przykład ciąg XSD nie jest potomkiem literału RDFS.

Schema.org opisuje popularne klasy, na przykład Person. Tworzą swój własny RDFS jak vocab, który zawiera Thing zamiast rdfs: Class, domainInclude zamiast rdfs: domain, rangeIncludes zamiast rdfs: range i tak dalej zamiast korzystania z RDFS. Ich ograniczone typy są również ad-hoc, używają tekstu i liczby bez ich definiowania lub łączenia ich przynajmniej z plikami rdfs: dosłownymi lub XSD. O ile wiem, nie używają XSD ani OWL do definiowania typów ograniczonych. Nie jestem pewien, czy są jakieś ograniczenia w ich słownictwie, ale jeśli tak, to chyba wspominają o tym w czytelnych dla ludzi opisach, więc nie będziesz w stanie wygenerować odpowiedniego walidatora przeciwko schema.org, co możesz zrobić, jeśli one użyłby XSD / OWL i RDFS.

Myślę więc, że zaletą korzystania ze standardów takich jak RDFS, XSD, OWL jest to, że można pisać biblioteki, których można używać ponownie w każdym dokumencie.

inf3rno
źródło
-2

W celu opracowania przyszłych produktów, pliki RDFS / OWL XML należy uznać za prawie martwe i zniknęły.

Wymagają zbyt wiele pracy, aby wyrazić koncepcje, które niestandardowe rozwiązanie oparte na niestandardowych formatach tekstowych wyraziłoby lepiej , przy jednoczesnym zachowaniu czytelności i edytowalności danych zarówno dla ludzi, jak i maszyn. Nie dodają żadnej realnej wartości i tylko sprawiają, że życie jest trochę bardziej nieszczęśliwe dla każdego, kto się na nich natknie. (i musi poradzić sobie z nazewnictwem przestrzeni nazw)

Na ich podstawie istnieją jednak gigantyczne rozwiązania do obsługi dokumentów, które zostały niedawno opracowane, wdrożone i są w bieżącej eksploatacji. Grożą bardzo długo. Wielu programistów w przyszłości będzie niewątpliwie cierpieć na wiele WTF indukowanych przez RDF i OWL.

MICRODATA systemy (wersja walidator w obsłudze od mikroformatach ), takie jak te opisane w schema.org , obecny zamiast wiele korzyści dla deweloperów, wydawców, jak i czytelników, podobnie; zarówno ludzkie, jak i mechaniczne.

Pojęcia RDF (te, które warto oszczędzić) można bezboleśnie zmapować (i faktycznie są jawnie zmapowane) na reprezentacje mikrodanych.

Pozycje mikrodanych pozwalają autorom i systemom obsługi dokumentów wzbogacać komunikację w sposób, który jest dość łatwy (tak prosty jak CSS lub DOM) w obsłudze i dostosowaniu do czytnika.

ZJR
źródło
Czekaj, nie rozumiem ... więc czym mikrodane różnią się od XML / HTML? Plan opisany w schema.org mówi wyraźnie, że używają znaczników na swoich stronach internetowych ... czy to nie to samo, co XML i HTML?
Webster Thesaurus,
A jeśli Microdata jest o wiele lepsza, dlaczego W3C naciska na RDFS / OWL, a nie sama Microdata?
Webster Thesaurus,
Myślę, że ta odpowiedź jest dość myląca, ponieważ RDF! = XML. Kodowanie RDF w XML jest tylko jednym z wielu i zostało zaprojektowane w celu włączenia do istniejących aplikacji XML. Co więcej, powrót do systemów niestandardowych (tak, w tym mikrodanych) oznacza powrót do „pisania niestandardowego parsera dla ch * rowania wszystkiego” zamiast korzystania z ogólnego słownictwa. Dzięki RDF / OWL mogę mieszać różne aplikacje, z których każda pracuje na podzbiorze danych, a także pisać elastyczny kod, który ma automatyczne odbicie - dobrym przykładem jest Xanasys LinkExplorer.
p_l
1
Bezinformacyjna opinia. Pokaż odniesienia do kopii zapasowej tych roszczeń.
Dibbeke,
@Dibbeke Moim pierwotnym przypuszczeniem było to, że OP szukał pragmatycznych metadat. RDF w tym przypadku to przesada. Wyrażona część odnosi się do mojego przekonania, że ​​RDF jest zawsze przesadą .
ZJR