VIVO-Handbuch/Daten strukturieren/Open Refine/Nutzung von Ontologien

Aus Handbuch.io


Kontributoren: N.N.
Stand: 27.02.2015


Verwalten von Ontologien

Um effektiv mit diesem Bereich von Google Refine arbeiten zu können, empfiehlt es sich, den Datensatz genau angesehen zu haben und sich anschließend Gedanken gemacht zu haben, welche Ontologien[1] gebraucht werden. Grundsätzlich verfügbar sind die Ontologien RDFS[2], FOAF[3], XSD[4], OWL[5] und RDF, welche häufig nicht ausreichen, um einen Datensatz angemessen beschreiben zu können. Um weitere Ontologien verfügbar zu machen, gibt es zwei Möglichkeiten. Entweder man klickt in der blauen Zeile mit der Bezeichnung Available Prefixes direkt auf auf das Plus-Zeichen mit add prefix dahinter geschrieben oder auf das Zahnrad mit manage prefixes und anschließend auf Add Prefix. Bei letzterer Möglichkeit öffnet sich eine Übersicht über die verfügbaren Ontologien mit Präfixen und URIs, sowie den Möglichkeiten die Ontologien zu löschen (Delete) oder neu zu laden (Refresh') (siehe Abbildung 1). Nach dem Klick auf add prefix öffnet sich ein neues Fenster mit der Überschrift New Prefix und den entsprechenden Eingabemöglichkeiten (siehe Abbildung 2).

Das Hinzufügen bekannter Ontologien ist sehr einfach, da einfach nur das bekannte Präfix eingetragen werden muss (siehe Abbildung 3) und Open Refine fügt die passende URI[6] automatisch hinzu (siehe Abbildung 4). Bei neuen Ontologien muss die URI selbst eingetragen werden. Abschließend auf OK klicken und Open Refine versucht die Ontologie zu importieren (siehe Abbildung 5). Die hinzugefügten Ontologien werden ebenfalls in der blauen Zeile mit ihren Präfixen angezeigt (siehe Abbildung 6).

Tripel definieren

Zuerst muss ein Wurzelknoten definiert werden, Open Refine gibt immer die erste Spalte, normalerweise die Nummerierung, vor; mittels Add another rood node ließe sich dies jedoch ändern bzw. weitere Wurzelknoten erstellen. Das erste Tripel wird die Typendeklaration des Wurzelknoten, welche vorgenommen werden kann, nachdem man auf add rdf:typ geklickt hat (siehe Abbildung 7).

Nach dem Klick öffnet sich ein Fenster in dem man nach den Klassen suchen kann (siehe Abbildung 8). Da hier nur Klassen aus den Ontologien angezeigt werden, die auch hinzugefügt wurden, empfiehlt es sich, sich vorher Gedanken über die notwendigen Ontologien gemacht zu haben (vgl. Verwalten von Ontologien).

Bei der Suche nach Klassen bieten sich zwei Vorgehensweisen an. Entweder gibt man das Präfix einer Ontologie ein und sucht dann in den Klassen dieser Ontologie nach einer passenden (siehe Abbildung 9) oder man gibt Zeichenkombinationen einer möglichen Klassenbezeichnung ein und schaut ob es diese gibt bzw. ob sie passend wäre (siehe Abbildung 10).

Nach der Auswahl einer Klasse wird diese im RDF-Gerüst angezeigt. Es lassen sich auch mehrere Klassen zuordnen (siehe Abbildung 11).

Klickt man nun auf den Reiter RDF Preview welcher sich rechts des Reiters RDF Skeleton befindet, gelangt man zu einer Vorschauansicht bei der alle bisher definierten Daten in Turtle[7] angezeigt. Die Angaben beginnen immer mit der Auflistung der hinzugefügten Ontologien (siehe Abbildung 12).

Das Vorgehen bei den Propertys ist genauso, nur das hier für das Hinzufügen auf add property geklickt werden muss. Da Open Refine von sich aus eine Spalte für Propertys und die dazugehörigen Objekte anlegt (siehe Abbildung 13), müssen theoretisch nur die passenden Propertys bzw. Klassen definiert werden. Nach dem eine Property definiert wurde, lassen sich weitere nach einem Klick auf add property hinzufügen (siehe Abbildung 11). Nach dem dies für alle Spalten durchgeführt wurde, wird die Vorschau unter RDF Preview entsprechend aktualisiert und könnte dann wie in Abbildung 14 aussehen.

Daten mit Ontologien verknüpfen

Um das RDF-Gerüst anpassen zu können, muss dieses zuerst ausgewählt werden. Hierzu wird oben rechts in der Anwendung auf den grauen Schalter RDF geklickt und in dem sich öffnenden Menü auf Edit RDF Skeleton... (siehe Abbildung 15). Im Anschluss öffnet sich das RDF Schema Alignment Fenster (siehe Abbildung 16).





Einzelnachweise

  1. https://de.wikipedia.org/wiki/Ontologie_(Informatik)
  2. Resource Description Framework Schema; http://de.wikipedia.org/wiki/RDF-Schema
  3. Friend of a Friend; http://de.wikipedia.org/wiki/FOAF
  4. XML Schema Definition; http://de.wikipedia.org/wiki/XML_Schema
  5. Web Ontology Language; http://de.wikipedia.org/wiki/Web_Ontology_Language
  6. Uniform Resource Identifier; http://de.wikipedia.org/wiki/Uniform_Resource_Identifier
  7. Turtle ist eine Serialisierung von RDF-Graphen, vgl. hierzu https://de.wikipedia.org/wiki/Turtle_(Syntax)