VIVO-Handbuch/Aufbereitung der Quellen/Daten strukturieren/RDF-Graphen

Aus Handbuch.io

Autoren: Michaela Nguyen Khac; Kamila Serwa

Kontributoren: Ina Blümel

RDF-Graphen

Zum besseren Verständnis der Daten, die in VIVO dargestellt werden sollen, eignet sich eine graphenbasierte Visualisierung von Objekten und ihren Beziehungen. Dafür werden aus den bereits (z.B. mittels Excel) vorstrukturierten Daten zunächst Objekte, Eigenschaften und Beziehungen identifiziert und als Graph dargestellt; hier bietet sich z.B. das webbasierte, kollaboratives Arbeiten zulassende ERM-Tool Creately an.


Abbildung 1: Eigene Verknüpfungen

Dabei erfolgt die logische Verknüpfung in 3-Elementsätzen, sogenannter „Tripel“ mit jeweils Subjekt (S), Prädikat (P) und Objekt (O) wie z.B. „Name (S) hat (P) Vorname (O).“ (siehe Abb. 1).

Für die Abbildung der Beziehung gibt es verschiedene Möglichkeiten der Notation. Dabei lehnt sich die obere Grafik an die Chen-Notation an. Hierfür werden Klassen in kreisförmigen Objekten notiert und Datenwerte (Literale) in Rechtecken. Die Verbindung erfolgt mit Hilfe der in Pfeilen wiedergegebenen Prädikate. Die grafische Unterscheidung der Klassen und Datenwerte hat deshalb seine Wichtigkeit, da Klassen im Gegensatz zu Datenwerten auch als Objekt eines Tripels weitere Beziehungen haben können, wie das beispielsweise in Abbildung 1 beim Attribut „Kontaktdaten“ der Fall ist.

Die Bestandteile der Aussagen müssen im Folgenden auf die in VIVO verwendeten Klassen und Properties gemappt werden. Um dies durchzuführen, werden Ontologien benötigt. Sie sind dafür zuständig, dass die Bedeutungen der Aussagen in VIVO interpretiert werden können. Nähere Informationen zu den Ontologien gibt es im Abschnitt „Übersicht Ontologien“.

Grundsätzlich sollte man sich zunächst jedoch fragen, ob sich bestimmte Sachverhalte für eine Modellierung überhaupt eignen. Denn für eine erfolgreiche Abbildung von Aussagen und Beziehungen in RDF-Graphen müssen spezifische Grundsätze des Semantic Webs beachtet werden. Ausführliche Informationen findet man diesbezüglich in der Präsentation „A use case of ontology adaption“.

Für das Durchführen des Mappings auf die Vivo-Klassen und –Properties gibt es verschiedene Ansätze:

Dabei muss beachtet werden, dass ein VIVO-spezifisches Vokabular verwendet wird, um eine erfolgreiche Interpretation der Beziehungen und Aussagen in VIVO zu gewährleisten.

Hierfür kann man entweder zunächst im Wiki „VIVO-Duraspace“ nachschauen, um eine Klassenübersicht der Vivo-Ontologien zu erhalten oder Testdatensätze in VIVO anlegen und dann nachsehen, welche Klassen bzw. Properties verwendet werden. Wenn bestimmte Aussagen oder Beziehungen jedoch nicht in der VIVO-Ontologie abgebildet werden können bzw. abgebildet sind, dann ist es notwendig eigene Klassen und Properties anzulegen.Das vorhandene Vokabular kann nun auf die vorherigen Aussagen und Beziehungen (siehe Abb.1) übertragen werden, sodass man einen RDF-Graphen erhält (siehe Abb. 2). Im Gegensatz zur Abbildung 1, wo es sich um eine vorläufig grobe, schematische Darstellung handelt, sieht man hier die Komplexität der Klassen und Properties in der VIVO-Ontologie.

Abbildung 2: VIVO-Ontologie

Unter Zuhilfenahme der gemappten Graphen können die Ursprungsdaten nun relativ einfach für den Import in VIVO in RDF-Tripel transformiert werden, z.B. mittels Open Refine.