Handbuch CoScience/Plattformen und Metadaten

Aus Handbuch.io

Autoren: Stefan Dietze, Lambert Heller, Robert Jäschke, Ina Blümel, Janna Neumann

Plattformen

Eine wichtige Primärquelle für Forschungsinformationen sind und bleiben auf absehbare Zeit die Webseiten von Institutionen und Wissenschaftlern, die diese manuell pflegen und häufig mit strukturierten Informationen z.B. aus Literaturdatenbanken ergänzen. Die Webauftritte nehmen dabei eine zentrale Aufgabe des Wissenschaftsbetriebes wahr: die ¨offentliche Dokumentation und Kommunikation von Forschungsergebnissen aller Art. Durch ihre Dezentralität und Unstrukturiertheit können die enthaltenen Daten jedoch nur unzureichend analysiert werden, weshalb eine zentrale Sammlung und Archivierung strukturierter Daten zur Forschungsinformation notwendig sind. Dies hat auch der deutsche Wissenschaftsrat mit seiner Forderung nach einem ”Kerndatensatz“ Forschung erkannt. Die folgende Tabelle bietet eine Zusammenfassung der bestehenden Quellen für Forschungsinformationen und listet die jeweils zur Verfügung stehenden Funktionalitäten auf. Eine traditionelle Quelle stellen Literaturdatenbanken dar, die sich, oft über Jahrzehnte hinweg, in vielen Disziplinen als Recherchequellen etabliert haben. Diese Publikationsverzeichnisse setzen auf Aufsatzebene fort, was bereits seit mehr als 200 Jahren von Bibliotheken für Bücher geleistet wird. Akademische Websuchmaschinen, wie Google Scholar seit 2004, kombinieren oft Daten aus mehreren Literaturdatenbanken und anderen strukturierten Quellen, und ergänzen diese um heterogene Daten aus dem frei zugänglichen Web. Zugunsten eines erheblich größeren Suchraums ist die Recherche in solchen Suchmaschinen oft nicht so exakt wie in Literaturdatenbanken oder Bibliothekskatalogen. Auf dieser breiten Datengrundlage können jedoch oft aussagekräftige Profilseiten für Forscher generiert werden. Der Informationsgehalt dieser Profile geht über reine Publikationslisten hinaus, bleibt jedoch ein unvollständiger Schnappschuss, da z.B. keine zurückliegenden Zugehörigkeiten des Forschers enthalten sind.

Forschungsinformationssysteme.

Auf den von Instituten und Wissenschaftlern individuell gepflegten Webseiten, aber auch bei neueren Crowdsourcing-Ansätzen wie Wikipedia, sowie den seit 2008 aufkommenden kommerziellen sozialen Netzwerken für Wissenschaftler steht das individuelle Forscherprofil mitsamt seinen temporalen Aspekten im Fokus – zu Lasten eines auch nur annäherungsweise vollständigen Retrievals über alle Profile hinweg. In den letzten Jahren haben es viele Forschungseinrichtungen (und einige Nationen bzw. Regionen wie Norwegen (CRIStin), Flandern (FRIS), die Niederlande (NARCIS), Tschechien (IS VaVaI) und Slowenien (SICRIS)) geschafft, mit Hilfe von Forschungsinformationssystemen institutionelle und andere Datenquellen so zu kombinieren, dass ein annähernd vollständiges Retrieval über temporal vollständige Forscherprofile der jeweiligen Institution oder des jeweiligen Landes hinweg möglich ist. Eine institutionenübergreifende Aggregation der Daten aus solchen Systemen ist durch die Verwendung von Linked Data Schemata und Ontologien wie VIVO oder CERIF zur einheitlichen Ausgabe aller Daten möglich geworden.

Forschungsdaten: Metadaten Schemas & Vocabularies

Zur Publikation von Forschungsdaten existiert eine Vielfalt an Schemas & Vokabularien, durch welche die Auffind- und Wiederverwendbarkeit von Daten verbessert werden kann. Dies umfasst Schemas/Vokabularien für die Abbildung von Publikationsmetadaten genauso wie von wissenschaftsrelevanten Daten über Forschungsergebnisse, Wissenschaftler, Projekte oder Wissenschaftliche Einrichtungen.

- Repräsentation von Forschungsdaten (Rohdaten, Publikationsmetadaten etc)

- DataCite

- CERIF

- VIVO

- Publikationsmetadaten: BIBO, SWCO,

- Academic Organisation Metadata: AAISO

- http://linkeduniversities.org/lu/index.php/vocabularies/

- Nano Publications (Groth et al)

- Diskurs Vokabularien

Im Folgenden eine kurze Zusammenfassung von Beschreibungen relevanter Vokabularien, entlehnt von LinkedUniversities.org.

University as an organisation

AIISO - Academic Institution Internal Structure Ontology

The Academic Institution Internal Structure Ontology (AIISO) provides classes and properties to describe the internal organizational structure of an academic institution. See for example the use of AIISO in course descriptions at the Open University:http://data.open.ac.uk/course/l204

Bowlogna Ontology

The Bowlogna ontology originates from a lexicon defining terms related to the Bologna Processand aims at providing a standard schema for European universities involved in the Bologna Reform of higher-education studies.

Core organization ontology

This ontology is not specific to universities, but aim at supporting linked-data publishing of organizational information across a number of domains. It is designed to allow domain-specific extensions to add classification of organisations and roles, as well as extensions to support neighbouring information such as organisational activities.

Academic Publications and Communities

BIBO - The Bibliographic Ontology

The Bibliographic Ontology describe bibliographic things on the semantic Web in RDF. This ontology can be used as a citation ontology, as a document classification ontology, or simply as a way to describe any kind of document in RDF. It has been inspired by many existing document description metadata formats, and can be used as a common ground for converting other bibliographic data sources.

See for example the use of BIBO for academic publications at the Open University: http://data.open.ac.uk/oro/26853

VIVO Ontology

VIVO is an open source application implementing semantic web principles and technologies to represent academic research communities. The VIVO ontology provides a set of types (classes) and relationships (properties) to represent researchers and the full context in which they work. Content in any local VIVO installation may be maintained manually, brought into VIVO in automated ways from local systems of record, such as HR, grants, course, and faculty activity databases, or from database providers such as publication aggregators and funding agencies.

The VIVO Ontology is based on other, including notably BIBO and FOAF. Its documentation can be found at http://sourceforge.net/apps/mediawiki/vivo/index.php?title=Ontology

Academic Topics

Mathematics Subject Classification

The Mathematics Subject Classification Linked Wiki pressents the effort of implementing the Mathematics Subject Classification (MSC2010) as a Linked Open Dataset using SKOS - Simple Knowledge Organization System.

Multimedia resourcesW3C Ontology for Media Resources

The Ontology for Media Resources is both a core vocabulary (a set of properties describing media resources) and its mapping to a set of metadata formats currently describing media resources published on the Web. The set of properties of the Ontology for Media Resources 1.0 was selected with respect to the most commonly adopted set of elements from metadata formats currently in use to describe media resources.

See for example the use of the Ontology for Media Resources to describe podcast tracks at the Open University: http://data.open.ac.uk/podcast/81fcedb3bcf1ae7830c51911c6e90299

Research Descriptions

Linked Science Core Vocabulary (LSC) The Linked Science Core Vocabulary (LSC) is designed for describing scientific resources including elements of research, their context, and inter- connecting them. LSC is thus as an example of building blocks for Linked Science to communicate the linkage between scientific resources in a machine-understandable way. LSC focuses on simple properties that can be used to describe the content of a research paper that is, to relate the research, hypotheses, predictions, experiments, data, and publications together.

The “core” in the name refers to the fact that LSC only defines the basic terms for science. More specific terms needed by different scientific communities can be introduced as extensions of LSC. The vocabulary specification is available at http://linkedscience.org/lsc/ns/ and it uses this same URI as the namespace. The suggested namespace prefix is "lsc".

CERIF Ontology

The Common European Research Information Format (CERIF) Ontology Specification provides basic concepts and properties for describing research information as semantic data. It is developed by EuroCRIS, the European Organization for International Research Information.