Was ist Forschungsdatenmanagement?

Aus Handbuch.io

Autoren: Kerstin Helbig [1], Janna Neumann [2]

[1] Humboldt-Universität zu Berlin

[2] Technische Informationsbibliothek Hannover

Definition

Bevor das Thema Forschungsdatenmanagement näher betrachtet werden kann, soll hier zunächst eine Definition des Begriffs gegeben werden. Da das Thema jedoch zum Teil sehr domänenspezifisch/disziplinspezifisch betrachtet werden muss, kann der Begriff grundsätzlich nur relativ allgemein definiert werden. Daher wird hier auf eine übergreifende Definition nach Simukovic, Kindling und Schirmbacher (2013) zurückgegriffen. Darin heißt es, dass Forschungsdatenmanagement "alle Aktivitäten, die mit der Aufbereitung, Speicherung, Archivierung und Veröffentlichung von Forschungsdaten verbunden sind“ beinhaltet (Simukovic/Kindling/Schirmbacher 2013, S. 6 [1]).

Im Folgenden werden die verschiedenen Aspekte des Forschungsdatenmanagements in einzelen Unterkapiteln dargestellt. Die Grafik zeigt den allgemeinen Zyklus des Forschungsdatenmanagement und die zu betrachtenden Themenfelder.

Abbildung: Forschungsdatenmanagement-Zyklus

Forschungsdesign

Bereits bei der Konzipierung eines Forschungsprojekts und damit vor der Datenerhebung und/oder -sammlung, sollten Forschende sich Gedanken zu ihrem Forschungsdatenmanagement machen. Dazu gehören zum einen die Überlegungen zum Forschungsziel, jedoch zum anderen auch die Frage welche Daten im Zuge der wissenschaftlichen Arbeit erhoben und gesammelt werden. Die Motivation für eine Forschungsarbeit bezieht sich grundsätzlich aus dem resultierenden Erkenntnisgewinn der verarbeiteten Daten. Das Forschungsdatenmanagement ist daher nur Mittel zum Zweck, um den Forschungsprozess zu unterstützen. Es bietet sich deshalb an, die Forschungsarbeit so gut wie möglich zu strukturieren und zu dokumentieren. In Form eines Datenmanagementplans (s. a. Kapitel Werkzeuge des Forschungsdatenmanagements) können Fragestellungen und Überlegungen erfasst und in der Regel auch revidiert werden.

Datensammlung und -verarbeitung

In der Datenerhebungs- bzw. Datensammlungsphase spielen vor allem ganz praktische Überlegungen eine Rolle, wie die Datensicherung, Datenstrukturierung und -formatierung (s. a. Abschnitt Datenanalyse und Sicherung der Daten), aber auch die strikte Dokumentation der Daten. In der Regel dienen Metadaten zur Dokumentation bzw. Beschreibung der Daten. Wichtig dabei ist, alle Metadaten zu erfassen, die zur (Nach-)Nutzung und Analyse der Daten notwendig sind. Dabei geht es nicht nur darum, Daten für die Nachnutzung durch Dritte aufzubereiten, sondern auch für die eigene Nutzung verfügbar zu halten.

Die Dokumentation von Daten mit Hilfe von Metadaten verschafft sowohl dem Erzeuger als auch dem Nutzer weitere Vorteile. Sobald Daten in einer geeigneten Infrastruktur abgelegt sind, können sie anhand der Metadaten deutlich leichter (wieder-)gefunden werden. Außerdem wird ermöglicht, dass Daten bei Nachnutzung zitierbar sind.

Datenanalyse und Sicherung der Daten

Backup

Bereits während des Arbeitsprozesses sollte ein Backup eingerichtet werden. Die Datenwiederherstellung ist zu Beginn der Forschung sowie in regelmäßigen Abständen zu testen, um einen unerwünschten Datenverlust zu verhindern. Dabei sollten folgende Punkte beachtet werden:

  • Mindestens 3 Kopien einer Datei speichern
  • Auf mindestens 2 unterschiedlichen Speichermedien
  • Wovon mindestens eine Kopie dezentral ist (zum Beispiel auf einem anderen Server)

Sicherung sensibler Daten

Vor allem sensible Forschungsdaten benötigen besonderen Schutz. Mögliche Maßnahmen sind ein separater, abschließbarer Raum, ein abschließbarer Schrank für Datenträger oder Laptop oder ein Diebstahl-Schutz für das Notebook. Um sensible Forschungsdaten zusätzlich zu schützen, sollten Dateien verschlüsselt werden. Passwörter sind sicher aufzubewahren. Um einen Zugang zu den Daten zu gewährleisten, sollten dennoch mindestens zwei Personen Zugang zu den Forschungsdaten haben.

Dateistrukturierung

Dateien sind nur ein kleiner Teil der Datenstrukturen, in denen Forschungsergebnisse festgehalten werden. Dateistrukturen sollen nachfolgend jedoch als Beispiel dienen und die Datenstrukturierung illustrieren.

Eine klare Struktur der Verzeichnisse und Ordner hilft nicht nur der eigenen besseren Nachvollziehbarkeit nach wenigen Monaten oder Jahren. Vor allem für die Nachnutzung von Forschungsdaten sind sinnvolle Dateinamen und gut organisierte Dateien wichtig. Die Dateiversionen sollten bereits während des Forschungsprozesses kontinuierlich geprüft und verwaltet werden. Vor allem nach der abschließenden Datenanalyse empfiehlt es sich, obsolete Versionen zu separieren. Datums-/Zeitstempel oder eine separate ID (z. B. v1.0.0) für jede Version sind hierfür Beispiele. Spezielle Software kann die Versionsverwaltung unterstützen (bspw. Git u. a.). Für die Benennung von Dateien sollten Konventionen genutzt oder geschaffen werden. Diese Namenskonventionen sowie andere genutzte Abkürzungen sollten ebenfalls dokumentiert werden (s. a. Datenmanagementplan in Kapitel Werkzeuge des Forschungsdatenmanagements).

Beispiele für Namenskonventionen:

[Sediment]_[Probe]_[Instrument]_[YYYYMMDD].dat

[Experiment]_[Reagens]_[Instrument]_[YYYYMMDD].csv

[Experiment]_[Versuchsaufbau]_[Versuchsperson]_[YYYYMMDD].sav

[Beobachtung]_[Ort]_[YYYYMMDD].mp4

Vorschlag zur Versionierung[2]:

1.0.0 Änderung der ersten Stelle, wenn neue Daten hinzukommen (Stichprobe, Welle, Beobachtung)

1.1.0 Änderung der zweiten Stelle, wenn Daten korrigiert werden

1.0.1 Änderung der dritten Stelle, wenn die Datendokumentation verändert oder erweitert wird

Dateiformate

Nach Abschluss der Forschungstätigkeit sollten Dateiformate auf ihre Langlebigkeit überprüft werden. Für eine langfristige Nachnutzbarkeit von Forschungsdaten sollten die Dateien unverschlüsselt, nicht komprimiert, nicht firmeneigen oder patentiert sein und einen offenen, dokumentierten Standard nutzen. Eine Übersicht über Dateiformate und deren Archivierbarkeit bietet die Library of Congress (2015[3]).

Folgende Dateiformate sind empfehlenswert:

  • Tabellendaten: CSV, TSV, SPSS portable
  • Text*: TXT, HTML, RTF, PDF/A (nur, wenn das Layout von Bedeutung ist)
  • Multimedia: Container: MP4, Ogg; Codec: Theora, Dirac, FLAC
  • Bild: TIFF, JPEG 2000, PNG, GeoTIFF, FITS
  • Datenaustausch: XML, RDF, JSON

Zu vermeiden sind die Dateiformate:

  • Tabellendaten: Excel
  • Text: Word, PowerPoint
  • Multimedia: Windows Media Video, QuickTime, H.264
  • Bild: GIF, JPG
  • Datenaustausch: SDXF

*Bei Textdaten sollten auch Zeichenformate beachtet werden, da die Kodierungen nicht zwangsläufig kompatibel sind. Empfehlenswert sind hier Textdateien, die als ASCII, UTF-8, oder UTF-16 mit Byte Order Mark kodiert sind. Dies ermöglicht u.a. die problemlose Darstellung von Textdateien unter verschiedenen Betriebssystemen (Microsoft Windows, Mac OS, Linux).

Gemeinsame Nutzung der Daten

Bei der Verfügbarmachung von Forschungsdaten gibt es verschiedene Abstufungen der Veröffentlichung. Offene Forschungsdaten sind für jeden zugänglich sowie rechtlich, finanziell und technisch uneingeschränkt nutzbar (Open Knowledge Foundation 2016[4]). Dies ermöglicht sowohl die Beteiligung von Bürgerinnen und Bürgern in Citizen Science Projekten als auch das wissenschaftliche kollaborative Arbeiten (s. a. Handbuch CoScience, Kapitel Publikation von Forschungsdaten) .

Vor allem in wirtschaftsnahen Forschungsdisziplinen ist die Nutzung von Embargos für Forschungsergebnisse üblich. Datenarchive und Repositorien sowie auch Journal Policies haben sich darauf eingestellt und berücksichtigen Embargoperioden von ein bis drei Jahren. Darüber hinaus sind sensible (personenbezogenen) Daten bestimmter Disziplinen auf Zugriffsbeschränkungen angewiesen, um dem Datenschutz gerecht zu werden.

Eine Einreicherung der Forschungsdaten bei einem Datenarchiv oder Repositorium ermöglicht eine eigenständige Publikation der Daten. Des Weiteren ist es bei einigen Verlagen bereits möglich, die Forschungsdaten gemeinsam mit dem Text einzureichen und damit verfügbar zu machen. Ein Beispiel hierfür ist die Kooperationen zwischen dem Verlag Elsevier und dem Datenrepositorium Pangaea.

Bei sensiblen Daten ist die Nutzung eines Data Journals empfehlenswert. In einem Data Journal werden die Forschungsdaten über einen Text beschrieben sowie mögliche Anwendungsszenarien und Charakteristika skizziert. Dies bietet sich jedoch nur für Daten an, die in irgendeiner Form verfügbar und zugänglich sind (bspw. vor Ort innerhalb eines Forschungsdatenzentrums).

Einen tieferen Einblick in unterschiedliche Infrastrukturen zum Teilen von Forschungsdaten gibt das Kapitel Werkzeuge des Forschungsdatenmanagements.

Vor allem die rechtlichen Aspekte sind bei der Veröffentlichung von Forschungsdaten nicht zu vernachlässigen. Im deutschen Rechtsraum sind daher u. a. folgende Gesetze zu beachten:

  • Gesetz über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz; UrhG[5])
  • Bundesdatenschutzgesetz (BDSG[6])
  • Richtlinie 96/9/EG des Europäischen Parlaments und des Rates vom 11. März 1996 über den rechtlichen Schutz von Datenbanken[7]

Unterstützung bieten Datenschutzbeauftragte oder Rechtsabteilungen sowie spezialisierte Medienjuristen und -juristinnen. Archiv- und Repositorienbetreiber können ebenfalls in begrenztem Umfang Hinweise geben.

Datenübernahme

Je nachdem wo die Forschungsdaten bereitgestellt werden sollen, gibt es unterschiedliche Möglichkeiten der Übermittlung der Daten. Einige Repositorien bieten eine automatische Anbindung an das System, wodurch bereits während der Datengenese eine Übermittlung stattfindet. Forschungsunterstützende Tools können ebenfalls eine Datenübermittlung vorbereiten und automatisieren. Ein Beispiel hierfür ist das Dokumentationstool von PsychData am Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID). Am häufigsten werden Forschungsdaten über einen Upload ins System eingepflegt und mit Metadaten versehen. Für größere Datenmengen bieten viele Forschungsdatenrepositorien bereits offene Schnittstellen (API) an, wodurch ebenfalls ein automatisierter Upload erfolgen kann. Einige Forschende bevorzugen allerdings auch immer noch die Zusendung eines Datenspeichers (CD, DVD, USB-Stick) per Post.

Möglichkeiten der Übermittlung der Forschungsdaten:

  • Upload
  • Nutzung von Schnittstellen
  • Zusendung eines Datenträgers per Post

Eine Übermittlung von Forschungsdaten erfordert meist eine zuvorige Registrierung sowie die Zustimmung zu Nutzungsbedingungen oder die Unterzeichnung eines Datenübernahmevertrags.

Datenanreicherung und -bereitstellung

Metadaten

Um die Nachnutzung zu erleichtern, sollten Forschungsdaten gut beschrieben und dokumentiert werden. Hierbei muss man zwischen einer Beschreibung zur Auffindung (Metadaten) und einer tieferen (fachwissenschaftlichen) Erschließung (Dokumentation) unterscheiden. Metadaten sind eine spezifische Untermenge der Dokumentationsangaben und dienen in erster Linie der Findbarkeit der Daten (z. B. Primärforscher, Zeitraum, Ort). Für die Erleichterung der Auffindung sollten wenn möglich standardisierte Metadatenstandards genutzt werden. Darüber hinaus kann eine weitere Dokumentation mittels separater Datei sinnvoll sein. Eine Dokumentation geht über die Beschreibung durch Metadaten hinaus und ist wesentlich ausführlicher als eine Beschreibung durch Metadaten (bspw. Beschreibung des Projekts, der Variablen, des Messinstruments). Normdaten und kontrollierte Vokabulare sollten ebenfalls zur Beschreibung der Daten genutzt werden.

Beispiele für disziplinspezifische Metadatenstandards:

  • Astronomie: International Virtual Observatory Alliance (IVOA)
  • Geisteswissenschaften: Text Encoding Intitiative (TEI)
  • Geowissenschaften: ISO 19115
  • Naturwissenschaften: ICAT Schema, Cristallographic Information Framework
  • Sozial- und Wirtschaftswissenschaften: Digital Documentation Initiative (DDI)

Wichtige Angaben zur Datenbeschreibung:

  • Titel: Name des Datensatzes oder Forschungsprojekts, worin die Daten produziert wurden
  • Autor/Primärforscher: Namen und Adressen der Organisation und/oder Personen, die die Daten erstellt haben (siehe auch Normdaten)
  • Mitwirkende: Personen, die nicht primär an der Datenerstellung beteiligt waren (bspw. Datenkuratoren, Forschungsförderer; siehe auch Normdaten)
  • Identifier: Die Identifikationsnummer, welche zur Identifizierung der Daten herangezogen werden kann, auch wenn es nur eine interne Projektreferenznummer ist
  • Daten: Tage oder Zeiträume, die mit den Daten in Verbindung stehen (z. B. Projektstart, -ende, Beobachtungszeitraum, Veröffentlichungsdatum)
  • Thema: Schlagwörter oder Phrasen, die das Thema oder den Inhalt der Daten beschreiben (siehe auch Kontrollierte Vokabulare)
  • Ort: Bezug zu einem physischen Ort oder einer räumlichen Abdeckung (z. B. Koordinaten)
  • Rechte: rechtliche Ansprüche an den Daten (siehe auch Lizenzen)
  • Dateinamen: Liste aller digitalen Dateien (mit Name und File-Erweiterung; siehe auch Dateistrukturierung)
  • Formate: Format der Dateien, z. B. CSV, HTML, JPEG
  • Methodik: Beschreibung der Methode zur Datenerhebung und -verarbeitung (Methodik, Versuchsprotokoll, Geräte, Software, Laborbuch)
  • Sprache: Sprache(n) des Inhalts der Forschungsdaten
  • Quellen: Referenzen zu Quellenmaterial, falls Daten aus anderen Quellen übernommen wurden
  • Relationen: Referenzen zu anderen Ressourcen (Daten, Literatur), die mit den Daten in Verbindung stehen

Normdaten

Für Personen, Institutionen, Forschungsförderer und vieles mehr können in der Regel Normdaten zur eindeutigen Identifikation vergeben werden. Dies erleichtert beispielsweise die Suche nach Personen bei Namensgleichheit und ermöglicht die eindeutige Zuordung für Suchmaschinen. Normdaten können sowohl bei der Forschungsdatenpublikation, bei der Publikation von Literatur oder auch im Rahmen eines Datenmanagementplans mit angegeben werden um eine eindeutige Differenzierung von Autoren und Mitwirkenden (bspw. Projektleiter) zu erreichen.

Beispiele für Normdaten:

Die Open Researcher and Contributor ID (ORCID) ist ein (alpha-)numerischer 16-stelliger Code und dient der eindeutigen Identifikation von Personen (Autoren oder Mitwirkenden) vergleichbar einer DOI bei Forschungsdaten.

Die Gemeinsame Normdatei (GND) dient vor allem der Katalogisierung von Literatur in Bibliotheken, wird jedoch auch zunehmend für andere Zwecke genutzt. Sie beinhaltet Normdaten für Personen, Körperschaften, Konferenzen, Geografika, Schlagwörter und Werktitel. Die Deutsche Nationalbibliothek und weitere Institutionen führen die GND kooperativ. Eine Mitarbeit erfolgt entweder über die deutschsprachigen Bibliotheksverbünde oder nach direkter Absprache mit der Deutschen Nationalbibliothek.

Der International Standard Name Identifier (ISNI, ISO 27729) ist ein 16-stelliger Code zur Identifikation von Personen, die an einer Publikation beteiligt sind. Die ISNI ist ein Standard der Internationalen Organisation für Normung (ISO) und vergleichbar mit der ORCID.

Das Virtual International Authority File (VIAF) ist eine internationale Normdatei für Personendaten und wird vom Online Computer Library Center (OCLC) in Dublin, Ohio (USA) gehostet und betrieben. Normdatensätze der GND und ISNI sind Bestandteil von VIAF und werden dort mit den Daten anderer nationaler Normdateien zusammengefügt.

FundRef ist ein Identifikationsdienst für Forschungsförderer. Mit der FundRef ID können beispielsweise Publikationen, aber auch Forschungsdaten einem bestimmten Förderprojekt und den jeweiligen beteiligten Forschungsförderern zugeordnet werden.

Kontrollierte Vokabulare

Thesauri und Klassifikationen sind Dokumentationssprachen, die zur inhaltlichen Beschreibung von Objekten (z. B. Forschungsdaten) verwendet werden. Sie werten Metadaten neben der Nutzung eines standardisierten Schemas wesentlich auf. Eine Klassifikation dient der Zuordnung von Objekten in (meist hierarchisch strukturierte) Klassen, welche durch bestimmte Merkmale charakterisiert sind. Ein Thesaurus (Pl. Thesauri) ist eine natürlich-sprachliche, geordnete Sammlung von Begriffen und deren Beziehungen zueinander. Die Vergabe von kontrollierten Schlagworten aus einem Thesaurus und die Eingruppierung in bestimmte Bereiche erleichtert die Findbarkeit der Daten. Für sehr viele Fachbereiche gibt es bereits eigene, spezialisierte Klassifikationen und Thesauri. Das Basel Register of Thesauri, Ontologies & Classifications[8] bietet eine Suchmöglichkeit und hat viele anerkannte Thesauri und Klassifikationen gelistet.

Beispiele für disziplinspezifische Klassifikationen:

  • Klassifikation Sozialwissenschaften
  • Journal of Economic Literature Classification System (JEL)
  • Physics and Astronomy Classification Scheme (PACS)
  • Mathematics Subject Classification (MSC)

Beispiele für disziplinspezifische Thesauri:

  • Thesaurus Sozialwissenschaften (TheSoz)
  • Standard Thesaurus Wirtschaft (STW)
  • Thesaurus Psychologie (PSYNDEX)
  • INFODATA Thesaurus
  • Umweltthesaurus (UMTHES)
  • Thesaurus Medical Subject Headings (MeSH)
  • Unified Astronomy Thesaurus (UAT)

Lizenzen

Zur Nachnutzung von Forschungsdaten ist die Vergabe von Nutzungsrechten von essentieller Bedeutung. Die Wahl einer Lizenz ist von unterschiedlichen Faktoren abhängig. Einen Einfluss können beispielsweise Policies der Forschungsförderer oder Institutionen haben. Darin wird häufig für die Nutzung einer möglichst offenen Lizenz plädiert (beispielsweise CC0, CC BY oder GNU GPL). Vertragliche Regelungen mit Verlagen oder Unternehmen können jedoch zu einer möglichen Einschränkung der Nutzungsrechte führen.

Creative Commons Lizenzen (2016[9])

Abbildung: Creative Commons CC BY

CC0 (Gemeinfreiheit/Public Domain)

CC BY (Namensnennung)

CC BY-ND (Namensnennung - Keine Bearbeitung)

CC BY-NC (Namensnennung - Nicht kommerziell)

CC BY-SA (Namensnennung - Weitergabe unter gleichen Bedingungen)

CC BY-NC-SA (Namensnennung - Nicht-kommerziell - Weitergabe unter gleichen Bedingungen)

CC BY-NC-ND (Namensnennung - Nicht-kommerziell - Keine Bearbeitung)

GNU Lizenzen (2016[10]) für Softwarecode

GNU General Public License (GPL)

GNU Lesser General Public License

GNU Affero General Public License

GNU Free Documentation License

Datennachnutzung

Da auf Grund von neuen Policies der Forschungsförderer und Institutionen vermehrt Forschungsdaten zur Verfügung gestellt werden, wird auch die Nachnutzung der Daten für viele Fachbereiche zunehmend interessant. In vielen Disziplinen werden Forschungsdaten aus unterschiedlichen Quellen zusammengefügt, um neue Forschungsergebnisse und Einblicke zu erzielen. Vor allem fachbereichsübergreifend entstehen so neue Erkenntnisse. Um den Primärforscherinnen und Primärforschern dieser Daten Rechnung zu tragen, ist die Datenzitation ein wichtiger Bestandteil des Forschungsdatenmanagements, um die Nachnutzung von Daten zu dokumentieren. Die Entwicklung von persistenten Identifikatoren hat die Datenzitation maßgeblich vereinfacht.

Für die Nachnutzung von Forschungsdaten sind die anhängenden Rechte und Lizenzen von zentraler Bedeutung. Sie geben vor, welche Art der Nachnutzung möglich ist und können beispielsweise eine kommerzielle Nutzung untersagen (CC BY-NC).

Möglichkeiten, um Forschungsdaten für die Nachnutzung zur Verfügung zu stellen:

  • Bereitstellung der Daten im Rahmen einer Textpublikation
  • Eigenständige Ablage in einem Datenarchiv oder Repositorium
  • Data Journal

Persistente Identifikatoren

Ein persistenter Identifikator (Englisch "persistent identifier", PID) ist eine eindeutige und dauerhafte Benennung einer digitalen Ressource (z. B. Forschungsdaten) durch Vergabe eines Codes (Helmholtz-Zentrum Potsdam Deutsches GeoForschungsZentrum GFZ 2015[11]). Vergleichbar einer ISBN (Internationale Standardbuchnummer) für Bücher ist der persistente Identifikator ein eindeutiger Bezeichner, kann aber zugleich für eine dauerhafte Verlinkung herangezogen werden, um ein Linksterben (404 Fehler) zu verhindern.

Beispiele für persistente Identifikatoren:

Datenzitation

Forschungsdaten sind als wertvolle Ergebnisse der Forschungstätigkeit anzusehen und somit zu zitieren. Die Zitation von Forschungsdaten kann von Verlag zu Verlag unterschiedlich sein. Auch disziplinspezifische Unterschiede sind - vergleichbar einer Buchpublikation - möglich. Die Datenzitationsprinzipien von FORCE11 (Data Citation Principles) sollten beachtet werden (2014[12]).

FORCE11 Empfehlung zur Datenzitation (2014[13]):

Autor(en), Publikationsjahr, Titel der Forschungsdaten, Datenrepositorium oder Archiv, Version, weltweit persistenter Identifikator

Der persistente Identifikator sollte dabei vorzugsweise als Link dargestellt werden.

Zusammenfassung

Forschungsdatenmanagement umfasst alle Phasen des Forschungsprozesses von der Idee bis zum Projektende und darüber hinaus. In jeder dieser Phasen gibt es Anforderungen zu beachten, die sowohl Forschungsdaten als auch deren Produzenten betreffen. Allerdings spielen auch viele weitere Akteure eine Rolle bei der Verarbeitung und dem Management von Forschungsdaten (siehe hierzu auch Kapitel Wer betreibt Forschungsdatenmanagement?). Forschende, akademische Institutionen, Forschungsförderer, Verlage und Unternehmen haben unterschiedliche Interessen und Vorgaben, die zu berücksichtigen sind. Die transparente Dokumentation eines Forschungsprozesses ist aufwändig und benötigt daher unterstützende Methoden und klar formulierte Ziele.

Die besondere Herausforderung beim Forschungsdatenmanagement ist zum einen Forschungsdaten so zu produzieren, zu verarbeiten, zu archivieren und zu veröffentlichen, dass sie sowohl für den Forschenden selbst als auch für andere (eingeschlossen zukünftige Generationen) (nach)nutzbar sind und bleiben. Zum anderen ist das - sicher nicht immer ganz einfache - Zusammenspiel zwischen den verschiedenen Akteuren im Forschungsdatenmanagement zu meistern. Nicht zuletzt hat das Management von Forschungsdaten in jeder Disziplin seine eigenen Regeln und ist nicht mit einem allgemeinen Schema abzubilden. Forschungsdaten und Erhebungsmethoden variieren von Fachbereich zu Fachbereich. Die hier genannten Aspekte sind Anhaltspunkte, die nicht unbedingt in jeder Disziplin relevant sind und eingehalten werden müssen. Die Disziplinspezifika machen sich vor allem bei der Nutzung von Checklisten zum Erstellen von Datenmanagementplänen bemerkbar (s. dazu auch den Abschnitt Forschungsdatenmanagementpläne im Kapitel Werkzeuge des Forschungsdatenmanagements).

Fragen zum Verständnis

  • Welche Aspekte umfasst das Forschungsdatenmanagement?
  • Was sollte bei sensiblen Daten beachten werden?
  • Was sind persistente Identifikatoren und welchen Zweck erfüllen sie?
  • Warum werden Nutzungslizenzen benötigt und welche Arten von Lizenzen eignen sich für welche Arten von Forschungsdaten?
  • Wozu dienen Metadaten und warum ist es sinnvoll Forschungsdaten damit anzureichern?

Weiterführende Literatur

  • Bertelmann, Roland; Gebauer, Petra; Hasler, Tim; Kirchner, Ingo; Peters-Kottig, Wolfgang; Razum, Matthias; Recker, Astrid; Ulbricht, Damian; van Gasselt, Stephan (2014). Einstieg ins Forschungsdatenmanagement in den Geowissenschaften. Postdam, GeoForschungsZentrum Potsdam. DOI: http://doi.org/10.2312/lis.14.01
  • Hartmann, Thomas (2014). Urheberrecht in der Bildungspraxis – Leitfaden für Lehrende und Bildungseinrichtungen. Bielefeld, W. Bertelsmann.
  • ZBW, GESIS, RatSWD (2015). Auffinden - Zitieren - Dokumentieren: Forschungsdaten in den Sozial- und Wirtschaftswissenschaften. Version 2.0. DOI: http://doi.org/10.4232/10.fisuzida2015.2

Referenzen

  1. Simukovic, Elena; Kindling, Maxi; Schirmbacher, Peter (2013). Umfrage zum Umgang mit digitalen Forschungsdaten an der Humboldt-Universität zu Berlin. URN: http://nbn-resolving.de/urn:nbn:de:kobv:11-100213001
  2. Helbig, Kerstin; Hausstein, Brigitte; Toepfer, Ralf (2015). Supporting Data Citation: Experiences and Best Practices of a DOI Allocation Agency for Social Sciences. Journal of Librarianship and Scholarly Communication, 3(2), eP1220. DOI: http://doi.org/10.7710/2162-3309.1220
  3. Library of Congress (2015). LOC Recommended Formats Statement 2015-16. [1]. Zugriff am 19.01.2016.
  4. Open Knowledge Foundation (2016). Open Definition 2.1. [2] Zugriff am 19.01.2016.
  5. Bundesrepublik Deutschland (1966). Gesetz über Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz). [3]. Zugriff am 19.01.2016.
  6. Bundesrepublik Deutschland (1990). Bundesdatenschutzgesetz. [4]. Zugriff am 19.01.2016.
  7. Europäisches Parlament (1996). Richtlinie 96/9/EG des Europäischen Parlaments und des Rates vom 11. März 1996 über den rechtlichen Schutz von Datenbanken.[5]. Zugriff am 19.01.2016.
  8. Universität Basel (2016). Basel Register of Thesauri, Ontologies & Classifications. [6]. Zugriff am 20.01.2016.
  9. Creative Commons (2016). Mehr über die Lizenzen. [7] Zugriff am 19.01.2016.
  10. Kohne, Joerg (2016). Lizenzen. [9]. Zugriff am 20.01.2016.
  11. Helmholtz-Zentrum Potsdam Deutsches GeoForschungsZentrum GFZ (2015). Persistent Identifier. [8]. Zugriff am 19.01.2016.
  12. Data Citation Synthesis Group (2014). Joint Declaration of Data Citation Principles. [https://www.force11.org/group/joint-declaration-data-citation-principles-final]. Zugriff am 19.01.2016.
  13. FORCE11 (2016). Example. [9]. Zugriff am 19.01.2016.