Was sind Forschungsdaten

Aus Handbuch.io

Was sind Forschungsdaten? (Ludwig/Enke)

( Back to main page)


Forschungsdaten sind schwierig zu definieren. Die Untersuchung dieser Schwierigkeit lehrt sehr viel über Forschungsdatenmanagement. Um sich der Fragestellung zu nähern, ist es sinnvoll zuerst zu betrachten, welche einzelne Daten üblicherweise unter den Begriff Forschungsdaten gefasst werden. In einem Vergleich verschiedener Fachdisziplinen (Neuroth et al 2012) ist dokumentiert, was auch in Praxisgesprächen sehr einfach festgestellt werden kann: Eigentlich kann fast alles als Forschungsdaten angesehen werden. Wie kann angesichts dessen eine sinnvolle Definition aussehen?

Diskussion von Forschungsdaten und Methoden des Forschungsdatenmanagements werden in diesem Lehrbuch von vornherein auf den digitalen Bereich eingeschränkt. Damit soll nicht impliziert werden, dass wenn eine Geologin bei einer Messung Werte mit Bleistift und Papier aufschreibt, dies keine Forschungsdaten sind. Aber viele Fragestellungen, mit denen das Forschungsdatenmanagement konfrontiert ist, stellen sich nicht in gleicher Form für analoge Daten oder nur in sehr geringem Umfang. Einer der Gründe dafür ist einfach, dass eine Massenproduktion und -verarbeitung von Forschungsdaten digital mit weit effizienteren Methoden und neuen Möglichkeiten erfolgen kann als mit analogen Mitteln.

=> Übungsaufgabe: Vergleichen Sie Aufgaben des Forschungsdatenmanagement von digitalen und analogen Daten. Überlegen Sie auch, wieweit eindeutige (digitale) Kennzeichung von materiellen Objekten wissenschaftlich sinnvoll sind.

Exkurs: Ums analoge und digitale Daten voneinander abzugrenzen und das Wesen digitaler Daten zu verdeutlichen, ist das Modell Thibodeaus 2002 empfehlenswert. Aus der Perspektive der unterschiedlichen Aufgaben der Langzeitarchivierung digitaler Objekte unterscheidet er drei notwendige Aspekte von digitalen Objekten. Der erste Aspekt ist, dass digitale Objekte auch immer physikalische Objekte sind, nämlich materielle Zeichen auf einem materiellen Träger. Die häufige Gegenüberstellung von digitalen Objekten und materiellen Objekten ist deshalb auch nicht richtig. Der zweite Aspekt ist, dass digitale Objekte auch logische Objekte sind, die in einer bestimmten Art kodiert sind und bestimmte Formate haben, sodass Software sie prozessieren kann. Hier existiert der Hauptunterschied zu analogen Objekten. Zudem sind drittens digitale Objekte auch immer konzeptionelle/begriffliche Objekte, die für uns Menschen Bedeutung hat, wie z.B. eine Landkarte. In dieser Hinsicht muss das digitale Objekt nicht sehr unterschiedlich von einem analogen Objekt sein, obwohl sich im Digitalen viele Dinge realisieren lassen, zu denen kein analoge Entsprechung möglich ist.

Angesicht der oben erwähnten Vielfalt von Forschungsdaten ist es naheliegend, diese nicht als eine spezielle Datenart zu betrachten, die eine besondere Eigenschaft zu Forschungsdaten macht. Forschungsdaten sind einfach alle Daten, die im Forschungsprozess benutzt werden. Auf diesem Weg kann das Phänomen verstanden werden, dass z.B. ein Urlaubsfoto eines Denkmals in der privaten Fotosammlung kein Forschungsdatum ist, dasselbe Bild aber durchaus ein Forschungsdatum sein kann, wenn es Teil eines Trainingsdatensatzes ist, mit dem wissenschaftlich an Bilderkennungsverfahren gearbeitet wird. Mit diesem Definitionsversuch werden aber viele Dinge als Forschungsdaten erfasst, die nicht als Forschungsdaten bezeichnet werden sollten. Z.B. würde Literatur in Form von PDF-Dateien, die von Forscherinnen und Forscher während des Forschungsprozesses konsultiert wird, auch zu Forschungsdaten zählen. Und natürlich können digitale Texte auch Forschungsdaten sein, wenn sie z.B. Teil eines Textkorpus sind, der in der Computerlinguistik benutzt wird. Forschungsdaten können auch in Texten enthalten sein, sodass viel Aufwand betrieben wird, um z.B. chemische Strukturformeln in alten Fachartikeln automatisiert zu erfassen und auszuwerten. Die Rolle, in der Forschungsdaten in einer bestimmten Phase des Forschungsprozesses benutzt werden, ist spezieller, es reicht nicht, dass es sich um irgendwelche digital repräsentierten Informationen handelt.

In dem oben erwähnten Vergleich verschiedener Fachdisziplinen hat sich gezeigt, dass die Anworten von Disziplinvertreterinnen und -vertreter auf die Frage, was Forschungsdaten in ihrer Disziplin sind, grob in zwei Gruppen unterteilt werden können (Neuroth et al 2012, S. 299ff). Zum einen werden die Forschungsdaten oft durch ihren Medientyp bezeichnet (z.B. Video, Markup, Tabellen, 3D-Modelle) und nicht selten scheint eine Abgrenzung von Dokumenten beabsichtigt. Zum anderen dient der Bezug auf die Forschungsmethode als Charakterisierung der Forschungsdaten (z.B. Simulationsdaten, Beobachtungsdaten, Statistikdaten). Dies kann als Ausgangspunkt für einen weiteren Definitionsversuch dienen: Sind Forschungsdaten alle diejenigen Daten, die durch die Anwendung einer wissenschaftlichen Methode im Forschungsprozess entstehen? (Vergleiche dazu die Erklärung der Schwerpunktinitiative "Digitale Information" der Allianz der Wissenschaftsorganisationen: „Forschungsdaten sind Daten, die im Zuge wissenschaftlicher Vorhaben z.B. durch Digitalisierung, Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen.“ (http://www.allianzinitiative.de/de/handlungsfelder/forschungsdaten.html)) Dies erlaubt zwar die Abgrenzung von Forschungsdaten und Textpublikationen, die am Ende das Ergebnis der Untersuchung kommunizieren, aber es finden sich schnell Gegenbeispiele. Nicht alle Forschungsdaten entstehen durch wissenschaftliche Methoden, sondern z.B. durch Zufall oder einfach als Zeitdokument oder Kulturprodukt, oder auch als Teil von Arbeitsprozessen und beliebigen Lebensäusserungen.

Forschungsdaten sind so vielfältig wie die Forschung selbst. In der modernen Wissenschaft ist es kaum mehr vorstellbar, dass etwas nicht Objekt wissenschaftlicher Untersuchung sein kann. (Würde ein solcher Bereich entdeckt, könnte dieser als Forschungslücke reklamiert und darüber geforscht und publizierter werden.) Die verwendeten Methoden sind nicht beliebig, aber die dabei entstehenden Forschungsdaten sind sehr vielfältig. Als Forschungsdaten sollten jedoch nicht nur alle Daten betrachtet werden, die mit einer wissenschaftlichen Methode über ein Forschungsobjekt erzeugt werden, sondern auch die Daten über ein Forschungsobjekt, die mit einer wissenschaftlichen Methode verarbeitet werden. Diese Definition erlaubt die Abgrenzung von textuellen Forschungsdaten von Textpublikationen, die nur am Ende das Ergebnis der Untersuchung kommunizieren oder am Anfang als Hintergrundwissen in die Gestaltung der Untersuchung einflossen. (Es sei nochmal darauf hingewiesen, dass Publikationen und Forschungsdaten kein Gegensatz sind. Ein Großteil des Forschungsdatenmanagements zielt darauf, Forschungsdaten zu publizieren. Forschungsdaten publizieren sollte ein anerkannter Bestandteil der Forschungstätigkeit sein.)

=> Überlegen Sie für einen konkreten Datensatz, in welchem Kontext dieser Gegenstand der Forschung sein kann, in welchem nicht.

In dem letzten Definitionsversuch wurde die Klausel “über ein Forschungsobjekt” hinzugefügt. Damit ist beabsichtigt, Forschungsdaten über ein Forschungsobjekt von reinen digitalen Stellvertretern des Forschungsobjekts abzugrenzen und das ist sicherlich nicht unumstritten. Ein Beispiel dafür sind Digitalisate einer mittelalterlichen Handschrift. Ein Literaturwissenschaftler, der über den Text der Handschrift forscht, kann zurecht behaupten, dass er mit dem Digitalisat Daten vorliegen hat, die er mit einer wissenschaftlichen Methode weiterverarbeitet, wird aber nach obiger Klausel wahrscheinlich nur selten behaupten, dass das Digitalisat Daten über sein Forschungsobjekt und damit ein Forschungsdatum darstellt. Das Digitalisat ist eher das Forschungsobjekt selbst bzw. eine Repräsentationsform des Forschungsobjekts. Eine Handschriftenforscherin, die hingegen weniger den textlichen Inhalt als das materielle Objekt erforscht, kann viel einfacher behaupten, dass das Digitalisat Daten über ihr Forschungsobjekt darstellt. Warum aber sollte diese Abgrenzung in der Definition vorgenommen werden?

Eine Definition ist nicht zweckfrei und neutral. Definitionen stellen ein Instrument der Kommunikation,insbesondere in der Wissenschaft dar. Dass es aber keine allgemein anerkannte Definition von Forschungsdaten gibt und das Forschungsdatenmanagement trotzdem große Fortschritte gemacht hat, zeigt aber, dass Definitionen nicht der alleinige Ausgangspunkt und die Grundlage für Kommunikation sein können. Sie sind stattdessen nach ihrer Nützlichkeit für bestimmte Zwecke bewerten. Natürlich kann die Bezeichung für Forschungsdaten beliebig weit gefasst werden , aber ob das nützlich und zielführend ist, ist eine andere Frage.

Die hier entwickelte These lautet, dass es sinnvoll ist, Forschungsdaten in verschiedenen Kontexten wie oben vorgeschlagen zu definieren, weil es auch hilft, gerade die neuen und bisher in klassischen Informationseinrichtungen vernachlässigten Aufgaben zu verstehen. Wenn Forschungsdaten so weit gefasst werden, dass auch Digitalisate oder gar jeder digitaler Text darunter fällt, dann ist zu fragen, warum die ganze Diskussion um Forschungsdatenmanagement stattfindet. Denn schließlich existieren sehr viele etablierte Verfahren und Methoden, um Digitalisate und digitale Texte zu managen, und gerade Bibliotheken können eine hohe Kompetenz in diesem Bereich beanspruchen. Die wissenschaftspolitische Brisanz der Definition ist jedoch, dass je nach Ausdehnung des Begriffs Forschungsdaten, unterschiedliche Institutionen behaupten können, bereits alle notwendige Kompetenz und Erfahrung zu besitzen und im Wettbewerb der Fördermittel das richtige Investitionsziel zu sein. Ganz im Sinne eines Lehrbuchs sehen die Autoren das Lehrreiche und Wichtige der Betrachtung des Forschungsdatenmanagements hier gerade darin, die bisher weniger unterstützten Objekte und Phasen des Forschungsprozesses aufzuzeigen. Damit öffenen sich auch Wege für bereits etablierte Institutionen, neue Aufgaben zu übernehmen und hinzulernen, sich und die Wissenschaft selbst weiterzuentwickeln. Oder es können neue Institutionen entstehen , die sich die neuen Aufgaben zu eigen machen. Die kürzeste Erklärung von Forschungsdaten könnte deshalb über die Aufgaben des Forschungsdatenmanagement erfolgen: Forschungsdaten sind das, was Gegenstand des Forschungsdatenmanagement ist.

=> Warum kann die Definition von Forschungsdaten nicht "ein für alle Mal" gegeben werden? Warum sind verschiedenen Annäherungen an die Definition sinnvoll, und keine ür sich allein?

Zusammenfassung

  • Es gibt sehr unterschiedliche Formen von Forschungsdaten. Man kann sich für fast alle digitalen Daten einen wissenschaftlichen Kontext überlegen, in denen es Forschungsdaten sind.
  • Die starke Kontextabhängigkeit von Forschungsdaten und die Vielfalt von Forschung macht eine Definition schwierig.
  • Auch Definitionen haben einen konkreten Zweck und einen Kontext, in dem sie nützlich sein sollen. Dieser Artikel vertritt die Ansicht, dass eine Definition von Forschungsdaten helfen sollte, die neuen Aufgaben des Forschungsdatenmanagement in den Blick zu bekommen und nicht nachträglich auch alle Aufgaben der Vergangenheit als Forschungsdatenmanagement aufzufassen.
  • Forschungsdaten sind alle digitalen Daten, die mit einer wissenschaftlichen Methode über ein Forschungsobjekt erzeugt werden oder verarbeitet werden.

Weiterführende Literatur