Warum braucht man Forschungsdatenmanagement?

Aus Handbuch.io

Warum Forschungsdatenmanagement? (Enke/Ludwig)

Diese Frage kann auf unterschiedliche Weisen betrachtet werden:.

1. Wie ist das heute praktizierten Forschungsdatenmanagement entstanden? Diese Frage beschäftigt sich mit den Änderungen in den Forschungs(infra)strukturen, den Änderungen im Forschungsprozess, des wissenschaftlichen Arbeitens und auch mit den Änderungen des Status der Wissenschaftler.

2. Warum ist es sinnvoll, dass Forschungsdaten einem Management unteliegen sollen? Unabhängig davon, wie es dazu kam, kann der Sinn des Forschungsdatenmanagement in einer Reihe von Verbesserungen für die Wissenschaftlerin, die ihre eigenen Forschungsdaten managet, für den Wissenschaftler, der fremde Forschungsdaten nachnutzt, und für das Wissenschaftssystem als Ganzes, das zuverlässiger und effizienter wird, gesehen werden.

3. Und schließlich ist es auch sinnvoll sich zu vergegenwärtigen, in welchen Fällen Forschungsdatenmanagement nicht oder nur in reduziertem Maße sinnvoll ist, denn unterschiedliche Daten benötigen und rechtfertigen auch unterschiedliche Maßnahmen.

Wie hat sich, das heute praktizierte Forschungsdatenmanagement entwickelt?

Der nahezu ubiquitäre Einsatz von eletronischen Komponenten, angefangen bei dem Ersatz der Schreibmaschine durch den Arbeitsplatzrechner, über die digitale Steuerung von Arbeitsinstrumenten in Werkstatt und Labor bis hin zu Messgeräten und Instrumenten, die ohne elektronische/digitale Komponenten nicht denkbar sind, haben die Produktionsbedingungen in allen Fachdisziplinen einschneidendverändert. Damit einher sind Arbeitsweise und Arbeitsplatz eines Forschers einem tiefgreifenden Wandel unterworfen. Zudem ergeben sich für die Organisation der Forschungsprozesse sowohl im Labor als in ganzen Einrichtungen neue und weitergehende Aspekte bei der Erfassung und Bearbeitung vonUntersuchungen. Ein Beispiel für den Impact auf den individuellen Forschungsvorgang: Ein Physiker musste für die Messung in einem Experiment unter Verwendunganaloger Instrumente sicherstellen, dass deren Kalibrierung korrekt durchgeführt wurde, konnte dies im Laborbuch angeben/beschreiben und dann die Messreihen durchführen und protokollieren. Unter Verwendung eines modernen Messgerätes kann man diese Messreihen von der Elektronik protokollieren und auslesen lassen, wobei hier bereits das Problem der herstellerspezifischen Datenformate eine Rolle spielen kann, neben den Kalibrierungen, die nur noch begrenzt selbst vorgenommen werden können. Für einen Sprachwissenschaftler, der anstelle des materiellen Zettelkastens z.B. eine solche Sammlung im Arbeitsplatzrechner anlegt und nutzt, stellt sich ein ähnliches Problem: dass die im Rechner verfügbaren Programme / Apps alle Daten in meist software-spezifischen Formaten ablegent, und bei einem Umzug zu einen neuen Rechner diese nicht unbedingt noch weiter zur Verfügung steht. =>Digitale Daten verändernMethoden und Verfahren der Datenhaltung, insbesondere für die Wissenschaft. Suchen Sie Beispiele aus verschiedenen Fachisziplinen und arbeiten Sie die spezifischen Veränderungen heraus.

Die im Forschungsprozess eingesetzten Instrumente werden durch Chips und elektronische Sensoren gesteuert, wie auch die Datennahme mit diesen Instrumenten. Grössere Instrumente, wie z.B. MRI-Scanner in der Medizin, hochauflösende CCD-Kameras in vielen Anwendungsgebieten sind aus dem Forschungsalltag nicht mehr wegzudenken. Die Anforderungen an Güte und Genauigkeit treiben die erfassten Datenmengen in neue Grössenordnungen.Die Fülle der Daten, die anfallen, kann nur mit Hilfe von Computern aufbewahrt und organisiert werden. Die Kosten für solche Instrumente können nur durch gemeinschaftliche Nutzung durch grössere Gruppen von Wissenschaftlern für diverse Fragestellungen gerechtfertigt werden. Einher geht eine Veränderung des Forschungsprozesses, mitSpezialisierung, Arbeitsteilung und Kooperation der Forscher. Bereits auf der Ebene der Entstehung bzw. Produktion erfordert das Erfassen und Bearbeiten der Daten Konventionen und Absprachen, mindestens zwischen den beteiligten Wissenschaftlern. Solange jedoch die Resultate von Experimenten und Messungen einzig in textueller Form (Publikation) als relevante Ergebnisse betrachtet werden, stellt ein solches Verfahren kein Problem dar, vorausgesetzt, dass die Datenstrukturen einfach genug sind und die Spezialisten verfügbar bleiben. Diese Voraussetzungen sind mit zunehmender Komplexität der Instrumente der der Anzahl der Beteiligten kaum mehr eine realistische Annahme. In den Sozialwissenschaften sind es die grossen, durch staatliche Institutionen und Organisationen erfassten Datenbestände (Gesundheitsbehörden, Kranken- und Sozialversicherungen, Katasterämter, Steuerbehörden, Volkszählungen usw.), die neben dievon den Wissenschaftlern geplanten Surveys und daraus gewonnene Daten treten. Natürlich haben diese Organisationen jeweils eigene, historisch gewachsene und beschränkte Verfahren zur Datenorganisation, die sich auch in der digitalen Struktur ihrer Datensammlungen widerspiegeln. Es ist offensichtlich, dass eine Verbesserung der Datenorganisation durch Erweiterung der Schnittmenge von gemeinsamen Metadaten enorme Vorteile allein schon für die Sozialwissenschaften hätte. Wir betrachten hier die ökonomischen, legalen und politischen Aspekte nicht.

=> In beschränktem Umfang ist die Organisation der Datensammlung ein Bestandteil des Forschungsprozesses, wie auch im Betrieb einer Organisation. Charakteristisch hierfür sind jedoch die ideosynkratischen Strukturen dieser Datensammlungen. Die Notwendigkeit einer systematischen und professionellen Herangehensweise bei der Organisation der Daten wird durch die Komplexität des Forschungsprozesses erzwungen und ist Bestandteil desselben. Metadaten sind spezifisch, jedoch sind grosse Schnittmengen zwischen den verschiedenen Systemen möglich und vorteilhaft.

Neben der öffentlich gefördertengibt es auch private Forschung in industriellem Auftrag oder in Unternehmen. Die folgende Betrachtung setzt jedoch voraus, das wissenschaftliche Erkenntnis auch öffentlichen Zugang und freien Austausch erfährt. Aus den Anfängen der modernen Wissenschaft im 18/19 Jahrhundert ist das Bild des Gelehrten, der seine Experimente und Forschungtätigkeit durch eigene Mittel finanziert, als Ideal gewärtig. Damit ist auch assoziiert, das die Ergebnisse seiner Forschung, wie auch seine Datensammlungen, privater Schatz des Gelehrten sind. Diese Vorstellung ist in der heutigen Zeit keineswegs mehr zutreffend. Der Grossteil der Forschung in Instituten und Hochschulen wird öffentlich finanziert. Damit sind auch Ergebnisse der Wissenschaftler in solchen Einrichtungen nicht mehr fraglos ihr materielles Eigentum, unbeschadet davon, das Ergebnisse ihr geistiges Eigentum bleiben. Die Schlussfolgerung hieraus ist, dass Verfügung über die Datensammlungen und auch deren Datenorganisation nicht beim einzelnen Forscher verbleiben kann und auch nicht seiner alleinigen Disposition unterliegen kann. Die legale Kodifizierung ist hier historisch, teilweise hinter der faktuellen Entwicklung zurückgeblieben.

=> Forschungsdaten aus öffentlich finanzierten Forschungseinrichtungen sind öffentlich finanziertes Gut. Warum sind die Urheberschaft, i.e. das Recht, als Schöpfer/Autor einer wissenschaftlichen Erkenntnis genannt zu werden, und das Verwertungsrecht, i.e.mit den Anwendungen einer Erkenntnis Produkte zu erzeugen oder sie anderweitig wirtschaftlich zu verwerten, auseinanderzuhalten?

Warum ist Forschungsdatenmanagement sinnvoll?

Nutzen und Zweck des Forschungsdatenmanagement

Die digitale Form der Datensammlungen ermöglicht vielfältigere als nur die ursprünglich intendierte Nutzung, bietet neue Wege der Verifikation publizierter Ergebnisse,ermöglicht Kombination von Datensammlungen aus anderen wissenschaftlichen Fragestellungen und Fachgebieten. Die digitale Information ist darüberhinaus IT-basierten Methoden zugänglich, die mit statistischen und algorithmischen Analysen von Datensammlungen neue Gebiete in der Wissenslandschaft erschliessen, z.B. Computerlinguistik.Der daraus resultierende Nutzen für Wissenschaft und Gesellschaft ist noch nicht ausgelotet. Die Datenorganisation und Aufbereitung für deren erweiterte Wiederverwendung (Kuratierung) ist in vielen Wissensgebieten noch nicht bereit für die Möglichkeiten der digitalen Verwendung.

Im Folgenden sind einige der Nutzen für die Community (= Gemeinschaft der Wissenschaftler) aufgelistet:

  • FDM ermöglicht Anwendung neuer Methoden auf alte Daten, die zum Entstehungszeitpunkt der Daten noch nicht existierten
  • FDM ermöglicht Nutzung eines größeren Datenbestands
  • FDM hilft bei der Reproduzierbarkeit und Nachvollziehbarkeit von Wissenschaft.
  • Häufig ist die Erzeugung der Daten viel teurer als die Bewahrung. Dieselben Daten mehrmals zu erzeugen verschwendet Zeit und Geld, die in Wissenschaft hätten investiert werden können. Nicht zuletzt deshalb haben Förderinstitutionen ein hohes Interesse an Forschungsdatenmanagement und erlassen entsprechende Auflagen, um den Gesamtnutzen ihrer Investitionen zu verbessern.
  • Manche Daten können aber gar nicht reproduziert werden, egal wieviel Geld investiert wird. Beobachtungsdaten, seien es naturwissenschaftliche Messdaten aus Klimavorgängen oder gesellschaftswissenschaftliche Umfragen können nicht ein Jahr später einfach wiederholt werden, es sind episodische Daten. Forschungsdatenmanagement ist notwendig, um solche Daten nutzbar zu halten.

Es ist wichtig zu betonen, dass Forschungsdatenmanagement nicht nur anderen Wissenschaftlern hilft, die dann z.B. die Forschungsdaten nachnutzen, sondern auch den erzeugenden Wissenschaftlern und dem Ausgangsforschungsprojekt nützen kann. Diese ist besonders wichtig, weil sich derzeit Forschungsdatenmanagement-Aktivitäten häufig in einem Rechtfertigungszwang befinden, der durch Auflagen und Angebot der Förderinstitution nur begrenzt gemindert wird:

  • neue Methoden erfordern FDM
  • FDM ermöglicht neue Methoden
  • FDM sichert die Forschung z.B. vor Datenverlust


Warum kann Forschungsdatenmanagement auch nicht sinnvoll sein?

Auch wenn es eine Vielzahl von guten Gründen gibt, in Forschungsdatenmanagement zu investieren, so muss man doch in jedem Fall abwägen, ob und welche Maßnahmen sich lohnen. Die Ressourcen sind an jeder Institution und im gesamten Wissenschaftssystem begrenzt und man kann sehr viel Aufwand in das Forschungsdatenmanagement weniger Datensätze investieren. Eine Aufgabe des Forschungsdatenmanagement ist es deshalb auch abzuschätzen, wo sich der Aufwand lohnt und das Aufwand-Nutzen-Verhältnis besonders günstig ist. Diese Aufgabe ist leider sehr schwierig und aufgrund der damit verbundenen Mittelinvestition auch sehr politisch. Wenn ein Forschungsdatenzentrum sich z.B. entscheidet, bestimmte Daten nicht anzunehmen und keinen Aufwand zu investieren, dann wird es sicherlich einzelne Fälle geben, in denen es sinnvoll gewesen wäre, die Daten doch anzunehmen. Wenn es einen rationalen und auf Erfahrungen basierenden Auswahlprozess entwickelt hat, wird es aber wahrscheinlich überwiegend die richtige Entscheidung treffen. Und ähnliche Abwägungen müssen nicht nur für die Auswahl von Daten, sondern z.B. auch für die Art und Intensität des Datenmanagements jedes einzelnen Datensatzes getroffen werden. Dass es bei jeder einzelnen Entscheidung auch Fehlentscheidung gibt, macht den Gesamtprozess aber nicht überflüssig. Der Verzicht auf eine möglichst rationale Planung und bewusste Entscheidung für oder gegen Forschungsdatenmanagement würde hingegen den Prozess dem Zufall überlassen und man würde darauf verzichten, möglichst effizient Forschungsdaten zu managen. Ein solcher Entscheidungsprozess kann jedoch nicht ausschliesslich durch Repository, Datenzentrum oder Archiv erfolgen, er muss auf von der jeweiligen Fachcommunity zu entscheidenden Kriterien beruhen. So diese Community-Prozesse noch nicht etabliert sind, ist es auch Aufgabe dieser Datenprovider, solche zu initiieren. => Welche Akteure sollten bei der Entscheidung über ein Management von Daten einbezogen werden? Warum ist FDM nicht in jeden Falle anzuwenden?

Zusammenfassung

  • Die Frage, warum wir Forschungsdatenmanagement brauchen, kann unter verschiedenen Gesichtspunkten betrachtet werden: die historische Entwicklung (Warum hat sich FDM herausgebildet?), der Nutzen (Warum ist FDM für wen sinnvoll?) und den Voraussetzungen (Warum ist FDM in einem bestimmten Fall noch oder nicht mehr sinnvoll?).
  • Historisch hat sich mit der Weiterentwicklung der wissenschaftlichen Methoden und Instrumente auch das Forschungsdatenmanagement weiterentwickelt.
  • Forschungsdatenmanagement ist nützlich für die individuellen Wissenschaftler (als Datenproduzenten und -nutzer) und die Wissenschaft und Gesellschaft als Ganze.
  • Forschungsdatenmanagement ist aufwändig und nicht in jedem Fall steht der Aufwand in einem sinnvollen Verhältnis zum Nutzen.

Weiterführende Literatur