Warum braucht man Forschungsdatenmanagement: Unterschied zwischen den Versionen

Aus Handbuch.io
[unmarkierte Version][unmarkierte Version]
(Die Seite wurde neu angelegt: „Warum Forschungsdatenmanagement? (Enke/Ludwig) Diese Frage kann auf unterschiedliche Weisen betrachtet werden: 1. Wie ist das heute praktizierten Forschungs…“)
 
(individueller Nutzen betont)
 
(17 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
 
Warum Forschungsdatenmanagement? (Enke/Ludwig)
 
Warum Forschungsdatenmanagement? (Enke/Ludwig)
 +
 +
( [https://osl.tib.eu/w/Lehrbuch_Forschungsdatenmanagement Back to main page])
  
 
Diese Frage kann auf unterschiedliche Weisen betrachtet werden:
 
Diese Frage kann auf unterschiedliche Weisen betrachtet werden:
  
1. Wie ist das heute praktizierten Forschungsdatenmanagement entstanden? Diese Frage beschäftigt sich mit den Änderungen in den Forschungs(infra)strukturen, den Änderungen im Forschungsprozess, des wissenschaftlichen Arbeitens und auch mit den Änderungen des Status der Wissenschaftler.
+
1. Wie ist das heute praktizierte Forschungsdatenmanagement entstanden? Diese Frage beschäftigt sich mit den Änderungen in den Forschungs(infra)strukturen, den Änderungen im Forschungsprozess, des wissenschaftlichen Arbeitens und auch mit den Änderungen des Status der Wissenschaftler.  
2. Warum ist es sinnvoll, dass Forschungsdaten einem Management unteliegen sollen? Unabhängig davon, wie es dazu kam, kann der Sinn des Forschungsdatenmanagement in einer Reihe von Verbesserungen für die Wissenschaftlerin, die ihre eigenen Forschungsdaten managet, für den Wissenschaftler, der fremde Forschungsdaten nachnutzt, und für das Wissenschaftssystem als Ganzes, das zuverlässiger und effizienter wird, gesehen werden.
 
3. Und schließlich ist es auch sinnvoll sich zu vergegenwärtigen, in welchen Fällen Forschungsdatenmanagement nicht oder nur in reduziertem Maße sinnvoll ist, denn unterschiedliche Daten benötigen und rechtfertigen auch unterschiedliche Maßnahmen.
 
  
#1. Wie hat sich, das heute praktizierte Forschungsdatenmanagement entwickelt?
+
2. Warum ist Forschungsdatenmanagement sinnvoll? Der Sinn des Forschungsdatenmanagement liegt in einer Reihe von Verbesserungen für 
 +
* die Wissenschaftlerin, die ihre eigenen Forschungsdaten verwaltet, 
 +
* für die Wissenschaftlerin, die fremde Forschungsdaten nachnutzt,
 +
* für das Wissenschaftssystem als Ganzes, das zuverlässiger und effizienter wird,
 +
* und für den wissenschaftlichen Prozess, der nachprüfbar und robust gegenüber Fehlern wird.
  
Der nahezu ubiquitäre Einsatz von eletronischen Komponenten, angefangen bei dem Ersatz der Schreibmaschine durch den Arbeitsplatzrechner, über die digitale Steuerung von Arbeitsinstrumenten in Werkstatt und Labor bis hin zu Messgeräten und Instrumenten, die ohne elektronische/digitale Komponenten nicht denkbar sind, haben die Produktionsbedingungen in allen Fachdisziplinen einschneidendverändert. Damit einher sind Arbeitsweise und Arbeitsplatz eines Forschers einem tiefgreifenden Wandel unterworfen. Zudem ergeben sich für die Organisation der Forschungsprozesse sowohl im Labor als in ganzen Einrichtungen neue und weitergehende Aspekte bei der Erfassung und Bearbeitung vonUntersuchungen.  
+
3. Und schließlich ist es auch sinnvoll sich zu vergegenwärtigen, in welchen Fällen Forschungsdatenmanagement nicht oder nur in reduziertem Maße sinnvoll ist, denn unterschiedliche Daten benötigen und rechtfertigen auch unterschiedliche Maßnahmen. (Im Folgenden wird Forschungsdatenmanagement als FDM abgekürzt.)
 +
 
 +
1. Wie hat sich das heute praktizierte Forschungsdatenmanagement entwickelt?
 +
 
 +
Der nahezu ubiquitäre Einsatz von elektronischen Komponenten, angefangen bei dem Ersatz der Schreibmaschine durch den Arbeitsplatzrechner, über die digitale Steuerung von Arbeitsinstrumenten in Werkstatt und Labor bis hin zu Messgeräten und Instrumenten, die ohne elektronische/digitale Komponenten nicht denkbar sind, hat die Produktionsbedingungen in allen Fachdisziplinen einschneidend verändert. Damit einhergehend sind Arbeitsweise und Arbeitsplatz eines Forschers einem tiefgreifenden Wandel unterworfen. Zudem ergeben sich für die Organisation der Forschungsprozesse sowohl im Labor als auch in ganzen Einrichtungen neue und weitergehende Aspekte bei der Erfassung und Bearbeitung von Untersuchungen.  
 
Ein Beispiel für den Impact auf den individuellen Forschungsvorgang:  
 
Ein Beispiel für den Impact auf den individuellen Forschungsvorgang:  
Ein Physiker musste für die Messung in einem Experiment unter Verwendunganaloger Instrumente sicherstellen, dass deren Kalibrierung korrekt durchgeführt wurde, konnte dies im Laborbuch angeben/beschreiben und dann die Messreihen durchführen und protokollieren. Unter Verwendung eines modernen Messgerätes kann man diese Messreihen von der Elektronik protokollieren und auslesen lassen, wobei hier bereits das Problem der herstellerspezifischen Datenformate eine Rolle spielen kann, neben den Kalibrierungen, die nur noch begrenzt selbst vorgenommen werden können.  
+
Ein Physiker musste für die Messung in einem Experiment unter Verwendung analoger Instrumente sicherstellen, dass deren Kalibrierung korrekt durchgeführt wurde, konnte dies im Laborbuch angeben/beschreiben und dann die Messreihen durchführen und protokollieren. Unter Verwendung eines modernen Messgerätes kann wird diese Messreihen von der Elektronik protokolliert und ausgelesen, wobei hier bereits das Problem der herstellerspezifischen Datenformate eine Rolle spielen kann, neben den Kalibrierungen, die nur noch begrenzt selbst vorgenommen werden können.  
Für einen Sprachwissenschaftler, der anstelle des materiellen Zettelkastens z.B. eine solche Sammlung im Arbeitsplatzrechner anlegt und nutzt, stellt sich ein ähnliches Problem: dass die im Rechner verfügbaren Programme / Apps alle Daten in meist software-spezifischen Formaten ablegent, und bei einem Umzug zu einen neuen Rechner diese nicht unbedingt noch weiter zur Verfügung steht.  
+
Für einen Sprachwissenschaftler, der anstelle des materiellen Zettelkastens z.B. eine solche Sammlung im Arbeitsplatzrechner anlegt und nutzt, stellt sich ein ähnliches Problem: dass die im Rechner verfügbaren Programme / Apps alle Daten in meist software-spezifischen Formaten ablegen und bei einem Umzug zu einen neuen Rechner diese nicht unbedingt noch weiter zur Verfügung steht. (Siehe z.B. auch:  Stäcker, Thomas, Noch einmal: Was sind geisteswissenschaftliche Forschungsdaten?)
=>Digitale Daten verändernMethoden und Verfahren der Datenhaltung, insbesondere für die Wissenschaft. Suchen Sie Beispiele aus verschiedenen Fachisziplinen und arbeiten Sie die spezifischen Veränderungen heraus.
 
  
Die im Forschungsprozess eingesetzten Instrumente werden durch Chips und elektronische Sensoren gesteuert, wie auch die Datennahme mit diesen Instrumenten. Grössere Instrumente, wie z.B. MRI-Scanner in der Medizin, hochauflösende CCD-Kameras in vielen Anwendungsgebieten sind aus dem Forschungsalltag nicht mehr wegzudenken. Die Anforderungen an Güte und Genauigkeit treiben die erfassten Datenmengen in neue Grössenordnungen.Die Fülle der Daten, die anfallen, kann nur mit Hilfe von Computern aufbewahrt und organisiert werden. Die Kosten für solche Instrumente können nur durch gemeinschaftliche Nutzung durch grössere Gruppen von Wissenschaftlern für diverse Fragestellungen gerechtfertigt werden. Einher geht eine Veränderung des Forschungsprozesses, mitSpezialisierung, Arbeitsteilung und Kooperation der Forscher. Bereits auf der Ebene der Entstehung bzw. Produktion erfordert das Erfassen und Bearbeiten der Daten Konventionen und Absprachen, mindestens zwischen den beteiligten Wissenschaftlern. Solange jedoch die Resultate von Experimenten und Messungen einzig in textueller Form (Publikation) als relevante Ergebnisse betrachtet werden, stellt ein solches Verfahren kein Problem dar, vorausgesetzt, dass die Datenstrukturen einfach genug sind und die Spezialisten verfügbar bleiben. Diese Voraussetzungen sind mit zunehmender Komplexität der Instrumente der der Anzahl der Beteiligten kaum mehr eine realistische Annahme.
+
=> Digitale Daten verändern Methoden und Verfahren der Datenhaltung, insbesondere für die Wissenschaft. Suchen Sie Beispiele aus verschiedenen Fachdisziplinen und arbeiten Sie konkret heraus, wie digitale Methoden und Datenbestände die wissenschaftliche Arbeit verändert hat.
In den Sozialwissenschaften sind es die grossen, durch staatliche Institutionen und Organisationen erfassten Datenbestände (Gesundheitsbehörden, Kranken- und Sozialversicherungen, Katasterämter, Steuerbehörden, Volkszählungen usw.), die neben dievon den Wissenschaftlern geplanten Surveys und daraus gewonnene Daten treten. Natürlich haben diese Organisationen jeweils eigene, historisch gewachsene und beschränkte Verfahren zur Datenorganisation, die sich auch in der digitalen Struktur ihrer Datensammlungen widerspiegeln. Es ist offensichtlich, dass eine Verbesserung der Datenorganisation durch Erweiterung der Schnittmenge von gemeinsamen Metadaten enorme Vorteile allein schon für die Sozialwissenschaften hätte. Wir betrachten hier die ökonomischen, legalen und politischen Aspekte nicht.  
 
  
=> In beschränktem Umfang ist die Organisation der Datensammlung ein Bestandteil des Forschungsprozesses, wie auch im Betrieb einer Organisation. Charakteristisch hierfür sind jedoch die ideosynkratischen Strukturen dieser Datensammlungen. Die Notwendigkeit einer systematischen und professionellen Herangehensweise bei der Organisation der Daten wird durch die Komplexität des Forschungsprozesses erzwungen und ist Bestandteil desselben. Metadaten sind spezifisch, jedoch sind grosse Schnittmengen zwischen den verschiedenen Systemen möglich und vorteilhaft.
+
Die im Forschungsprozess eingesetzten Instrumente werden durch Chips und elektronische Sensoren gesteuert, wie auch die Datennahme mit diesen Instrumenten. Größere Instrumente, wie z.B. MRI-Scanner in der Medizin oder hochauflösende CCD-Kameras sind in vielen Anwendungsgebieten aus dem Forschungsalltag nicht mehr wegzudenken. Die Anforderungen an Güte und Genauigkeit treiben die erfassten Datenmengen in neue Größenordnungen. Die Fülle der Daten, die anfallen, kann nur mit Hilfe von Computern aufbewahrt und organisiert werden. Die Kosten für solche Instrumente können nur durch gemeinschaftliche Nutzung durch größere Gruppen von Wissenschaftlern für diverse Fragestellungen gerechtfertigt werden. Einher geht eine Veränderung des Forschungsprozesses, mit Spezialisierung, Arbeitsteilung und Kooperation der Forscher. Bereits auf der Ebene der Entstehung bzw. Produktion erfordert das Erfassen und Bearbeiten der Daten Konventionen und Absprachen, mindestens zwischen den beteiligten Wissenschaftlern. Solange jedoch die Resultate von Experimenten und Messungen einzig in textueller Form (Publikation) als relevante Ergebnisse betrachtet werden, stellt ein solches Verfahren kein Problem dar, vorausgesetzt, dass die Datenstrukturen einfach genug sind und die Spezialisten verfügbar bleiben. Diese Voraussetzungen sind mit zunehmender Komplexität der Instrumente der der Anzahl der Beteiligten kaum mehr eine realistische Annahme.  In den Sozialwissenschaften sind es die großen, durch staatliche Institutionen und Organisationen erfassten Datenbestände (Gesundheitsbehörden, Kranken- und Sozialversicherungen, Katasterämter, Steuerbehörden, Volkszählungen usw.), die neben die von den Wissenschaftlern geplanten Surveys und daraus gewonnenen Daten treten. Natürlich haben diese Organisationen jeweils eigene, historisch gewachsene und beschränkte Verfahren zur Datenorganisation, die sich auch in der digitalen Struktur ihrer Datensammlungen widerspiegeln. Es ist offensichtlich, dass eine Verbesserung der Datenorganisation durch Erweiterung der Schnittmenge von gemeinsamen Metadaten enorme Vorteile allein schon für die Sozialwissenschaften hätte. Wir betrachten hier die ökonomischen, legalen und politischen Aspekte nicht. Diese werden in einem späteren Teil ausfühlicher behandelt.
 +
 
 +
=> In beschränktem Umfang ist die Organisation der Datensammlung ein Bestandteil des Forschungsprozesses, wie auch im Betrieb einer Organisation. Charakteristisch hierfür sind jedoch die ideosynkratischen Strukturen dieser Datensammlungen. Die Notwendigkeit einer systematischen und professionellen Herangehensweise bei der Organisation der Daten wird durch die Komplexität des Forschungsprozesses erzwungen und ist Bestandteil desselben. Metadaten sind spezifisch, jedoch sind große Schnittmengen zwischen den verschiedenen Systemen möglich und vorteilhaft. Überlegen Sie, welche Schnittmenge besteht z.B. zwischen einer Messreihe mit einem Elektronenmikroskop und einer Langzeitstudie von Gewässerproben, oder einer soziologischen Langzeitstudie zur Entwicklung der Bevölkerungsentwicklung in einer Bergregion. 
 
   
 
   
Neben der öffentlich gefördertengibt es auch private Forschung in industriellem Auftrag oder in Unternehmen. Die folgende Betrachtung setzt jedoch voraus, das wissenschaftliche Erkenntnis auch öffentlichen Zugang und freien Austausch erfährt. Aus den Anfängen der modernen Wissenschaft im 18/19 Jahrhundert ist das Bild des Gelehrten, der seine Experimente und Forschungtätigkeit durch eigene Mittel finanziert, als Ideal gewärtig. Damit ist auch assoziiert, das die Ergebnisse seiner Forschung, wie auch seine Datensammlungen, privater Schatz des Gelehrten sind. Diese Vorstellung ist in der heutigen Zeit keineswegs mehr zutreffend. Der Grossteil der Forschung in Instituten und Hochschulen wird öffentlich finanziert. Damit sind auch Ergebnisse der Wissenschaftler in solchen Einrichtungen nicht mehr fraglos ihr materielles Eigentum, unbeschadet davon, das Ergebnisse ihr geistiges Eigentum bleiben. Die Schlussfolgerung hieraus ist, dass Verfügung über die Datensammlungen und auch deren Datenorganisation nicht beim einzelnen Forscher verbleiben kann und auch nicht seiner alleinigen Disposition unterliegen kann. Die legale Kodifizierung ist hier historisch, teilweise hinter der faktuellen Entwicklung zurückgeblieben.
+
Neben der öffentlich geförderten gibt es auch private Forschung in industriellem Auftrag oder in Unternehmen. Die folgende Betrachtung setzt jedoch voraus, dass wissenschaftliche Erkenntnis auch öffentlichen Zugang und freien Austausch erfährt. Aus den Anfängen der modernen Wissenschaft im 18./19. Jahrhundert ist das Bild des Gelehrten, der seine Experimente und Forschungstätigkeit durch eigene Mittel finanziert, als Ideal gegenwärtig. Damit ist auch assoziiert, das die Ergebnisse seiner Forschung, wie auch seine Datensammlungen, privater Schatz des Gelehrten sind. Diese Vorstellung ist in der heutigen Zeit keineswegs mehr zutreffend. Der Großteil der Forschung in Instituten und Hochschulen wird öffentlich finanziert. Damit sind auch Ergebnisse der Wissenschaftler in solchen Einrichtungen nicht mehr fraglos ihr materielles Eigentum, unbeschadet davon, dass Ergebnisse ihr geistiges Eigentum bleiben. Die Schlussfolgerung hieraus ist, dass Verfügung über die Datensammlungen und auch deren Datenorganisation nicht beim einzelnen Forscher verbleiben und auch nicht seiner alleinigen Disposition unterliegen kann. Die legale Kodifizierung ist hier historisch, teilweise hinter der faktuellen Entwicklung zurückgeblieben.
 +
 
 +
=> Forschungsdaten aus öffentlich finanzierten Forschungseinrichtungen sind öffentlich finanziertes Gut. Warum sind die Urheberschaft, i.e. das Recht, als Schöpfer/Autor einer wissenschaftlichen Erkenntnis genannt zu werden, und das Verwertungsrecht, i.e. mit den Anwendungen einer Erkenntnis Produkte zu erzeugen oder sie anderweitig wirtschaftlich zu verwerten, auseinanderzuhalten?
  
=> Forschungsdaten aus öffentlich finanzierten Forschungseinrichtungen sind öffentlich finanziertes Gut. Warum sind die Urheberschaft, i.e. das Recht, als Schöpfer/Autor einer wissenschaftlichen Erkenntnis genannt zu werden, und das Verwertungsrecht, i.e.mit den Anwendungen einer Erkenntnis Produkte zu erzeugen oder sie anderweitig wirtschaftlich zu verwerten, auseinanderzuhalten?
+
2. Warum ist Forschungsdatenmanagement sinnvoll?
  
#2. Warum ist Forschungsdatenmanagement sinnvoll?
+
Die digitale Form der Datensammlungen ermöglicht vielfältigere als nur die ursprünglich intendierte Nutzung, bietet neue Wege der Verifikation publizierter Ergebnisse, ermöglicht Kombination von Datensammlungen aus anderen wissenschaftlichen Fragestellungen und Fachgebieten. Die digitale Information ist darüber hinaus IT-basierten Methoden zugänglich, die mit statistischen und algorithmischen Analysen von Datensammlungen neue Gebiete in der Wissenslandschaft erschließen, z.B. die Computerlinguistik. Der daraus resultierende Nutzen für Wissenschaft und Gesellschaft ist noch nicht ausgelotet. Die Datenorganisation und -aufbereitung für deren erweiterte Wiederverwendung (Kuratierung) ist in vielen Wissensgebieten noch sehr begrenzt geeignet für die Möglichkeiten der digitalen Bearbeitung.
  
Nutzen und Zweck des Forschungsdatenmanagement
+
Im Folgenden sind einige der Vorteile für die Community (= Gemeinschaft der Wissenschaftler) aufgelistet:
 +
* FDM ermöglicht Anwendung neuer Methoden, die zum Entstehungszeitpunkt der Daten noch nicht existierten
 +
* FDM ermöglicht Nutzung eines größeren und vielgestaltigeren Datenbestands
 +
* FDM hilft bei der Reproduzierbarkeit und Nachvollziehbarkeit von Wissenschaft.
 +
* Häufig ist die Erzeugung der Daten viel teurer als die Bewahrung. Dieselben Daten mehrmals zu erzeugen verschwendet Zeit und Geld, die in Wissenschaft hätten investiert werden können. Nicht zuletzt deshalb haben Förderinstitutionen ein hohes Interesse an Forschungsdatenmanagement und erlassen entsprechende Auflagen, um den Gesamtnutzen ihrer Investitionen zu verbessern.
 +
* Manche Daten können aber gar nicht reproduziert werden, egal wieviel Geld investiert wird. Beobachtungsdaten, seien es naturwissenschaftliche Messdaten aus Klimavorgängen oder gesellschaftswissenschaftliche Umfragen können nicht ein Jahr später einfach wiederholt werden, es sind episodische Daten. Forschungsdatenmanagement ist notwendig, um solche Daten nutzbar zu halten.
  
Die digitale Form der Datensammlungen ermöglicht vielfältigere als nur die ursprünglich intendierte Nutzung, bietet neue Wege der Verifikation publizierter Ergebnisse,ermöglicht Kombination von Datensammlungen aus anderen wissenschaftlichen Fragestellungen und Fachgebieten. Die digitale Information ist darüberhinaus IT-basierten Methoden zugänglich, die mit statistischen und algorithmischen Analysen von Datensammlungen neue Gebiete in der Wissenslandschaft erschliessen, z.B. Computerlinguistik.Der daraus resultierende Nutzen für Wissenschaft und Gesellschaft ist noch nicht ausgelotet. Die Datenorganisation und Aufbereitung für deren erweiterte Wiederverwendung (Kuratierung) ist in vielen Wissensgebieten noch nicht bereit für die Möglichkeiten der digitalen Verwendung.
+
Es ist wichtig zu betonen, dass Forschungsdatenmanagement nicht nur anderen Wissenschaftlern hilft, die dann z.B. die Forschungsdaten nachnutzen, sondern auch den erzeugenden Wissenschaftlern und dem Ausgangsforschungsprojekt:
 +
* Die Aufbereitung und Pflege von Forschungsdaten ist oft eine notwendige Voraussetzung, um bestimmte Methoden überhaupt einsetzen zu können. Selbst das Teilen von Daten innerhalb eines Projekts setzt eine angemessene Beschreibung der Datensätze voraus.
 +
* Teil des Forschungsdatenmanagement ist es auch die Daten vor Verlust zu sichern. Ohne eine organisierte Datensicherung tritt immer wieder Datenverlust ein und kann wertvolle Arbeit zunichtemachen.
 +
* Wenn man Forschungsdaten publiziert, kann man eine höhere Sichtbarkeit und Anerkennung als Wissenschaftler erlangen. Es wurde bereits nachgewiesen, dass Artikel, die auch die zugrundeliegenden Forschungsdaten publizieren, häufiger zitiert werden als andere Artikel. (Quelle nachtragen, ggf. Kratz J and Strasser C. Data publication consensus and controversies [version 3; referees: 3 approved]. F1000Research 2014, 3:94 (doi: 10.12688/f1000research.3979.3) als weiterführende Literatur?)
 +
Es ist leider u.a. deshalb wichtig darauf hinzuweisen, dass auch die datenproduzierenden Wissenschaftlerinnen, Wissenschaftler und Projekte einen Nutzen von Forschungsdatenmanagement haben, weil Forschungsdatenmanagement-Aktivitäten sich häufig in einem Rechtfertigungszwang befinden und oft nicht als Teil der Forschung angesehen wird, wenn Finanzmittel und andere Ressourcen zugewiesen werden. Während im Einzelfall ein Projekt auch mit geringem Forschungsdatenmanagement gelingen mag, so ist für die Wissenschaft als Ganzes Forschungsdatenmanagement eine notwendige Voraussetzung und die Aufwände dafür müssen genauso wie die Kosten der Datenproduktion als Teil der Gesamtnutzungskosten der Daten betracht werden. Dass Förderinstitution Auflagen und Angebot bezüglich Forschungsdatenmanagement haben und es auch außerwissenschaftliche Auflagen wie z.B. rechtliche Vorschriften gibt, hilft leider nicht immer den Rechtfertigungszwang zu mindern.
  
Im Folgenden sind einige der Nutzen für die Community (= Gemeinschaft der Wissenschaftler) aufgelistet:
+
3. Ist Forschungsdatenmanagement immer sinnvoll?
- FDM ermöglicht Anwendung neuer Methoden auf alte Daten, die zum Entstehungszeitpunkt der Daten noch nicht existierten
 
- FDM ermöglicht Nutzung eines größeren Datenbestands
 
- FDM hilft bei der Reproduzierbarkeit und Nachvollziehbarkeit von Wissenschaft.
 
- Häufig ist die Erzeugung der Daten viel teurer als die Bewahrung. Dieselben Daten mehrmals zu erzeugen verschwendet Zeit und Geld, die in Wissenschaft hätten investiert werden können. Nicht zuletzt deshalb haben Förderinstitutionen ein hohes Interesse an Forschungsdatenmanagement und erlassen entsprechende Auflagen, um den Gesamtnutzen ihrer Investitionen zu verbessern.
 
- Manche Daten können aber gar nicht reproduziert werden, egal wieviel Geld investiert wird. Beobachtungsdaten, seien es naturwissenschaftliche Messdaten aus Klimavorgängen oder gesellschaftswissenschaftliche Umfragen können nicht ein Jahr später einfach wiederholt werden, es sind episodische Daten. Forschungsdatenmanagement ist notwendig, um solche Daten nutzbar zu halten.
 
  
Es ist wichtig zu betonen, dass Forschungsdatenmanagement nicht nur anderen Wissenschaftlern hilft, die dann z.B. die Forschungsdaten nachnutzen, sondern auch den erzeugenden Wissenschaftlern und dem Ausgangsforschungsprojekt nützen kann. Diese ist besonders wichtig, weil sich derzeit Forschungsdatenmanagement-Aktivitäten häufig in einem Rechtfertigungszwang befinden, der durch Auflagen und Angebot der Förderinstitution nur begrenzt gemindert wird:
+
Auch wenn es eine Vielzahl von guten Gründen gibt, in Forschungsdatenmanagement zu investieren, so ist doch in jedem Fall abzuwägen, ob und welche Maßnahmen sich lohnen. Die Ressourcen sind an jeder Institution und im gesamten Wissenschaftssystem begrenzt und es kann sehr viel Aufwand in das Forschungsdatenmanagement weniger Datensätze investiert werden. Eine Aufgabe des Forschungsdatenmanagement ist es daher abzuschätzen, wo sich der Aufwand lohnt und das Aufwand-Nutzen-Verhältnis besonders günstig ist. Diese Aufgabe ist leider sehr schwierig und aufgrund der damit verbundenen Mittelinvestition auch sehr politisch. Dabei sind die verschiedenen Stadien des Forschungsprozesses zu beachten. Eine Arbeitsgruppe oder ein Projekt wird andere Schwerpunkte der Datenorganisation haben als ein Institut, und Datenzentren und Repositorien sind wiederum mit anderen Fragen konfrontiert.
- neue Methoden erfordern FDM
 
- FDM ermöglicht neue Methoden
 
- FDM sichert die Forschung z.B. vor Datenverlust
 
  
 +
Wenn ein Forschungsdatenzentrum sich z.B. entscheidet, bestimmte Daten nicht anzunehmen und keinen Aufwand zu investieren, dann wird es sicherlich einzelne Fälle geben, in denen es sinnvoll gewesen wäre, die Daten doch anzunehmen. Wenn das Forschungsdatenzentrum einen rationalen und auf Erfahrungen basierenden Auswahlprozess entwickelt hat, wird es aber wahrscheinlich überwiegend die richtige Entscheidung treffen. Ähnliche Abwägungen müssen nicht nur für die Auswahl von Daten, sondern z.B. auch für die Art und Intensität des Datenmanagements jedes einzelnen Datensatzes getroffen werden. Dass es bei jeder einzelnen Entscheidung auch Fehlentscheidungen gibt, macht den Gesamtprozess aber nicht überflüssig. Der Verzicht auf eine möglichst rationale Planung und bewusste Entscheidung für oder gegen Forschungsdatenmanagement würde hingegen den Prozess dem Zufall überlassen und darauf verzichten, möglichst effizient Forschungsdaten zu managen. Ein solcher Entscheidungsprozess kann jedoch nicht ausschließlich durch Repository, Datenzentrum oder Archiv erfolgen, er muss auf von der jeweiligen Fachcommunity zu entscheidenden Kriterien beruhen. So diese Community-Prozesse noch nicht etabliert sind, ist es auch Aufgabe dieser Repositorien und Datenzentren, solche mit zu initiieren.
  
#3. Warum kann Forschungsdatenmanagement auch nicht sinnvoll sein?
+
=> Welche Akteure sollten bei der Entscheidung über ein Management von Daten einbezogen werden? Warum ist FDM nicht in jedem Falle sinnvoll?  
  
Auch wenn es eine Vielzahl von guten Gründen gibt, in Forschungsdatenmanagement zu investieren, so muss man doch in jedem Fall abwägen, ob und welche Maßnahmen sich lohnen. Die Ressourcen sind an jeder Institution und im gesamten Wissenschaftssystem begrenzt und man kann sehr viel Aufwand in das Forschungsdatenmanagement weniger Datensätze investieren. Eine Aufgabe des Forschungsdatenmanagement ist es deshalb auch abzuschätzen, wo sich der Aufwand lohnt und das Aufwand-Nutzen-Verhältnis besonders günstig ist. Diese Aufgabe ist leider sehr schwierig und aufgrund der damit verbundenen Mittelinvestition auch sehr politisch. Wenn ein Forschungsdatenzentrum sich z.B. entscheidet, bestimmte Daten nicht anzunehmen und keinen Aufwand zu investieren, dann wird es sicherlich einzelne Fälle geben, in denen es sinnvoll gewesen wäre, die Daten doch anzunehmen. Wenn es einen rationalen und auf Erfahrungen basierenden Auswahlprozess entwickelt hat, wird es aber wahrscheinlich überwiegend die richtige Entscheidung treffen. Und ähnliche Abwägungen müssen nicht nur für die Auswahl von Daten, sondern z.B. auch für die Art und Intensität des Datenmanagements jedes einzelnen Datensatzes getroffen werden. Dass es bei jeder einzelnen Entscheidung auch Fehlentscheidung gibt, macht den Gesamtprozess aber nicht überflüssig. Der Verzicht auf eine möglichst rationale Planung und bewusste Entscheidung für oder gegen Forschungsdatenmanagement würde hingegen den Prozess dem Zufall überlassen und man würde darauf verzichten, möglichst effizient Forschungsdaten zu managen. Ein solcherEntscheidungsprozess kann jedoch nicht ausschliesslich durch Repository, Datenzentrum oder Archiv erfolgen, er muss auf von der jeweiligen Fachcommunity zu entscheidenden Kriterien beruhen. So diese Community-Prozesse noch nicht etabliert sind, ist es auch Aufgabe dieser Datenprovider, solche zu initiieren.
+
Weiterführende Diskussion:
=> Welche Akteure sollten bei der Entscheidung über ein Management von Daten einbezogen werden? Warum ist FDM nicht in jeden Falle anzuwenden?
+
* Ludwig, Jens; Enke, Harry. (2013): „Leitfaden zum Forschungsdaten-Management. Handreichungen aus dem WissGrid-Projekt“, http://www.forschungsdaten.org/index.php/Datei:Leitfaden_Data-Management-WissGrid.pdf 
 +
* Stäcker, Thomas, "Noch einmal: Was sind geisteswissenschaftliche Forschungsdaten?", http://dhd-blog.org/?p=5995

Aktuelle Version vom 7. Februar 2016, 16:47 Uhr

Warum Forschungsdatenmanagement? (Enke/Ludwig)

( Back to main page)

Diese Frage kann auf unterschiedliche Weisen betrachtet werden:

1. Wie ist das heute praktizierte Forschungsdatenmanagement entstanden? Diese Frage beschäftigt sich mit den Änderungen in den Forschungs(infra)strukturen, den Änderungen im Forschungsprozess, des wissenschaftlichen Arbeitens und auch mit den Änderungen des Status der Wissenschaftler.

2. Warum ist Forschungsdatenmanagement sinnvoll? Der Sinn des Forschungsdatenmanagement liegt in einer Reihe von Verbesserungen für

  • die Wissenschaftlerin, die ihre eigenen Forschungsdaten verwaltet,
  • für die Wissenschaftlerin, die fremde Forschungsdaten nachnutzt,
  • für das Wissenschaftssystem als Ganzes, das zuverlässiger und effizienter wird,
  • und für den wissenschaftlichen Prozess, der nachprüfbar und robust gegenüber Fehlern wird.

3. Und schließlich ist es auch sinnvoll sich zu vergegenwärtigen, in welchen Fällen Forschungsdatenmanagement nicht oder nur in reduziertem Maße sinnvoll ist, denn unterschiedliche Daten benötigen und rechtfertigen auch unterschiedliche Maßnahmen. (Im Folgenden wird Forschungsdatenmanagement als FDM abgekürzt.)

1. Wie hat sich das heute praktizierte Forschungsdatenmanagement entwickelt?

Der nahezu ubiquitäre Einsatz von elektronischen Komponenten, angefangen bei dem Ersatz der Schreibmaschine durch den Arbeitsplatzrechner, über die digitale Steuerung von Arbeitsinstrumenten in Werkstatt und Labor bis hin zu Messgeräten und Instrumenten, die ohne elektronische/digitale Komponenten nicht denkbar sind, hat die Produktionsbedingungen in allen Fachdisziplinen einschneidend verändert. Damit einhergehend sind Arbeitsweise und Arbeitsplatz eines Forschers einem tiefgreifenden Wandel unterworfen. Zudem ergeben sich für die Organisation der Forschungsprozesse sowohl im Labor als auch in ganzen Einrichtungen neue und weitergehende Aspekte bei der Erfassung und Bearbeitung von Untersuchungen. Ein Beispiel für den Impact auf den individuellen Forschungsvorgang: Ein Physiker musste für die Messung in einem Experiment unter Verwendung analoger Instrumente sicherstellen, dass deren Kalibrierung korrekt durchgeführt wurde, konnte dies im Laborbuch angeben/beschreiben und dann die Messreihen durchführen und protokollieren. Unter Verwendung eines modernen Messgerätes kann wird diese Messreihen von der Elektronik protokolliert und ausgelesen, wobei hier bereits das Problem der herstellerspezifischen Datenformate eine Rolle spielen kann, neben den Kalibrierungen, die nur noch begrenzt selbst vorgenommen werden können. Für einen Sprachwissenschaftler, der anstelle des materiellen Zettelkastens z.B. eine solche Sammlung im Arbeitsplatzrechner anlegt und nutzt, stellt sich ein ähnliches Problem: dass die im Rechner verfügbaren Programme / Apps alle Daten in meist software-spezifischen Formaten ablegen und bei einem Umzug zu einen neuen Rechner diese nicht unbedingt noch weiter zur Verfügung steht. (Siehe z.B. auch: Stäcker, Thomas, Noch einmal: Was sind geisteswissenschaftliche Forschungsdaten?)

=> Digitale Daten verändern Methoden und Verfahren der Datenhaltung, insbesondere für die Wissenschaft. Suchen Sie Beispiele aus verschiedenen Fachdisziplinen und arbeiten Sie konkret heraus, wie digitale Methoden und Datenbestände die wissenschaftliche Arbeit verändert hat.

Die im Forschungsprozess eingesetzten Instrumente werden durch Chips und elektronische Sensoren gesteuert, wie auch die Datennahme mit diesen Instrumenten. Größere Instrumente, wie z.B. MRI-Scanner in der Medizin oder hochauflösende CCD-Kameras sind in vielen Anwendungsgebieten aus dem Forschungsalltag nicht mehr wegzudenken. Die Anforderungen an Güte und Genauigkeit treiben die erfassten Datenmengen in neue Größenordnungen. Die Fülle der Daten, die anfallen, kann nur mit Hilfe von Computern aufbewahrt und organisiert werden. Die Kosten für solche Instrumente können nur durch gemeinschaftliche Nutzung durch größere Gruppen von Wissenschaftlern für diverse Fragestellungen gerechtfertigt werden. Einher geht eine Veränderung des Forschungsprozesses, mit Spezialisierung, Arbeitsteilung und Kooperation der Forscher. Bereits auf der Ebene der Entstehung bzw. Produktion erfordert das Erfassen und Bearbeiten der Daten Konventionen und Absprachen, mindestens zwischen den beteiligten Wissenschaftlern. Solange jedoch die Resultate von Experimenten und Messungen einzig in textueller Form (Publikation) als relevante Ergebnisse betrachtet werden, stellt ein solches Verfahren kein Problem dar, vorausgesetzt, dass die Datenstrukturen einfach genug sind und die Spezialisten verfügbar bleiben. Diese Voraussetzungen sind mit zunehmender Komplexität der Instrumente der der Anzahl der Beteiligten kaum mehr eine realistische Annahme. In den Sozialwissenschaften sind es die großen, durch staatliche Institutionen und Organisationen erfassten Datenbestände (Gesundheitsbehörden, Kranken- und Sozialversicherungen, Katasterämter, Steuerbehörden, Volkszählungen usw.), die neben die von den Wissenschaftlern geplanten Surveys und daraus gewonnenen Daten treten. Natürlich haben diese Organisationen jeweils eigene, historisch gewachsene und beschränkte Verfahren zur Datenorganisation, die sich auch in der digitalen Struktur ihrer Datensammlungen widerspiegeln. Es ist offensichtlich, dass eine Verbesserung der Datenorganisation durch Erweiterung der Schnittmenge von gemeinsamen Metadaten enorme Vorteile allein schon für die Sozialwissenschaften hätte. Wir betrachten hier die ökonomischen, legalen und politischen Aspekte nicht. Diese werden in einem späteren Teil ausfühlicher behandelt.

=> In beschränktem Umfang ist die Organisation der Datensammlung ein Bestandteil des Forschungsprozesses, wie auch im Betrieb einer Organisation. Charakteristisch hierfür sind jedoch die ideosynkratischen Strukturen dieser Datensammlungen. Die Notwendigkeit einer systematischen und professionellen Herangehensweise bei der Organisation der Daten wird durch die Komplexität des Forschungsprozesses erzwungen und ist Bestandteil desselben. Metadaten sind spezifisch, jedoch sind große Schnittmengen zwischen den verschiedenen Systemen möglich und vorteilhaft. Überlegen Sie, welche Schnittmenge besteht z.B. zwischen einer Messreihe mit einem Elektronenmikroskop und einer Langzeitstudie von Gewässerproben, oder einer soziologischen Langzeitstudie zur Entwicklung der Bevölkerungsentwicklung in einer Bergregion.

Neben der öffentlich geförderten gibt es auch private Forschung in industriellem Auftrag oder in Unternehmen. Die folgende Betrachtung setzt jedoch voraus, dass wissenschaftliche Erkenntnis auch öffentlichen Zugang und freien Austausch erfährt. Aus den Anfängen der modernen Wissenschaft im 18./19. Jahrhundert ist das Bild des Gelehrten, der seine Experimente und Forschungstätigkeit durch eigene Mittel finanziert, als Ideal gegenwärtig. Damit ist auch assoziiert, das die Ergebnisse seiner Forschung, wie auch seine Datensammlungen, privater Schatz des Gelehrten sind. Diese Vorstellung ist in der heutigen Zeit keineswegs mehr zutreffend. Der Großteil der Forschung in Instituten und Hochschulen wird öffentlich finanziert. Damit sind auch Ergebnisse der Wissenschaftler in solchen Einrichtungen nicht mehr fraglos ihr materielles Eigentum, unbeschadet davon, dass Ergebnisse ihr geistiges Eigentum bleiben. Die Schlussfolgerung hieraus ist, dass Verfügung über die Datensammlungen und auch deren Datenorganisation nicht beim einzelnen Forscher verbleiben und auch nicht seiner alleinigen Disposition unterliegen kann. Die legale Kodifizierung ist hier historisch, teilweise hinter der faktuellen Entwicklung zurückgeblieben.

=> Forschungsdaten aus öffentlich finanzierten Forschungseinrichtungen sind öffentlich finanziertes Gut. Warum sind die Urheberschaft, i.e. das Recht, als Schöpfer/Autor einer wissenschaftlichen Erkenntnis genannt zu werden, und das Verwertungsrecht, i.e. mit den Anwendungen einer Erkenntnis Produkte zu erzeugen oder sie anderweitig wirtschaftlich zu verwerten, auseinanderzuhalten?

2. Warum ist Forschungsdatenmanagement sinnvoll?

Die digitale Form der Datensammlungen ermöglicht vielfältigere als nur die ursprünglich intendierte Nutzung, bietet neue Wege der Verifikation publizierter Ergebnisse, ermöglicht Kombination von Datensammlungen aus anderen wissenschaftlichen Fragestellungen und Fachgebieten. Die digitale Information ist darüber hinaus IT-basierten Methoden zugänglich, die mit statistischen und algorithmischen Analysen von Datensammlungen neue Gebiete in der Wissenslandschaft erschließen, z.B. die Computerlinguistik. Der daraus resultierende Nutzen für Wissenschaft und Gesellschaft ist noch nicht ausgelotet. Die Datenorganisation und -aufbereitung für deren erweiterte Wiederverwendung (Kuratierung) ist in vielen Wissensgebieten noch sehr begrenzt geeignet für die Möglichkeiten der digitalen Bearbeitung.

Im Folgenden sind einige der Vorteile für die Community (= Gemeinschaft der Wissenschaftler) aufgelistet:

  • FDM ermöglicht Anwendung neuer Methoden, die zum Entstehungszeitpunkt der Daten noch nicht existierten
  • FDM ermöglicht Nutzung eines größeren und vielgestaltigeren Datenbestands
  • FDM hilft bei der Reproduzierbarkeit und Nachvollziehbarkeit von Wissenschaft.
  • Häufig ist die Erzeugung der Daten viel teurer als die Bewahrung. Dieselben Daten mehrmals zu erzeugen verschwendet Zeit und Geld, die in Wissenschaft hätten investiert werden können. Nicht zuletzt deshalb haben Förderinstitutionen ein hohes Interesse an Forschungsdatenmanagement und erlassen entsprechende Auflagen, um den Gesamtnutzen ihrer Investitionen zu verbessern.
  • Manche Daten können aber gar nicht reproduziert werden, egal wieviel Geld investiert wird. Beobachtungsdaten, seien es naturwissenschaftliche Messdaten aus Klimavorgängen oder gesellschaftswissenschaftliche Umfragen können nicht ein Jahr später einfach wiederholt werden, es sind episodische Daten. Forschungsdatenmanagement ist notwendig, um solche Daten nutzbar zu halten.

Es ist wichtig zu betonen, dass Forschungsdatenmanagement nicht nur anderen Wissenschaftlern hilft, die dann z.B. die Forschungsdaten nachnutzen, sondern auch den erzeugenden Wissenschaftlern und dem Ausgangsforschungsprojekt:

  • Die Aufbereitung und Pflege von Forschungsdaten ist oft eine notwendige Voraussetzung, um bestimmte Methoden überhaupt einsetzen zu können. Selbst das Teilen von Daten innerhalb eines Projekts setzt eine angemessene Beschreibung der Datensätze voraus.
  • Teil des Forschungsdatenmanagement ist es auch die Daten vor Verlust zu sichern. Ohne eine organisierte Datensicherung tritt immer wieder Datenverlust ein und kann wertvolle Arbeit zunichtemachen.
  • Wenn man Forschungsdaten publiziert, kann man eine höhere Sichtbarkeit und Anerkennung als Wissenschaftler erlangen. Es wurde bereits nachgewiesen, dass Artikel, die auch die zugrundeliegenden Forschungsdaten publizieren, häufiger zitiert werden als andere Artikel. (Quelle nachtragen, ggf. Kratz J and Strasser C. Data publication consensus and controversies [version 3; referees: 3 approved]. F1000Research 2014, 3:94 (doi: 10.12688/f1000research.3979.3) als weiterführende Literatur?)

Es ist leider u.a. deshalb wichtig darauf hinzuweisen, dass auch die datenproduzierenden Wissenschaftlerinnen, Wissenschaftler und Projekte einen Nutzen von Forschungsdatenmanagement haben, weil Forschungsdatenmanagement-Aktivitäten sich häufig in einem Rechtfertigungszwang befinden und oft nicht als Teil der Forschung angesehen wird, wenn Finanzmittel und andere Ressourcen zugewiesen werden. Während im Einzelfall ein Projekt auch mit geringem Forschungsdatenmanagement gelingen mag, so ist für die Wissenschaft als Ganzes Forschungsdatenmanagement eine notwendige Voraussetzung und die Aufwände dafür müssen genauso wie die Kosten der Datenproduktion als Teil der Gesamtnutzungskosten der Daten betracht werden. Dass Förderinstitution Auflagen und Angebot bezüglich Forschungsdatenmanagement haben und es auch außerwissenschaftliche Auflagen wie z.B. rechtliche Vorschriften gibt, hilft leider nicht immer den Rechtfertigungszwang zu mindern.

3. Ist Forschungsdatenmanagement immer sinnvoll?

Auch wenn es eine Vielzahl von guten Gründen gibt, in Forschungsdatenmanagement zu investieren, so ist doch in jedem Fall abzuwägen, ob und welche Maßnahmen sich lohnen. Die Ressourcen sind an jeder Institution und im gesamten Wissenschaftssystem begrenzt und es kann sehr viel Aufwand in das Forschungsdatenmanagement weniger Datensätze investiert werden. Eine Aufgabe des Forschungsdatenmanagement ist es daher abzuschätzen, wo sich der Aufwand lohnt und das Aufwand-Nutzen-Verhältnis besonders günstig ist. Diese Aufgabe ist leider sehr schwierig und aufgrund der damit verbundenen Mittelinvestition auch sehr politisch. Dabei sind die verschiedenen Stadien des Forschungsprozesses zu beachten. Eine Arbeitsgruppe oder ein Projekt wird andere Schwerpunkte der Datenorganisation haben als ein Institut, und Datenzentren und Repositorien sind wiederum mit anderen Fragen konfrontiert.

Wenn ein Forschungsdatenzentrum sich z.B. entscheidet, bestimmte Daten nicht anzunehmen und keinen Aufwand zu investieren, dann wird es sicherlich einzelne Fälle geben, in denen es sinnvoll gewesen wäre, die Daten doch anzunehmen. Wenn das Forschungsdatenzentrum einen rationalen und auf Erfahrungen basierenden Auswahlprozess entwickelt hat, wird es aber wahrscheinlich überwiegend die richtige Entscheidung treffen. Ähnliche Abwägungen müssen nicht nur für die Auswahl von Daten, sondern z.B. auch für die Art und Intensität des Datenmanagements jedes einzelnen Datensatzes getroffen werden. Dass es bei jeder einzelnen Entscheidung auch Fehlentscheidungen gibt, macht den Gesamtprozess aber nicht überflüssig. Der Verzicht auf eine möglichst rationale Planung und bewusste Entscheidung für oder gegen Forschungsdatenmanagement würde hingegen den Prozess dem Zufall überlassen und darauf verzichten, möglichst effizient Forschungsdaten zu managen. Ein solcher Entscheidungsprozess kann jedoch nicht ausschließlich durch Repository, Datenzentrum oder Archiv erfolgen, er muss auf von der jeweiligen Fachcommunity zu entscheidenden Kriterien beruhen. So diese Community-Prozesse noch nicht etabliert sind, ist es auch Aufgabe dieser Repositorien und Datenzentren, solche mit zu initiieren.

=> Welche Akteure sollten bei der Entscheidung über ein Management von Daten einbezogen werden? Warum ist FDM nicht in jedem Falle sinnvoll?

Weiterführende Diskussion: