DH-Handbuch/Einführung

Aus Handbuch.io

Über dieses Handbuch

Was sind die Digital Humanities?

Was sind relevante Forschungsfragen?

Mithilfe welcher Tools lassen sich Fragen beantworten?

Was müssen Geisteswissenschaftlern beim Umgang mit Daten beachten?

Wie sehen erfolgreiche Projekte in den Digital Humanities aus?

Das vorliegende Handbuch ist im Rahmen eines Book Sprints an der Open Knowledge Foundation[1] im August 2015 in Berlin entstanden. Ziel der Autoren war es, die oben genannten Fragen zu beantworten. Das Buch soll dazu dienen, einen konzentrierten Überblick über die Digital Humanities (DH) vorzulegen, um interessierten Fachwissenschaftlern einen breiten aber dennoch leicht verständlichen Einblick in Fragestellungen, Probleme und Lösungswege, aber auch Projekte und Referenzen in den Digital Humanities zu geben.

Ziel ist, sowohl dabei zu helfen, vorhandene Kenntnisse aufzufrischen aber auch neue Aspekte der Digital Humanities kennenzulernen. Die Nähe zur fachwissenschaftlichen Praxis stand dabei im Vordergrund. Wir hoffen, mit diesem Handbuch auch Einsteigern die Digital Humanities nahebringen zu können und die Neugierde auf digitale Methoden und deren Möglichkeiten für die geisteswissenschaftliche Forschung zu wecken.

Was sind die Digital Humanities

Bestimmte Forschungsfragen lassen sich durch den Einsatz von Computern besser beantworten als mithilfe konventioneller, nicht-digitaler Methoden der Geisteswissenschaften. Andere geisteswissenschaftliche Fragen lassen sich überhaupt nur bearbeiten, weil es digitale Methoden und Verfahren gibt. Ob digitale Methoden und Verfahren eingesetzt werden oder nicht, hängt dabei wesentlich von den Forschungsfragen ab, die im Zentrum des geisteswissenschaftlichen Interesses stehen.

So empfiehlt sich der Einsatz digitaler Werkzeuge insbesondere dann, wenn sehr große Datenmengen untersucht, sehr lange Perioden fokussiert, oder feinste Unterschiede zwischen Inhalten erkannt werden sollen.

Die Vorteile des Computereinsatzes sind bekannt: Maschinen ermüden nicht, erkennen Muster ohne Erwartungen und verzählen sich nicht. Dennoch ist die Wahl digitaler Methoden als auch die Erstellung oder Auswahl von Korpora (also der Datengrundlage) eine intellektuell anspruchsvolle Aufgabe, die erfahrene WissenschaftlerInnen nach den Anforderungen ihrer Forschungsfragen durchführen sollten. Die Interpretation der Ergebnisse computergestützter Analysen setzt ein breites Verständnis der eingesetzten Methoden voraus und sollte sich auch mit den Grenzen digitaler Methoden auseinandersetzen, sowie die verwendete Datenbasis kritisch hinterfragen.

Digital Humanities findet genau in diesem Spannungsfeld zwischen geisteswissenschaftlichen Fragestellungen, traditionellen Quellen und den Möglichkeiten von digitalen Werkzeugen statt. Dabei wurde schon viel über die erwünschte Ausbildung von digitalen GeisteswissenschaftlerInnen, ihre Arbeitsweise und Schnittstellen zu traditionellen Disziplinfeldern geschrieben.[2]

Dabei gelangen diese Diskussionen zu ganz unterschiedlichen Schlussfolgerungen: So wird teilweise antizipiert, dass bereits alle Geisteswissenschaft digital statt findet und es daher keinen definitorischen Bedarf gibt, andererseits wird von traditionellen Vertretern ihres Fachs eine "feindliche Übernahme"[3] durch die Informatik gewittert, die dazu führt, dass alle hermeneutische geisteswissenschaftliche Arbeitsweise nicht mehr genügt.

Die Autoren dieses Bandes werden diese definitorischen Probleme nicht lösen können. Wir stellen aber fest: Es gibt die Digital Humanities. Im weitesten Sinne handelt es sich dabei um die Beantwortung geisteswissenschaftlicher Fragestellungen mithilfe digitaler Methoden. Der Einsatz von Office Programmen fällt darunter ebenso wenig, wie die Verwendung von Wikis oder E-Mail. Diese Tools unterstützen lediglich die Kommunikation und erleichtern das wissenschafltiche Schreiben.

Es existiert aber eine vielfältige Reihe von Forschungsfragen aus den Geisteswissenschaften, die sich mit Hilfe der Digital Humanities elegant beantworten lassen. Die folgende Liste bietet eine Reihe interessanter Ansätze an, erhebt aber keinen Anspruch auf Vollständigkeit.

Forschungsfragen

Auf die Frage von Gregory Cranes “What do you do with a million books?”[4] antworten Clement et al.

„You don't read them, because you can't“

Clement, Steger und Unsworth, Kirsten Uszkalo: How Not to Read a Million Books, 2008
und bieten im Folgenden zahlreiche Fragen, die sich nur im Massenzugriff auf strukturierte Textdaten beantworten lassen, zum Beispiel "Words that Jane Austen uses less often than other novelists 1780-1830. [5]

Ein Beispiel für eine Methode der Digital Humanities ist das irreführender Weise "distant reading" besser Macroanalyse genannte hier angesprochene Verfahren. Aufgrund der beschränkten Menge von Büchern, die jeder Mensch in seinem Leben lesen kann [6] und der gleichzeitigen Neugier auf die Inhalte vieler weiterer Bücher, ist die einzige Möglichkeit, Informationen aus weiteren Büchern zu verarbeiten, deren automatische, d.h. algorithmische Durchdringung und Aufarbeitung. Dies wird mithilfe zahlreicher Methoden – unter Einsatz verschiedener Software und Algorithmen – bewerkstelligt.

Ein konkretes Beispiel für solche Forschungsprojekte ist die quantitative Textanalyse. Hier wurden beispielsweise im Rahmen der Analyse antiker ägyptischer Totenbücher interessante Ergebnisse erzielt.[7] Auch auf die Stimmungen von Epochen lassen sich solche Analysen anwenden: "Roaring Twenties", "Les Trente Glorieuses" (1945-1975) aber auch "Nach dem Boom" (ab den 1970er Jahren) sind allgemein akzeptierte Charakterisierungen von mit stark positiven oder negativen Emotionen konnotierten Epochen. Diese Muster finden wir auch in den Texten aus diesen Epochen[8].  

Weiterführende Untersuchungen könnten das Verhältnis zwischen Tagespresse und der Belletristik untersuchen: In welcher Textgattung kündigen sich Stimmungsumschwünge früher an? Inwieweit handelt es sich um globale Phänomene, oder zeigen sich je nach Region oder Sprache zeitlich verschobene Stimmungsphasen? Sind deutschsprachige Texte – wie es der Begriff der "German Angst" vermuten ließe – wirklich emotional anders geprägt als englischsprachige? Und falls ja, gibt es Zeiten besonders starker Divergenz oder auch der Konvergenz zwischen diesen beiden Sprachräumen? 

Ähnliche Verfahren lassen sich auf andere Medien übertragen, hier besteht die Möglichkeit durch maschinelle Mustererkennung regelmäßig wiederkehrende Elemente in Bilddateien zu erkennen und miteinander zu vergleichen. 

Zur Frage "How to compare 1 Mio Images?" wurde beispielsweise eine Studie publiziert[9], in der diverse Beispielprojekte aufgeführt werden. Auch die Möglichkeiten der 3D Technologie sind für Disziplinen, welche sich mit Gegenständen im Raum (beispielsweise Kunstgeschichte oder Archäologie) beschäftigen, von großem Interesse. Diese kann man sowohl nutzbar machen, um öffentliche Räume einer Epoche nachzubilden und daraus Schlüsse über gesellschaftliche Belange aus besagter Epoche zu ziehen, aber auch um archäologische Gegenstände zu digitalisieren und auf dieser Datenbasis mithilfe algorithmischer Verfahren maschinelle Musterkennung zu betreiben.[10]

Daneben bieten Methoden der sozialen Netzwerkanalyse interessante Möglichkeiten für verschiedene Geisteswissenschaften, beispielsweise die Geschichtswissenschaften: Hier können Relationen zwischen Personen oder Personengruppen in vergangenen Gesellschaften mithilfe von Methoden der sozialen Netzwerkanalyse untersucht werden.[11]

Beispiel für historische Netzwerkanalyse. Visualisierung tausender Dokumente, die zwischen Völkerbund Experten während der Zeit zwischen den Weltkriegen ausgetauscht wurden. Von Martin Grandjean, Quelle: https://en.wikipedia.org/wiki/Digital_history#/media/File:Social_Network_Analysis_Visualization.png. CC BY-SA 3.0

Weitere Forschungsfragen in den Digital Humanities könnten sein:

  • Was kann ich mit einem Korpus von hunderten Inkunabel-Abbildungen machen? Gemeinsamkeiten und Unterschiede zwischen den abgebildeten Personen messen? Gibt es immer wieder kehrende Personen? In welchen Farbtönen / mit welchen Gegenständen werden diese abgebildet? die Beziehung zwischen Hauptakteuren messbar machen (durch Mustererkennung in Bildern? bzw. Messung des durchschnittlichen Abstandes?)
  • Im Nachlass einer Autorin finden sich hunderte von Gedichten, welche jeweils dutzende unterschiedliche Fassungen haben. Wie lässt sich dieses Werk in einer Edition abbilden? Lassen sich die Fassungen in eine chronolgische Reihenfolge bringen?
  • Bekannte Vertreter einer Epoche sind durch regelmäßige Briefkontakte verbunden. Wie bildet man dieses Netzwerk vollständig ab und wie lässt es sich analysieren?
  • Eine Erzählung erscheint anonym und mehrere bekannte Autoren kämen als VerfasserInnen in Frage. Wie lässt sich die Herkunft korpusbasiert untersuchen?
  • Zahlreiche Texte einer Epoche beziehen sich auf bestimmte geographische Orte. Wie lassen sich die Schnittmengen dieser Bezüge abbilden und analysieren?
  • Welche Implikationen bergen Computerspiele in Hinblick auf die Simulation historischer Gesellschaften?
  • Welche Fragen kann man mit Methoden der künstlichen Intelligenz beantworten? 

Aufbau

Um das Handbuch möglichst praxisnah zu gestalten, haben wir uns entschieden zuerst einzelne DH-Projekte vorzustellen, um die Möglichkeiten der DH den Lesern näher zu bringen und ihnen zu zeigen, was in der Praxis in dem Bereich derzeit schon umgesetzt wurde. So zeigen wir in Kapitel 2 wie mit TextGrid Texte editiert und mit den Tools von eCodicology Handschriften analysiert werden. Die folgenden drei Kapitel beschäftigen sich mit den drei Säulen, die jedes Projekt in den Digital Humanities tragen: Daten, Methoden und Werkzeuge, und Infrastruktur. Die Kapitel bieten erste Einführungen in die jeweilige Thematik und vermitteln den Lesern an die Praxis angelehnte Kenntnisse, die sie in eigenen DH-Projekten anwenden können. Die Kapitel Daten und Alles was Recht ist - Urheberrecht und Lizenzierung von Forschungsdaten weisen in die Daten als Grundlage wissenschaftlichen Forschens ein und bieten Hilfestellungen im Umgang mit Lizenzen und Dateiformaten. Das Kapitel Methoden und Werkzeuge zeigt Methoden der Digital Humanities auf und verweist beispielhaft auf digitale Werkzeuge, die für die Beantwortung geisteswissenschaftlicher Forschungsfragen herangezogen werden können. Im Kapitel Infrastruktur werden Digitale Infrastrukturen, deren Komponenten und Zielstellungen näher beschrieben. Sie sind unerlässlich um die digitale Forschung nachnutzbar und nachhaltig zu gestalten.

Autoren

Alle Autorinnen und Autoren in alphabetischer Reihenfolge:

   Helene Hahn
   Tibor Kalman
   Steffen Pielström
   Johanna Puhl
   Wibke Kolbmann
   Thomas Kollatz
   Markus Neuschäfer
   Sybille Söring
   Juliane Stiller
   Danah Tonne

Folgende Personen haben Interviewbeiträge geliefert:

Anmerkungen

  1. Open Knowledge Foundation Deutschland e.V. - http://okfn.de
  2. https://dev2.dariah.eu/wiki/download/attachments/14651583/DARIAH-M2-3-3_DH-programs_1_1.pdf?version=2&modificationDate=1366904376117
  3. Vgl. http://www.hsozkult.de/conferencereport/id/tagungsberichte-5384
  4. Gregory Crane: What Do You Do with a Million Books?, D-Lib Magazine 12 (2006), http://www.dlib.org/dlib/march06/crane/03crane.html
  5. Tanya Clement, Sara Steger, John Unsworth, Kirsten Uszkalo: How Not to Read a Million Books, 2008, http://people.brandeis.edu/~unsworth/hownot2read.html
  6. Vgl. http://www.bookpedia.de/buecher/Wieviel_kann_ein_Mensch_in_seinem_Leben_lesen%3F
  7. http://totenbuch.awk.nrw.de/projekt/das-totenbuch
  8. http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0059030
  9. http://softwarestudies.com/cultural_analytics/2011.How_To_Compare_One_Million_Images.pdf
  10. http://vpcp.chass.ncsu.edu/, http://romereborn.frischerconsulting.com/gallery-current.php, http://www.forumromanum30.hu-berlin.de/, http://www.educause.edu/ero/article/virtual-paul%E2%80%99s-cross-project-digital-modeling%E2%80%99s-uneasy-approximations.
  11. Lemercier, Claire. “Formale Methoden Der Netzwerkanalyse in Den Geschichtswissenschaften: Warum Und Wie?” In Historische Netzwerkanalyse. Innsbruck: Studien Verlag, n.d.