DH-Handbuch/Einführung

Aus Handbuch.io

<<<Zurück
Einführung
Inhaltsverzeichnis Weiter>>>
DH in der Praxis


Über dieses Handbuch

Das vorliegende Handbuch ist im Rahmen eines Book Sprints an der Open Knowledge Foundation[1] im August 2015 in Berlin entstanden. Ziel dieses Buchs ist, einen konzentrierten Überblick über das Feld der Digital Humanities (DH) anzubieten. Für Einsteiger und mögliche AntragstellerInnen stellen sich häufig die folgenden Fragen:

  • Was sind die Digital Humanities?
  • Was sind relevante Forschungsfragen?
  • Mithilfe welcher Tools lassen sich fachspezifische, aber auch fächerübergreifende Fragen beantworten?
  • Was müssen Geisteswissenschaftler beim Umgang mit Daten beachten?
  • Wie sehen erfolgreiche Projekte in den Digital Humanities aus?

Neben Lösungswegen und Ressourcen zu typischen Fragen werden auch Projekte und Werkzeuge detailliert vorgestellt, um vorhandene Kenntnisse aufzufrischen und neue Aspekte der Digital Humanities kennenzulernen. Die Nähe zur fachwissenschaftlichen Praxis steht dabei im Vordergrund. Wir hoffen, mit diesem Handbuch auch Einsteigern die Digital Humanities nahebringen zu können und die Neugierde auf digitale Methoden und deren Möglichkeiten für die geisteswissenschaftliche Forschung zu wecken.

Was sind die Digital Humanities?

Bestimmte Forschungsfragen lassen sich durch den Einsatz von Computern besser beantworten als mithilfe konventioneller, nicht-digitaler Methoden der Geisteswissenschaften. Andere geisteswissenschaftliche Fragen lassen sich überhaupt nur bearbeiten, weil es digitale Methoden und Verfahren gibt. Ob digitale Methoden und Verfahren eingesetzt werden sollten, hängt dabei wesentlich von den Forschungsfragen ab, die im Zentrum des geisteswissenschaftlichen Interesses stehen.

So empfiehlt sich der Einsatz digitaler Werkzeuge insbesondere dann, wenn sehr große Datenmengen untersucht, sehr lange Perioden fokussiert, oder feinste Unterschiede zwischen Inhalten erkannt werden sollen.

Die Vorteile des Computereinsatzes sind bekannt: Maschinen ermüden nicht, erkennen Muster ohne Erwartungen und verzählen sich nicht. Dennoch ist die Wahl digitaler Methoden als auch die Erstellung oder Auswahl von Korpora (also der Datengrundlage) eine intellektuell anspruchsvolle Aufgabe, die erfahrene WissenschaftlerInnen nach den Anforderungen ihrer Forschungsfragen durchführen sollten. Die Interpretation der Ergebnisse computergestützter Analysen setzt ein breites Verständnis der eingesetzten Methoden voraus und sollte sich auch mit den Grenzen digitaler Methoden auseinandersetzen, sowie die verwendete Datenbasis kritisch hinterfragen.

Digital Humanities finden genau in diesem Spannungsfeld zwischen geisteswissenschaftlichen Fragestellungen, traditionellen Quellen und den Möglichkeiten von digitalen Werkzeugen statt. Dabei wurde schon viel über die erwünschte Ausbildung von digitalen GeisteswissenschaftlerInnen, ihre Arbeitsweise und Schnittstellen zu traditionellen Disziplinfeldern geschrieben.[2]

Die angesprochenen Diskussionen gelangen zu ganz unterschiedlichen Schlussfolgerungen: So wird teilweise antizipiert, dass bereits alle Geisteswissenschaft digital statt findet und es daher keinen definitorischen Bedarf gibt, andererseits wird von traditionellen Vertretern ihres Fachs eine "feindliche Übernahme"[3] durch die Informatik gewittert, die darin resultiert, dass alle hermeneutische geisteswissenschaftliche Arbeitsweise nicht mehr genügt.

Die Autoren dieses Bandes werden diese definitorischen Probleme nicht lösen können. Wir stellen aber fest: Es gibt die Digital Humanities. Im weitesten Sinne handelt es sich dabei um die Beantwortung geisteswissenschaftlicher Fragestellungen mithilfe digitaler Methoden. Der Einsatz von Office Programmen fällt darunter ebenso wenig, wie die Verwendung von Wikis oder E-Mail. Diese Tools unterstützen lediglich die Kommunikation, erleichtern das wissenschaftliche Schreiben und dienen selbst traditionellen Vertretern des Fachs als alltägliche Werkzeuge.

Es existiert aber eine vielfältige Reihe von Forschungsfragen aus den Geisteswissenschaften, die sich mit Hilfe der Digital Humanities elegant beantworten lassen. Die folgende Liste bietet eine Reihe interessanter Ansätze an, erhebt aber keinen Anspruch auf Vollständigkeit.

Forschungsfragen

Auf die Frage von Gregory Crane “What do you do with a million books?”[4] antworten Clement et al.

„You don't read them, because you can't“

Clement, Steger und Unsworth, Kirsten Uszkalo: How Not to Read a Million Books, 2008
und bieten im Folgenden zahlreiche Fragen, die sich nur im Massenzugriff auf strukturierte Textdaten beantworten lassen, zum Beispiel

„Words that Jane Austen uses less often than other novelists 1780-1830.“

Clement, Steger und Unsworth, Kirsten Uszkalo: How Not to Read a Million Books, 2008, http://people.brandeis.edu/~unsworth/hownot2read.html
Ein Beispiel für eine Methode der Digital Humanities ist das irreführender Weise "distant reading" – besser Makroanalyse[5] – genannte Verfahren. Aufgrund der beschränkten Menge von Büchern, die jeder Mensch in seinem Leben lesen kann [6] und der gleichzeitigen Neugier auf die Inhalte vieler weiterer Bücher, ist die einzige Möglichkeit, Informationen aus weiteren Büchern zu verarbeiten, deren automatische, d.h. algorithmische Durchdringung und Aufarbeitung. Dies wird mithilfe zahlreicher Methoden – unter Einsatz verschiedener Software und Algorithmen – bewerkstelligt.

Ein konkretes Beispiel für solche Forschungsprojekte ist die quantitative Textanalyse. Hier wurden beispielsweise im Rahmen der Analyse antiker ägyptischer Totenbücher interessante Ergebnisse erzielt.[7] Auch auf die Stimmungen von Epochen lassen sich solche Analysen anwenden: "Roaring Twenties", "Les Trente Glorieuses" (1945-1975) aber auch "Nach dem Boom" (ab den 1970er Jahren) sind allgemein akzeptierte Charakterisierungen von mit stark positiven oder negativen Emotionen besetzten Epochen. Diese Muster finden wir auch in den Texten aus diesen Epochen[8].  

Weiterführende Untersuchungen könnten das Verhältnis zwischen Tagespresse und der Belletristik untersuchen: In welcher Textgattung kündigen sich Stimmungsumschwünge früher an? Inwieweit handelt es sich um globale Phänomene, oder zeigen sich je nach Region oder Sprache zeitlich verschobene Stimmungsphasen? Sind deutschsprachige Texte – wie es der Begriff der "German Angst" vermuten ließe – wirklich emotional anders geprägt als englischsprachige? Und falls ja, gibt es Zeiten besonders starker Divergenz oder auch der Konvergenz zwischen diesen beiden Sprachräumen? 

Ähnliche Verfahren lassen sich auf andere Medien übertragen, hier besteht die Möglichkeit durch maschinelle Mustererkennung regelmäßig wiederkehrende Elemente in Bilddateien zu erkennen und miteinander zu vergleichen. 

Zur Frage "How to compare 1 Mio Images?" wurde beispielsweise eine Studie publiziert[9], in der diverse Projekte aufgeführt werden. Auch die Möglichkeiten der 3D Technologie sind für Disziplinen, welche sich mit Gegenständen im Raum (beispielsweise Kunstgeschichte oder Archäologie) beschäftigen, von großem Interesse. Diese kann man sowohl nutzbar machen, um öffentliche Räume einer Epoche nachzubilden und daraus Schlüsse über gesellschaftliche Belange aus besagter Epoche zu ziehen, aber auch um archäologische Gegenstände zu digitalisieren und auf dieser Datenbasis mithilfe algorithmischer Verfahren maschinelle Musterkennung zu betreiben.[10]

Daneben bieten Methoden der sozialen Netzwerkanalyse interessante Möglichkeiten für verschiedene Geisteswissenschaften, beispielsweise die Geschichtswissenschaften: Hier können Relationen zwischen Personen oder Personengruppen in vergangenen Gesellschaften mithilfe von Methoden der sozialen Netzwerkanalyse untersucht werden.[11]

Beispiel für historische Netzwerkanalyse. Visualisierung tausender Dokumente, die zwischen Völkerbund Experten während der Zeit zwischen den Weltkriegen ausgetauscht wurden. Von Martin Grandjean, Quelle: https://en.wikipedia.org/wiki/Digital_history#/media/File:Social_Network_Analysis_Visualization.png. CC BY-SA 3.0

Weitere Forschungsfragen, die mit Methoden der Digital Humanities beantwortet werden könnten:

  • Was kann man mit einem Korpus von hunderten Inkunabel-Abbildungen machen? Gemeinsamkeiten und Unterschiede zwischen den abgebildeten Personen messen? Gibt es immer wieder kehrende Personen? In welchen Farbtönen / mit welchen Gegenständen werden diese abgebildet? die Beziehung zwischen Hauptakteuren messbar machen (durch Mustererkennung in Bildern? bzw. Messung des durchschnittlichen Abstandes?)
  • Im Nachlass einer Autorin finden sich hunderte von Gedichten, welche jeweils dutzende unterschiedliche Fassungen haben. Wie lässt sich dieses Werk in einer Edition abbilden? Lassen sich die Fassungen in eine chronologische Reihenfolge bringen?
  • Bekannte Vertreter einer Epoche sind durch regelmäßige Briefkontakte verbunden. Wie bildet man dieses Netzwerk vollständig ab und wie lässt es sich analysieren?
  • Eine Erzählung erscheint anonym und mehrere bekannte Autoren kämen als VerfasserInnen in Frage. Wie lässt sich die Herkunft korpusbasiert untersuchen?
  • Zahlreiche Texte einer Epoche beziehen sich auf bestimmte geographische Orte. Wie lassen sich die Schnittmengen dieser Bezüge abbilden und analysieren?
  • Welche Implikationen bergen Computerspiele in Hinblick auf die Simulation historischer Gesellschaften?
  • Welche Fragen kann man mit Methoden der künstlichen Intelligenz beantworten? 

Aufbau des Handbuchs

Um das Handbuch möglichst praxisnah zu gestalten, haben wir uns entschieden, zuerst einzelne DH-Projekte vorzustellen, um die Möglichkeiten der DH den Lesern näher zu bringen und ihnen zu zeigen, was in der Praxis in dem Bereich derzeit schon umgesetzt wurde. So zeigen wir in Kapitel 2, wie mit TextGrid Texte editiert und mit den Tools von eCodicology Handschriften analysiert werden. Die folgenden drei Kapitel beschäftigen sich mit den drei Säulen, die jedes Projekt in den Digital Humanities tragen: Daten, Methoden und Werkzeuge, und Infrastruktur. Die Kapitel bieten erste Einführungen in die jeweilige Thematik und vermitteln den Lesern an die Praxis angelehnte Kenntnisse, die sie in eigenen DH-Projekten anwenden können. Die Kapitel Daten und Alles was Recht ist - Urheberrecht und Lizenzierung von Forschungsdaten weisen in die Daten als Grundlage wissenschaftlichen Forschens ein und bieten Hilfestellungen im Umgang mit Lizenzen und Dateiformaten. Das Kapitel Methoden und Werkzeuge zeigt Methoden der Digital Humanities auf und verweist beispielhaft auf digitale Werkzeuge, die für die Beantwortung geisteswissenschaftlicher Forschungsfragen herangezogen werden können. Im Kapitel Infrastruktur werden Digitale Infrastrukturen, deren Komponenten und Zielstellungen näher beschrieben. Sie sind unerlässlich, um die digitale Forschung nachnutzbar und nachhaltig zu gestalten.

Autoren

Alle Autorinnen und Autoren in alphabetischer Reihenfolge:

   Helene Hahn
   Tibor Kalman
   Steffen Pielström
   Johanna Puhl
   Wibke Kolbmann
   Thomas Kollatz
   Markus Neuschäfer
   Juliane Stiller
   Danah Tonne

Folgende Personen sind mit Interviewbeiträgen vertreten:

   Anne Baillot
   Peter Bell
   Daniel Burckhardt
   Hannah Busch
   Matthias Kiesselbach
   Christoph Kümmel
   Thomas Kollatz
   Andrea Rapp
   Patrick Sahle

Links und Literatur

Eine annotierte Bibliografie zu den Digital Humanities wird fortlaufend in DARIAH-DE geführt: Doing Digital Humanities https://de.dariah.eu/bibliographie

Einführungen in die Digitalen Geisteswissenschaften / Digital Humanities gibt es reichlich, hier eine (kleine) Auswahl:

Johanna Drucker. 2014. Intro to Digital Humanities. Concepts, Methods, and Tutorials for Students and Instructors. Online course book: http://dh101.humanities.ucla.edu/

Willard McCarty. 2005. Humanities Computing. Basingstoke & New York: Palgrave Macmillan. http://www.mccarty.org.uk/essays/McCarty,%20Humanities%20computing.pdf

Ray Siemens, John Unsworth, and Susan Schreibman. 2004. A Companion to Digital Humanities. Blackwell Companions to Literature and Culture. http://www.digitalhumanities.org/companion/

Susanne Kurz. 2014. Digital Humanities: Grundlagen und Technologien für die Praxis. Springer. ISBN: 978-3658057923

Forschungsdaten sind z.B. unter den folgenden Quellen zu finden:

https://www.openaire.eu/search/find

Anmerkungen

  1. Open Knowledge Foundation Deutschland e.V. - http://okfn.de
  2. https://dev2.dariah.eu/wiki/download/attachments/14651583/DARIAH-M2-3-3_DH-programs_1_1.pdf?version=2&modificationDate=1366904376117
  3. Vgl. http://www.hsozkult.de/conferencereport/id/tagungsberichte-5384
  4. Gregory Crane: What Do You Do with a Million Books?, D-Lib Magazine 12 (2006), http://www.dlib.org/dlib/march06/crane/03crane.html
  5. Jockers, Matthew L.: Macroanalysis: Digital Methods and Literary History (University of Illinois Press, 2013)
  6. Vgl. http://www.bookpedia.de/buecher/Wieviel_kann_ein_Mensch_in_seinem_Leben_lesen%3F
  7. http://totenbuch.awk.nrw.de/projekt/das-totenbuch
  8. http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0059030
  9. http://softwarestudies.com/cultural_analytics/2011.How_To_Compare_One_Million_Images.pdf
  10. http://vpcp.chass.ncsu.edu/, http://romereborn.frischerconsulting.com/gallery-current.php, http://www.forumromanum30.hu-berlin.de/, http://www.educause.edu/ero/article/virtual-paul%E2%80%99s-cross-project-digital-modeling%E2%80%99s-uneasy-approximations.
  11. Lemercier, Claire. “Formale Methoden Der Netzwerkanalyse in Den Geschichtswissenschaften: Warum Und Wie?” In Historische Netzwerkanalyse. Innsbruck: Studien Verlag, n.d.