DHd 2018 – Workshops

Die DHd 2018 ist vorbei – was bleibt, sind die vielseitigen Erfahrungen und neuen Ideen, die dort entstanden sind. Besonders die diversen Workshops der ersten beiden Konferenztage sorgten für praxisnahe Erkenntnisse und ermöglichten einen regen Austausch unter den Teilnehmern1.

Überblick

Schwerpunktmäßig erreichte man mit dem Besuchen von Workshops in erster Linie…

…ein Erlernen von Methoden / Arbeiten mit einer bestimmten Software

  • Automatic Text Recognition: Mit Transkribus Texterkennung trainieren und anwenden [Workshop 1]
  • CorpusExplorer v2.0 – Seminartauglich in einem halben Tag [Workshop 2]
  • Maschinelles Lernen lernen – ein CRETA-Hackatorial zur reflektierten automatischen Textanalyse [Workshop 3]
  • Modellathon „Digitale 3D-Rekonstruktionen“ [Workshop 4]
  • Workshop eComparatio: Textvergleich und digitaler Apparat [Workshop 7]
  • Digitale Sammlungserschließung mit WissKI und CIDOC CRM [Workshop 8]
  • Annotation and beyond – Using ATHEN Annotation and Text Highlighting Environment [Workshop 10]

…die Aneignung theoretischer Grundlagenkenntnisse

  • Rechtsfragen in DH-Projekten: Alles, was man wissen muss [Workshop 5]
  • Embedded Humanities [Workshop 9]
  • Nutzerunterstützung und neueste Entwicklungen in Forschungsdatenrepositorien für audiovisuelle (Sprach-)Daten [Workshop 12]
  • Audio Mining für die Geistes- und Kulturwissenschaften: Nutzungsszenarien und Herausforderungen [Workshop 13]
  • Wikidata: Nutzungsmöglichkeiten und Anwendungbeispiele für den Bereich Digital Cultural Heritage [Workshop 15]
  • Reisewege in Raum und Zeit [Workshop 17]

…den Aufbau neuer Strukturen in den DH

…eine Hinterfragung und Besprechung existierender Konzepte

  • Suche und Visualisierung von Annotationen historischer Korpora mit ANNIS. Kritik der korpuslinguistischen Analysemethoden in einem erweiterten Nutzungskontext [Workshop 6]
  • Zur Zukunft der Digitalen Briefedition – kooperative Lösungen im kulturwissenschaftlichen Forschungsdatenmanagement [Workshop 14]
  • Digitale Bildrepositorien – wirkliche Arbeitserleichterung oder zeitraubend? [Workshop 16]

Einblicke

Maschinelles Lernen lernen – ein CRETA-Hackatorial zur reflektierten automatischen Textanalyse [Workshop 3]

Foto 26.02.18, 13 52 59 (1)

CRETA – das ist das „Centrum für reflektierte Textanalyse“ der Universität Stuttgart. Ein Hackatorial stelle eine Kombination aus „Hackathon“ (ein Neologismus, der sich insbesondere im informationstechnischen und kollaborativen Kontext bereits weitestgehend durchgesetzt hat, kommt von „Hacken“ für das Schreiben eines Codes und „Marathon“ für die kompetitive Art des Arbeitens) und Tutorial dar, so die Organisatoren des entsprechenden Workshops, die vom Institut für Maschinelle Sprachverarbeitung und vom Institut für Literaturwissenschaft Stuttgart nach Köln zur 5. Jahrestagung der Digitalen Geisteswissenschaften im deutschsprachigen Raum angereist sind.

Nils Reiter und Nora Ketschik eröffnen den Workshop und führen Schritt für Schritt in die automatische Textanalyse ein. Dabei gehen sie insbesondere auf die Grundlagen des Maschinellen Lernens sowie den Bezug zu den Digital Humanties ein, sie erklären kurz die Funktionsweise von Lernalgorithmen wie Entscheidungsbäumen und Naive Bayes, und sprechen auch Verfahren wie das der Kreuzvalidierung („cross validation“) an. Bevor es dann ans „Hacken“ gehen kann, stellt Sarah Schulz den Workshopteilnehmern noch die Kopora vor, mit denen gleich in Teams gearbeitet werden soll. Sie geht auf die spezifische Annotation der einzelnen Texte ein und beschreibt nicht nur, welche Entitäten in den drei zur Wahl stehenden Korpora enthalten sind, sondern gleichermaßen auch NLP-Verfahren wie NER (Named Entity Recognition) oder KR (Koreferenzresolution), mit welchen die Texte automatisch annotiert wurden.

Auf Basis des nun angeeigneten Wissens über Machine Learning allgemein wie auch die einzelnen Korpora, mit denen gearbeitet werden soll, dürfen die Teilnehmer jetzt Teams bilden und aktiv werden. Dabei ist es den Organisatoren vor allem wichtig, dass es sich um ein realistisches Übungsszenario handelt. Mit Unterstützung des CRETA-Teams bearbeiten die Teilnehmer die vorliegenden Python-Scripte so, dass sie auf den Trainingsdatensätzen ein möglichst gutes Ergebnis erzielen. Ob solche guten Ergebnisse dann auch bei Anwendung auf die Testdaten entstehen, bleibt Teilnehmern wie Organisatoren weitestgehend unklar, aber genau darum gehe es, betonen letztere. Bei erfolgreichem Ausstechen der gegenerischen Teams winkt außerdem eine Digital Humanities-Pflichtlektüre als Preis. Das spornt an und bei der Verkündung der Ergebnisse sind alle sehr gespannt. Man merkt aber auch, dass unter den Teilnehmern ein großes Interesse daran besteht, etwas aus dem Workshop zu lernen und mitzunehmen. Es wird viel nachgefragt. Wie hat dieser Teilnehmer ein so gutes Ergebnis erzielt? Was passiert, wenn ich die Trainingsdaten eines Korpus auf die Testdaten eines ganz anderen Korpus anwende? Welcher Wert ist wirklich ausschlaggebend? Ist Recall wichtiger als Precision? Klar wird, dass es vor allem um das eigene Ausprobieren und Herumexperimentieren geht, nur so kann man ein Verständnis für das Machine Learning sowie die unterschiedlichen Funktionsweisen der Algorithmen und Verfahren lernen.

Weitere Informationen zum Workshop und zu Creta allgemein gibt es hier.

Research Software Engineering und Digital Humanities. Reflexion, Kartierung, Organisation. [Workshop 11]

„Der hier vorgeschlagene Workshop versteht sich als eine erste Maßnahme, in den Digital Humanities im deutschsprachigen Raum einen kritischen Reflexionsprozess zum Thema ‚Nachhaltige Softwareentwicklung‘ anzustoßen und durch die Etablierung einer gemeinsamen Diskussionsplattform ein stärkeres Bewusstsein für diesen zentralen, aber vernachlässigten Baustein guter Digital Humanities Forschung zu wecken.“
(DHd 2018 Book of Abstracts)

Dass die Organisatoren – Torsten Schrade (Akademie der Wissenschaften und der Literatur Mainz), Alexander Czmiel (Berlin-Brandenburgische Akademie der Wissenschaften) und Stephan Druskat (Humboldt-Universität zu Berlin) – mit ihrem Workshop tatsächlich eine sehr wichtige Problematik ansprechen, zeigt sich bereits in dem großen Anklang, den der Workshop unter den Konferenzteilnehmern findet – 105 Anmeldungen gab es.

Im ersten Teil der Veranstaltung soll eine gemeinsame Grundlage geschaffen werden. Wer sind diese 105 Teilnehmer, die sich für RSE (Research Software Engineering) interessieren? Was bedeutet RSE vor dem Hintergrund der Digital Humanities? Und warum brauchen wir überhaupt eine AG DH-RSE? Um einen Überblick über das so heterogene Publikum des Workshops zu erhalten, führten die Organisatoren bereits vorab eine Umfrage mit eben diesem durch, es gab eine vergleichsweise hohe Beteiligung von über 40 Prozent. Neben der fachlichen Einordnung des Publikums spielten auch Fragen nach verwendeter Software und persönlichen Einstellungen zur Software in den DH in der Untersuchung eine Rolle.

Foto 27.02.18, 09 32 04 (1)

Für die Workshop-Keynote konnte das DH-RSE-Team Stephan Janosch vom Max Planck Institute of Molecular Cell Biology and Genetics gewinnen. Er „gründete […] gemeinsam mit weiteren Aktiven das deutsch(sprachig)e Chapter der RSE-Assoziation: de-RSE“ (dh-rse.github.io) und setzt sich darin u.a. für eine stärkere Thematisierung des Research Software Engineering im deutschsprachigen Raum ein. Einleitend zeigt der Mitinitiator der de-RSE die vielen Bereiche der Digital Humanties auf, in denen Forschungssoftware eine Rolle spielt, wenn nicht sogar die Grundlage bildet. Dann hinterfragt er aktuelle Vorgehensweisen in Bezug auf die Nutzung und den Umgang mit Forschungssoftware: Was läuft gut, wo müssen wir uns vielleicht noch verbessern? Natürlich stellt Janosch auch die Gemeinschaft für Forschungssoftware an sich vor, erzählt von Team, Tätigkeiten und Forschungsschwerpunkten. Der Software Engineer, der aus dem naturwissenschaftlichen Bereich kommt, bestärkt die digitalen Geisteswissenschaftler darin, sich über die fachlichen Grenzen hinweg auch im interdisziplinären Rahmen auszutauschen, Gemeinsamkeiten und Problemlösungen zu finden.

Hier geht es zu den Vortragsfolien.

Im zweiten Teil des Workshops wird die große Teilnehmergruppe in kleinere Breakout Groups aufgeteilt – diese beschäftigen sich mit den verschiedensten Unterthemen der Softwareentwicklung in den Digital Humanities:

  1. Softwarenachhaltigkeit: Gemeinsame und unterschiedliche Definitionen aus Sicht verschiedener Institutionen
  2. Institutionelle Kulturen und Workflows der Softwareentwicklung: Gemeinsamkeiten und Unterschiede
  3. Aktuelle Situation der Softwareentwicklung in den digitalen Geisteswissenschaften
  4. Was kann eine AG DH-RSE in der DHd leisten?
  5. Ausbildung, Training, Software Carpentry: Situation, Fallbeispiele und Initiativen
  6. Best Practices der wissenschaftlichen Softwareentwicklung: Bestandsaufnahme und Vergleich
  7. Infrastruktur: Welche institutionsübergreifenden Infrastrukturen brauchen wir für eine professionelle Softwareentwicklung in den digitalen Geisteswissenschaften?
  8. AG DH-RSE: Struktur, Infrastruktur, Workflows
  9. (DH-)RSEs: Situation, Anerkennung, Karriere
  10. Softwaredokumentation: Stellenwert, Praxis, Infrastruktur
  11. Softwareentwicklung als wissenschaftliche Leistung: Situation, Anerkennung, Workflows

In diesen kleinen Gruppen kommen (wie die Umfrage es bereits andeutete) Menschen mit unterschiedlichen fachlichen Hintergründen zusammen und diskutieren gemeinsam eines der möglichen Themenfelder, mit denen sich die AG DH-RSE zukünftig beschäftigen soll. So wird das jeweilige Diskussionsthema aus den verschiedensten Perspektiven betrachtet und den Teilnehmern wird anhand eigener Erfahrungen und gemeinsamer Ideenfindung nochmals klar, wie wichtig es ist, über dieses in den DH bislang etwas zu kurz gekommene Thema zu sprechen. Nach anregenden Diskussionen soll aber auch etwas Handfestes entstehen: es werden „Lightning Talks“ vorbereitet und Blogposts über die Ergebnisse der individuellen Zusammenkünfte sollen entstehen. In einem Wrap-Up wird im Anschluss an die Breakout-Groups noch einmal alles zusammengetragen, man erfährt, zu welchem Schluss die anderen Gruppen gekommen sind. Letzten Endes bleibt den Organisatoren nur noch eines zu sagen: Involviert euch! Schreibt euch auf die Mailingliste!

Mehr zum Workshop und zur neu gegründeten AG DH-RSE erfährt man unter anderem auf den Seiten der DH-RSE und de-RSE.

Hinweise:

1. Aus Gründen der leichteren Lesbarkeit wird in diesem Beitrag auf eine Abweichung der männlichen Sprachform bei personenbezogenen Substantiven und Pronomen verzichtet. Dies soll keine geschlechterspezifische Bevorzugung oder -nachteiligung implizieren.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s