Protokoll des 1. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 17. November 1973

 

Begrüßung und Einführung

Wilhelm Ott

Zweck dieses 1. Kolloquiums ist die gegenseitige Information
  1. über die in Tübingen vorhandenen Möglichkeiten zur Anwendung der EDV in den Geisteswissenschaften,
  2. über die zur Zeit laufenden Projekte auf diesem Gebiet.
Seit 1969 werden vom ZDV Vorlesungen und Programmierkurse für Geisteswissenschaftler angeboten. Seit 1.9.1970 besteht die Abteilung für Literarische und Dokumentarische Datenverarbeitung (LDDV) am Zentrum für Datenverarbeitung (ZDV) der Universität Tübingen offiziell und umfaßt zur Zeit 4 Mitarbeiter. Die Mitarbeiter stehen zur Beratung für Selbstprogrammierer zur Verfügung, stellen Programme und Programmbausteine für immer wiederkehrende Probleme bereit und entwickeln Lösungen für neue Anwendungsgebiete. Selbstgesetzte Arbeitsschwerpunkte sind dabei:
  1. Lateinische Metrik
  2. Editions- und Satztechnik.
Solche Gebiete sind zu groß, als daß sie an jedem Universitäts-Rechenzentrum ausgebaut sein könnten. Deshalb steht für derartige Arbeiten die Dienstleistung des ZDV auch auswärtigen Benutzern zur Verfügung. Die Verbindung zu Kollegen aus dem Ausland ist über die Anfang 1973 gegründete ALLC (Association for Literary and Linguistic Computing) gewährleistet. (Die Leitung einer "specialist group: Textual Editing Techniques" liegt am ZDV Tübingen). Die Abteilung LDDV ist durch ihre Kontakte zu anderen Instituten in der BRD und durch ihre Mitarbeit in der ALLC in der Lage und bemüht, gleich oder ähnlich gelagerte Projekte zu koordinieren sowie einen um Rat fragenden Benutzer an Fachkollegen mit ähnlichen Problemen zu vermitteln. Um in Tübingen zwischen den mit EDV arbeitenden Geisteswissenschaftlern direkte Kontakte herzustellen, werden diese Kolloquien veranstaltet, auf denen zunächst von Tübinger Projekten, später aber auch von auswärtigen berichtet werden soll.

Da die EDV bisher bei den Geisteswissenschaften im Verhältnis zu Mathematik und Naturwissenschaften noch einen sehr geringen Raum einnimmt, sind die Belange der Geisteswissenschaftler bei der maschinellen Ausrüstung des ZDV noch recht wenig berücksichtigt; so fehlen z.B. Datenerfassungsgeräte für direkte Verarbeitung hand- und maschinengeschriebener Belege, und für die Ausgabe von anderen Zeichen als lateinische Großbuchstaben müssen wir entweder in der Industrie aufgestellte Geräte benutzen oder uns durch "Mißbrauch" des Kurvenschreibers (Calcomp Plotter) notdürftig behelfen. Die Abteilung kann bei diesbezüglichen Wünschen mit mehr Nachdruck auftreten, je mehr Geisteswissenschaftler die Dienste der EDV zuhilfe nehmen.
 

Kurzberichte über einzelne Projekte

Erika Bauer

Edition der Hieronymusbriefe von Heinrich Haller

Vorhaben:
Edition der Werke Heinrich Hallers (tätig 1464-1471), Kartäuser in Schnals (Südtirol), Übersetzer religiöser Prosa (Predigten, Paternoster-Auslegung, Hieronymusbriefe, Imitatio Christi etc.).

Handschriftenlage:
6 Bände Original, zum Hieronymus auch Konzept.

Literatur:
Zuletzt: Erika Bauer: Heinrich Haller, Übersetzungen im "gemeinen Deutsch" (= Litterae 22). Göppingen 1972.

EDV:
Edition des Hieronymus nach Codex Innsbruck UB 773 (227 Blätter): Text fehlerfrei (nach 3 Korrekturgängen); druckfertig für Lichtsatz. Die Abweichungen der Reinschrift vom Konzept mußten wegen der vielen Änderungen (72,8 je 100 Zeilen) von Hand gemacht werden.

Geplant: Wortindex, später Index zum ganzen Corpus.

Bedeutung:
1. Authentischer Text (keine Abschreibfehler)
2. Nutzen für Lexikographie und Sprachgeschichte des 15. Jahrhunderts; Rückläufiger Index für Wortbildungs-Untersuchungen; Untersuchungen der Satzstruktur (zum Teil statistisch).

Für übersetzungstechnisch-stilistische Untersuchungen liegen Listen und Lochkarten mit Doppelausdrücken (3016 mal "und", 223 mal "oder") vor. Für meine Fragestellung tatsächlich brauchbar sind ca. 1700 Karten, von Hand aussortiert. Sie sind noch zu gliedern: nach Wortarten und danach, ob der Doppelausdruck bereits im Lateinischen stand oder erst in der Übersetzung.
 

Albrecht Endriß

Die Prädestinationsschrift des Johann von Staupitz in der Übersetzung von Christoph Scheurl (1517)

Innerhalb des SFB 8 "Spätmittelalter und Reformation", Teilprojekt: Johann von Staupitz: Kritische Edition seiner Predigten, Schriften und Briefe.
Staupitz war Generalvikar der deutschen Kongregation des Augustiner-Eremiten-Ordens, Luthers Ordensvorgesetzter, Beichtvater, Förderer und Vorgänger als Theologieprofessor in Wittenberg.

Aufgabe des Referenten:
Edition der Prädestinationsschrift, die Anfang 1517 von Christoph Scheurl herausgegeben und auch ins Neuhochdeutsche übersetzt wurde. Der lateinische und der frühneuhochdeutsche Text sollen parallel ediert werden.

Problem:
Einrichtung der Texte; nicht diplomatischer Abdruck, sondern Normalisierung (z.B. im Lateinischen: u/v, i/j etc.), im Frühneuhochdeutschen Probleme bei der Interpunktion, Groß- und Klein-, Getrennt- und Zusammenschreibung.

Heranziehung der Datenverarbeitung:
Alphabetische Zusammenstellung des ganzen Wortmaterials, die als Grundlage dient für:

  1. Aufstellung von Regeln für die Normalisierung
  2. Hilfe bei der Kommentierung des Textes (Belegstellen für ein Wort leicht auffindbar)
  3. Hilfe bei der Beurteilung der Qualität der Übersetzung (Konsistenz der Begriffe)
  4. als Abfallprodukte:
    1. Wortzahl des Textes
    2. Breite des Wortschatzes
  5. Häufigkeitsregister: Ausdruck aller Wörter in der Reihenfolge der Häufigkeit ihres Vorkommens im Text.

 

Abraham P. Kustermann

Registerband der Theologischen Quartalschrift

Projektdefinition:
Registerband für ca. 75 Jahrgänge (1895-1970) der Theologischen Quartalschrift (Tübingen); halbautomatisches Verfahren; objektorientierte Methode; 6 Teilregister.

Projektbeschreibung:

  1. Datenerfassung (manuell)
    1. Erfassung der Daten in Manuskriptform nach normativer Arbeitsanweisung (Hilfskräfte).
    2. Prüfung und Korrektur anhand der Quellentexte und Orientierungshilfen in differenzierten Arbeitsgängen (Supervisor und trainierte Hilfskräfte).
  2. Dateneingabe
    1. Ablochen der redigierten Manuskripte auf Flexowriter 2303 (8-Kanal-Lochstreifen). Jeder Jahrgang wird zweimal abgelocht (Schreibkraft)
    2. Einlesen der Lochstreifen und maschineller Vergleich jeweils beider abgelochter Versionen
    3. Ausgabe einer Fehlerliste; Prüfung; Ablochung von Korrekturen und Überspeicherung.
  3. Datenverarbeitung
    Ziel: Magnetband als Datenträger für automatisches Lichtsetzverfahren
    1. Sortierung der Daten nach Programm (FORTRAN) entsprechend dem Charakter der Teilregister
    2. Zuspeicherung der Steuercodes für den Lichtsatz
    3. Testläufe und Ausdruck von Schnelldruckerprotokollen
    4. Prüfung und Ablochung von Korrekturen (Supervisor); Überspeicherung
    5. siehe Zielangabe
    6. Automatische Anfertigung der Satzvorlage; Druck.

 

Hansjürgen Müller-Beck

Speckberg bei Eichstätt (Bayern). Verteilung archäologischer Objekte in Fläche und Straten

Die Grabung am Speckberg 1964-1969 wurde von Anfang an zur Aufarbeitung durch EDV angelegt. Die insgesamt 800 qm wurden nach einem einheitlichen qm-Raster, der bei Bedarf in 1/4 qm unterteilt werden konnte, gegliedert, während die Straten in einen 5cm-Modul geteilt wurden, der je nach Situation zusammengefaßt werden konnte (10cm-, 15cm-, 20cm-Stufen). Durch diese einheitliche Teilung konnten die Objekte auf genormte Kubatureinheiten bezogen werden. Durch diesen Bezug auf eine feste Kubatureinheit wurde die Anfertigung von Einzelkarten vermieden. Statt 300.000 Karten (bei über 300.000 Steinartefakten und Scherben) waren nur 6.000 Karten zu erstellen.

Durch das vom ZDV erarbeitete Programm konnte die Verteilung in einem vereinfachten aber konventionell lesbaren Schema ausgedruckt werden. Für den Archäologen bedeutet das nach 80 Grabungsmonaten (Person/Monat) und 60 Katalogmonaten eine Ersparnis von rund 60 Auswertungsmonaten. In der ersparten Zeit war eine gleichgroße Equipe bereits mit einer Arktisgrabung unter Leitung des Berichterstatters beschäftigt.

Mit Hilfe der Zahlenverteilungen lassen sich sehr gut durch Ablesen von Maxima innerhalb der Tiefenstreuung Artefakthorizonte als Einheiten verfolgen, die durch die miteingearbeiteten Typenschlüssel ("Leitfossilien") zeitlich bestimmt werden können. In der Fläche erscheinen Verhältnisse zwischen Rohprodukten und feiner ausgearbeiteten Artefakten, die deutliche Signifikanzunterschiede für die einzelnen Zeitstufen erkennen lassen. So kommt im Mittelpaläolithikum nur ein Artefakt feiner Ausarbeitung auf 100 Abschläge, im Mesolithikum aber eines auf 10, ein Wert, der sich in den 800 qm mehr als 30 mal sichern läßt und bisher in dieser Deutlichkeit wegen der geringeren Menge der verarbeiteten Zahlen nicht festgestellt werden konnte.

Bei derartigen Arbeiten, die an sich archäologische Routine sind, ist der Einsatz der EDV ein ganz erheblicher Sparfaktor.
 

Hans-Peter Uerpmann

Archivierung und Auswertung des Informationsgehalts von Tierknochenfunden aus archäologischen Zusammenhängen

Bei der Bearbeitung von Tierknochenfunden aus archäologischen Ausgrabungen ergeben sich regelmäßig Schwierigkeiten aus dem Umgang mit großen Datenmengen (erwünschte Mindestgröße eines Komplexes: 10.000 auswertbare Einzelstücke). Der konventionelle Weg der Bearbeitung beinhaltet einen hohen Anteil technischer Arbeit und zahlreiche Fehlerquellen durch falsches Umschreiben oder Rechenfehler beim manuellen oder nicht programmierten maschinellen Rechnen. Der hohe Aufwand bringt es auch mit sich, daß ein Zwischenergebnis im Laufe der Bearbeitung nicht erstellt werden kann.

Bewältigung des Problems:
Der Informationsgehalt der einzelnen Knochenfunde wird als Datensatz auf Lochkarten archiviert. Eine Sicherung der Daten erfolgt durch Übertragung auf eine Magnetbanddatei. Ein allgemeines Sortierprogramm dient der selektiven Erfassung der Datensätze in frei wählbarer Sortierung. Daneben existieren Einzelprogramme für die Auswertung von Einzelinformationen (z.B. für die Häufigkeitsverteilung von Tierarten, Altersgruppen usw.).

Methodik:
Der nicht metrische Informationsgehalt von Tierknochenfunden ist stets eindeutig klassifizierbar, da auch "nicht bestimmbar" eine eindeutige Aussage ist. Die Menge der vorkommenden Ausprägungsmöglichkeiten der nicht metrischen Merkmale ist überschaubar. Es bot sich daher an, den Informationsgehalt über einen Zahlencode zu verschlüsseln. Die Verwendung von Schlüsselzahlen führt im Vergleich zur Textarchivierung zu einer erheblichen Platzersparnis auf dem Datenträger und erleichtert das Programmieren für die Auswertung. Der metrische Informationsgehalt wird ohne Verschlüsselung als Zahlenwert auf den Datenträger geschrieben. Selten auftretende Informationen, die eine Verschlüsselung nicht lohnen, können als Kurztext angegeben werden. Der primären Datenerfassung dient ein vorgedrucktes Blatt, dessen 80 Spalten entsprechend dem Eingabeformat gefeldert sind.

Schwierigkeiten:
Das Ablochen der primären Datenlisten ist angesichts der anfallenden Mengen ein arbeitstechnischer Engpaß. Eine automatische Leseanlage für handgeschriebene Zahlen würde hier eine erhebliche Zeitersparnis bringen. Ungünstig wirkt sich ferner die relative Kleinheit des Tübinger Kernspeichers aus, der die Anzahl der auf einmal bearbeitbaren Datensätze sehr begrenzt. Häufiges Aus- und Einspeichern verlängert die Rechenzeiten und erschwert das Programmieren, insbesondere für Selbstprogrammierer.
 

Hauptreferat: Der Wortindex als Hilfsmittel des Philologen

Paul Sappler

Es wurde über einen Wortindex zu Heinrich Kaufringer berichtet als ein Beispiel dafür, wie die elektronische Datenverarbeitung in Anpassung an die besonderen Bedingungen eines Einzelfalls weniger unter technischem als unter philologischem Gesichtspunkt eingesetzt werden kann. Eine wichtige Eigenart des Index ist seine Zusammengehörigkeit mit einer neuen Ausgabe von Kaufringers Werken (1972); der Index erleichtert nicht nur den Gebrauch der Textausgabe, sondern war schon für die textkritische Arbeit von Nutzen, deren Fortschritten er jeweils angepaßt wurde. Die gemeinsame Herstellung beider wird durch den programmgesteuerten Lichtsatz insofern erleichtert, als er es erlaubt, den die Grundlage des Index bildenden maschinenlesbaren Text wie dann auch den Index ohne Zwischenschaltung des Setzers zu veröffentlichen, und so Korrekturarbeit erspart. Die Brauchbarkeit des Index hängt davon ab, daß seine Herstellung auch verschiedene nicht ohne weiteres mechanisch ausführbare Teilarbeiten umfaßt, bei denen ein rationelles Zusammenwirken des Philologen mit der Maschine möglich sein muß. Dies betrifft vor allem die Lemmatisierung (mit den Problemen der Normalsprache und Homographentrennung), die Einordnung in grammatische Kategorien und die Aussonderung von Wortvorkommen in bestimmten Wendungen.

Ein wichtiger Gesichtspunkt des Reimindex, der sich unter den Beigaben zum eigentlichen Wortindex befindet, ist die Anordnung nach dem Reimtyp, der Zeichenfolge vom Reimvokal ab, welcher per Programm durch Eingehen auf die sprachlichen Eigentümlichkeiten des (nicht normalisierten) Textes ermittelt wird.

(Die hier wiedergegebenen Kurzfassungen wurden von den Referenten zur Verfügung gestellt.)
 

Liste der am ZDV durchgeführten Projekte

 


Zur
Übersicht über die bisherigen Kolloquien

tustep@zdv.uni-tuebingen.de - Stand: 21. November 2003