Aus dem Protokoll des 60. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 12. Februar 1994

 

Fritz Kemmler (Tübingen)

"Laute - Wörter - Sätze - Text":
EDV-gestützte Herstellung eines Lehrbuches für das Alt- und Mittelenglische

Im vorgestellten Projekt geht es um den Einsatz und den Nutzen der EDV bei den vielfältigen Arbeiten, die mit der Herstellung eines Lehrbuches für das Alt- und Mittelenglische verbunden sind. Der Begriff "Herstellung" bezieht sich dabei sowohl auf die Inhalte wie auch auf die Techniken und Probleme des elektronischen Setzens.

Das im Herbst 1994 erscheinende Lehrbuch wird folgende Gliederung haben:

Jeder dieser Teile bringt ganz spezifische satztechnische Probleme mit sich: Die für diese Arbeiten nach und nach erstellten TUSTEP-Programme sind zum einen im Bereich #SATZ angesiedelt, zum anderen im Bereich der eigentlich sprachhistorischen Fragestellungen und Probleme, also im Bereich der Inhalte.

I.

Für die Erfassung und Bearbeitung des Literaturverzeichnisses wurde eine Prozedur in Form eines Benutzermakros zusammengestellt. Dieses dient einerseits der Vermeidung formaler Fehler bei der Eingabe der Daten, andererseits der Plausibilitätsprüfung der Daten; es erlaubt weiterhin eine mit wenig Aufwand verbundene alphabetische Sortierung der Einträge und die Ergänzung der für das Satzprogramm notwendigen Steueranweisungen.

Die tabellarisch angeordneten Konjugations- und Deklinationsparadigmata werden mit dem Satz-Programm für den Druck aufbereitet. Da die in einer solchen Tabelle stehenden Formen unterschiedlich lang sind, ist es nicht ganz einfach, ohne die Hilfe eines formatierenden Editor-Bildschirmes die zur Herstellung einer solchen Tabelle notwendigen Merk- und Positionierungsanweisungen zu definieren. Um in diesem Bereich Doppelbelichtungen zu vermeiden und um die Tabellen auch optisch einigermaßen ansprechend gestalten zu können, werden die Leistungen der Anweisung "&!e" in der Protokoll-Datei eines Satzlaufes systematisch ausgewertet. Zur Umrechnung der in der Protokoll-Datei in Bildlinien angegebenen horizontalen Position in Didot-Punkt (und darauf fußen ja die Merk- und Positionierungsanweisungen) dient ein Benutzermakro, das außerdem im Dialog Informationen zur verwendeten Schriftgröße berücksichtigen kann.

Die im Buch abgedruckten Texte enthalten Erläuterungen zu schwierigen Textstellen in der Form von Fußnoten (jedoch ohne Fußnotenverweisziffer im Text und bei der Fußnote). Ein Programm ermöglicht es, die Fußnoten maschinell mit eindeutigen Verweisen zu versehen, so daß der Benutzer die in den "Fußnoten" stehenden Informationen der spezifischen Stelle im Text eindeutig zuordnen kann. Der Ansatzpunkt dabei ist der in den einzelnen Texten fortlaufende Zeilenzähler; die jeweilige Zeilennummer wird von der Maschine hinter der Fußnotenverweisziffer eingetragen. Bei mehr als 500 solcher "Fußnoten" in den Texten kann es so bei den Verweisen zu keinen Eingabefehlern (Zahlendrehern) kommen.

II.

Bei der Herstellung der Glossare waren zu folgenden Fragen Lösungen zu finden: Für diese arbeitstechnischen Probleme wurden TUSTEP-Programme entwickelt, die befriedigende Ergebnisse liefern.

III.

Auch bei philologischen Fragestellungen im engeren Sinne kann die Maschine Hilfe bieten:

Im Bereich der Syntax (Stichwort "Sätze") werden mit Hilfe eines Programmes bestimmte syntaktische Strukturen in den Texten abgefragt, isoliert und auf verschiedene Zieldateien ausgegeben, die z.B. nur Relativsätze, Temporalsätze usw. enthalten sollen. Das Datenformat der dieser Auswahl zugrunde liegenden Quelldatei sieht folgendermaßen aus:

<SA406#32> Ne žearf šær žonne ænig anforht wesan, že him ær on breostum bereš beacna selest; ac šurh ša rode sceal rice gesecan of eoršwege æghwylc sawl, seo že mid Wealdende wunian ženceš.'<E-R> <SE>
Die Informationen in "< >" vor dem Satz geben Auskunft über die laufende Nummer der syntaktischen Einheit sowie über ihre Länge in Wörtern. Der mitlaufende Wortzähler ermöglicht u.a. auch stilistische Untersuchungen.

Auf dem Gebiet der sprachlichen Merkmale (Stichwort "Laute"), die zur Bestimmung der regionalen Herkunft besonders eines mittelenglischen Textes dienlich sein können, werden zwei Programme eingesetzt, die solche Merkmale im großen und ganzen recht zuverlässig erkennen und für die endgültige philologische Interpretation und Bewertung - und diese Arbeit wird die Maschine wohl nie leisten können - mit einem Kennzeichen versehen (machine-tagging). So ist es mit Hilfe der Maschine durchaus möglich, recht schnell eine erste Orientierung über die regionale Herkunft eines Textes zu bekommen. Das Programm zur Filterung und Markierung regionaler sprachlicher Merkmale kann romanisch/lateinische und skandinavische Lehnwörter in mittelenglischen Texten vorläufig markieren, wie das folgende Beispiel zeigt, dem ein kentischer Text aus der 1. Hälfte des 14. Jahrhunderts zugrunde liegt.

Markierungen durch #KOPIERE:

***Süden?***
@ arisež [1] 66
***Kent?***
***Süden?***
@ arizež [1] 51
Die Zahlen in eckigen Klammern geben die Häufigkeit des Wortes an, die dahinter stehenden Zahlen die Zeilennummer des zugrunde liegenden Textes.

Ergebnisse der Bearbeitung:

Besondere Merkmale des Textes:

  1. Graphien und Wortschatz (40 Markierungen):
  2. Leitformen für die Dialekte (116 Markierungen):


aus: Protokoll des 60. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 12. Februar 1994