Aus dem Protokoll des 67. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 6. Juli 1996

 

Walter Röll (Trier)

Die sprachgeschichtliche Erschließung der ältesten hebräisch-jiddischen Glossare zum Buch "Iob" und ihre Edition in Original und Transkription

Die Überlieferung von Texten in der Volkssprache der deutschen Juden, dem Jiddischen, setzt erst im späten 15. Jahrhundert in nennenswertem Umfang ein. Es ist jedoch eine ältere Quellengruppe vorhanden, die bisher ganz stiefmütterlich behandelt worden ist: die Handschriften mit hebräisch-jiddischen Glossaren. Eine bedeutende Schwierigkeit bei ihrer Auswertung besteht darin, daß wir keine Grammatik und kein Wörterbuch des älteren Jiddischen haben.

Das einfachste, direkteste Hilfsmittel beim Studium der heiligen Schrift im hebräischen Original ist ein den Text begleitendes Glossar. Seit dem Ende des 14. Jahrhunderts sind zweisprachige Bibelglossare bezeugt, die am Text entlang jiddische Interpretamente bieten, z.T. Wörter, z.T. Satzteile oder auch Teilsätze; vielfach handelt es sich nicht um plane Übersetzung, sondern um Ausdeutung. Im Rahmen eines DFG-Projekts haben Gabriele Brünnel, Liliane Gehlen und ich 1991 in Trier begonnen, alle "Iob"-Glossare bis zum ersten Druck von 1604 einschließlich zusammen darzustellen; Maria Fuchs, Heidi Stern-Schulze, Carla Winter u.a. sind hinzugekommen. Die älteste Schicht von ca. 1390 bis ca. 1430 umfaßt vier Handschriften, die "Iob"-Glossen enthalten, mit allein rund 8400 Glossen zum "Iob". Hinzu kommen fünf jüngere und der Druck. Es waren also zehn Überlieferungsträger von großer äußerer wie innerer Unterschiedlichkeit zu studieren und gemeinsam darzustellen.

Die Edition, an der wir arbeiten, enthält jeweils nach dem hebräischen Bibelvers und dessen deutscher Übersetzung alle maschinell gezählten hebräischen Lemmata, die jiddisch glossiert sind. Die jiddischen Glossen sind mit Hilfe des hebräischen Alphabets und zumindest teilweise mit Hilfe der Verschriftungsregeln des Hebräischen geschrieben. Auf jedes Lemma folgen daher eine Transkription der jiddischen Glossen in Lateinschrift und die Wiedergabe in der Originalschrift. Eine erste Aufgabe für den Rechner war eine Prozedur, die die transkribierten Glossen verdoppelt und dann eine der beiden identischen Zeichenfolgen in die Originalschrift überführt; auf diese Weise muß der Text nur einmal eingegeben werden. (Über diesen Arbeitsschritt bei einem unpunktierten jiddischen Fließtext haben Andrea RAPP und Ursula BECKER in Literary and Linguistic Computing 7 [1992] 144-147 berichtet: Automatische Transformation von Graphiesystemen bei der Edition und Erschließung jiddischer Literatur des 14.-16. Jahrhunderts.) Das war auch mit TUSTEP keine einfache Aufgabe, zumal zahlreiche neue Zeichen erst im Laufe der Zeit geschaffen wurden. Hinzu kam, daß die ursprüngliche Anlage der Prozedur im Laufe der Zeit immer verworrener und klauselreicher wurde - bei neuen Zeichen gab es wundersame Neuschöpfungen an ungeahnten Stellen. Es wurde daher eine neue Umformungsstrategie entworfen, die sich jetzt seit längerer Zeit trotz neuer Anforderungen als fehlerfrei erwiesen hat. Um eine ungefähre Vorstellung vom Umfang der Prozedur zu geben, sei ein Element genannt: Wir unterscheiden etwa 70 Vokal-Akzent-Kombinationen, die zudem fast alle am Wortanfang anders umzusetzen sind als im Wortinnern.

Selbstverständlich muß die Ausgangsdatei weiterhin Arbeitsdatei bleiben, d.h. die genannte Prozedur wird vor jedem Ausdrucken jeweils durchlaufen. Andernfalls müßten alle im Laufe der weiteren Bearbeitung anfallenden Korrekturen doppelt und zwar in zwei Schriften ausgeführt werden - eine große unnötige Fehlerquelle.

Für die Eingabe der Daten in den Rechner ist bei allen lateinschriftlichen Programmen die Linksbündigkeit und Rechtsläufigkeit vorgegeben. Unsere ersten Überlegungen gingen daher auch ganz selbstverständlich und unreflektiert davon aus, daß die Ausgabe ja eine lateinschriftliche sei, in der die Glossen elektronisch in hebräischer Schrift erzeugt würden. Nun werden sich Benutzerinnen und Benutzer - was ein Wunder - in einer solchen Edition hierarchisch orientieren: Zuerst geht es um die Verszahl und den hebräischen Bibelvers, dann um die Lemmata, dann erst um die Glossen zu diesem Lemma - oder auch umgekehrt. Das bedeutet bei rechtsläufiger Anlage: Ist der hebräische Bibelvers kurz, kommt die Verszahl bei diesem linksläufigen Element links zu stehen, am besten linksbündig, während der hebräische Text nach Rechtsbündigkeit verlangt. Ist der Bibelvers länger als eine Zeile, müßte die Verszahl inmitten des rechtsbündigen Textes in der ersten Zeile linksbündig stehen. Von technischen Umsetzungsfragen abgesehen: Das ist offenkundig Unfug. Also muß die Verszahl rechts vor den linksläufigen Bibeltext. Dann ist aber das oberste Gliederungsmerkmal rechts, und es wäre ein merkwürdiger Sprung für die Benutzerin oder den Benutzer von der Verszahl rechts zur Angabe des hebräischen Lemmas links, und dieses Lemma verlangt von seiner Schreibform her sowieso ebenfalls nach Rechtsbündigkeit, gleich den Glossen in hebräischer Schrift im übrigen. Das Ergebnis ist daher gewesen: Um in der Arbeitsdatei die Übersicht zu erhalten, geben wir alles so ein, als sei Linksbündigkeit und Rechtsläufigkeit normal. Die Verszahl und der Glossarname stehen also jeweils am Datensatzanfang statt rechtsbündig am Satzende. Vor dem Ausdrucken lassen wir vom Rechner aber fast alles umdrehen, bis auf die deutsche Übersetzung des Bibeltextes, Blattangaben und den Teil mit Erläuterungen am Fuß der Seite ist im Ausdruck also alles "logisch" rechtsbündig.

Daß der Teufel im Detail steckt, sei an einem Beispiel vorgeführt. Im Hebräischen sind eng zusammengehörige Wörter oft durch einen Bindestrich miteinander verbunden, andererseits kennt das Hebräische keine Worttrennung. Die Vermeidung der Worttrennung läßt sich mit TUSTEP einfach umsetzen, weil man die Silbentrennung gezielt für einzelne Schriften ausschalten kann. Leider zeigte sich, daß bei Bindestrichen trotzdem eine neue Zeile begonnen wurde - was wir dann durch Einsetzen einer zusätzlichen Kodierung verhindern konnten.

Ein erster großer Schritt am Anfang der Arbeit mit dem Rechner war die Bereitstellung des hebräischen Bibeltextes. Er lag in Apple-Form vor. Wir haben ihn in ASCII- und weiter in TUSTEP-Code überführt und dadurch viel Arbeit gegenüber einer neuen Eingabe des Textes gespart.

Eine andere Eigenheit unserer Edition ist, daß bis zu zehn Quellen eine oder mehrere jiddische Angaben zu ein und demselben hebräischen Lemma haben können. Diese Angaben zum jeweils gleichen Lemma sollen in der Datei untereinander stehen und zwar jeweils in der gleichen Reihenfolge und der gleichen Form. Wir haben den Rechner daher zunächst in einer Datei, die nur den hebräischen Bibeltext enthielt, hinter jedem hebräischen Bibelvers 31 Datensätze erzeugen lassen: einen mit der Kodierung für die deutsche Übersetzung des Verses und dahinter drei "Formulare", bestehend aus Datensätzen mit der Kodierung für ein hebräisches Lemma und den Kodierungen für alle Glossare. Waren mehr als drei Lemmata in einem Vers glossiert, konnten solche Formulare problemlos hinzukopiert werden. Auf diese Weise ist viel an Routine-Eingabearbeit eingespart worden, und Fehler in der Reihenfolge der Glossare wurden vermieden.

Nun konnte die Eingabe der transkribierten Glossen beginnen. Der wichtigste Gesichtspunkt bei der Bestimmung der Reihenfolge war, daß TUSTEP es ermöglicht, bei Bedarf die Reihenfolge der Zeilen (durch Zusammenlegen pro Lemma) zu ändern. Dies wurde später auch in Anspruch genommen.

Die punktierten Glossen müssen mit sehr vielen Kodierungen für Diakritika in den Rechner eingegeben werden, darunter auch vielen (fast) regelmäßig auftretenden. Wir haben zunächst nur die drei punktierten Glossare bearbeitet und dabei auf die Eingabe solcher Zeichen verzichtet. Nach Abschluß dieses Arbeitsschritts haben wir den regelmäßig auftretenden Teil der Diakritika maschinell hinzufügen lassen.

Nachdem alle Glossare transkribiert und in den Rechner eingegeben waren, kam eine die Übersichtlichkeit der Datei steigernde Prozedur. Vielfach waren ja von den 31 Zeilen bei einem Lemma nur wenige gebraucht worden, jetzt wurden per Knopfdruck alle "leeren" Datensätze getilgt.

Für die Ausgabe der Eintragungen zu Korrekturzwecken stand uns anfangs nur ein Nadeldrucker zur Verfügung. Dies erwies sich als großer Vorteil. Die hebräischen Zeichen auf dem Nadeldrucker sind zwar zum Teil ärgerlich schlecht zu unterscheiden, aber das Schriftbild ist im ganzen sehr viel anders als auf dem Laserdrucker. Die Korrektur zuerst mit dem einen Schriftbild, später mit dem anderen bietet daher zusätzliche Sicherheit.

Wenn ich bisher von Transkribieren gesprochen habe, so war damit eine vorläufige Übertragung nach bestem Wissen und Gewissen gemeint. Jedes Glossar wurde zunächst für sich bearbeitet. Auch die Schreibgewohnheiten in einer Handschrift wurden ja erst mit der Zeit verständlicher. Es handelte sich mit anderen Worten zunächst um eine vorläufige Transkription mit dem Ziel, das Material auf dem Rechner für die weitere Arbeit zur Verfügung zu haben. Schon bei meiner ersten Durchsicht der Transkriptionen habe ich angefangen, Material für eine Beschreibung der Schreibsprachen zu sammeln. Nach erfolgter Eingabe der Transkriptionen in den Rechner ging es nun darum, als problematisch oder enigmatisch angesehene Glossen anhand der Beschreibung der entsprechenden Schreibsprache zu überprüfen. Außerdem wurden mit TUSTEP alphabetisierte Wortformenverzeichnisse mit Frequenz- und Stellenangaben hergestellt und u.a. auf singuläre Graphien hin untersucht, die sich nicht selten als Lese- oder Transkriptionsfehler erwiesen.

In einem Punkt war meine kursorische Beschreibung des Transkribierens und der Umsetzung des Ergebnisses durch den Rechner einseitig. Jiddisch ist wie das Deutsche, Englische und wohl die meisten Sprachen eine Komponentensprache, d.h. es wurden und werden Bestandteile aus anderen Sprachen amalgamiert. Im Jiddischen ist nun eine Komponente die der Hebraismen, die für die alte Zeit schwer oder gar nicht von zitierten hebräischen Wörtern oder Wendungen sauber zu trennen sind, von Elementen also, die gar nicht dem Jiddischen zugehören. Das Besondere auf der Ebene der Schreibsprachen ist nun, daß diese Elemente, so normal sie im mündlichen wie im schriftlichen Gebrauch sein mochten oder heute sein mögen, fast nie soweit integriert wurden, daß sie wie alles Übrige annähernd phonemisch geschrieben worden wären. Fast immer wurde und wird die traditionelle hebräische Schreibweise beibehalten. Für unsere Arbeit mit dem Rechner mußten wir Hebraismen von der elektronischen Umsetzung der Transkription in hebräische Schrift ausnehmen. Diese Elemente wurden daher in Transkription und zusätzlich in Transliteration eingegeben; bei der elektronischen Umsetzung wird für die Ausgabe in Transkription die Transliteration getilgt, für die original-schriftliche Version die Transkription.

Andere Anforderungen an den Rechner ergaben sich schließlich im Zusammenhang mit der dringend nötigen Kommentierung, dem letzten Arbeitsgang an der Glossaredition im engeren Sinne. Sie wird den Glossen jeweils unmittelbar mit entsprechender Kodierung angefügt. Nach einigem Experimentieren erscheint sie im Druck am Fuß der Seite. Viele wünschenswerte Informationen sind nun für mehrere oder viele Glossen identisch. Sie nur beim ersten Vorkommen anzugeben, könnte bei Fließtexten sinnvoll sein, die man von vorn nach hinten lesen kann oder soll. Die Glossar-Edition wird aber ähnlich wie ein Telefonbuch jeweils punktuell benutzt, nicht fortlaufend gelesen werden. Es ergab sich also die Notwendigkeit, im Kommentar so gezielt wie möglich auf andere Stellen verweisen zu können. Dazu eignen sich die in der Ausgabe ja vom Rechner durchgezählten Lemmata besonders, allerdings liegt die Zahl bis heute nicht fest, weil z.B. die Möglichkeit besteht, daß neue Lemmata hinzukommen. Feststehen dagegen jeweils die Verszahl und das hebräische Lemma. Wir haben daher eine Routine eingebaut, die die Eingabeform Verszahl plus Lemma in die Lemmanummer umrechnet. Sie bietet gegenüber der Eingabe der Lemmanummer sogar einen Vorteil: der Rechner weigert sich, die Lemmanummer zu berechnen, wenn die umständliche Eingabe nicht ganz korrekt ist. Würde man die Zahlen selbst eingeben, käme eine Korrekturlese-Aufgabe hinzu, während auf diese Weise falsche Zahlen so gut wie ausgeschlossen sind.

Die Kommentierung setzt voraus, daß man einen Überblick über das gesamte Sprachmaterial einer Handschrift oder auch, je nach Fragestellung, mehrerer oder aller Handschriften und des Drucks gewinnen kann. Die Zahl der möglichen Schreibungen in den Handschriften ist sehr groß, Vorsilben erschweren das Suchen in alphabetisierten Wortformenlisten sehr. Hier ist die Arbeit mit dem Rechner daher vorzuziehen. Ich denke an die Definition von Makros, die die nicht gewünschten Datensätze, z.B. die deutsche Übersetzung und die Kommentare, für die Suche ausschalten, und von Strings, z.B. für alle Zeichen außer Buchstaben. Auf diese Weise kann man bei der Suche in der Datei die zahlreichen Diakritika der Transkription überspringen. Man muß bei TUSTEP nicht wissen, wie ein Wort genau geschrieben ist, um es zu finden.

Die Schnelligkeit der Veränderungen auf dem Gebiet der EDV hat auch für dieses Projekt Folgen gehabt. Eine positive Folge habe ich schon beiläufig erwähnt: wir kamen zunächst nur im Ausnahmefall in den Genuß, das Satzprogramm laufen lassen und das Ergebnis ausdrucken zu können. Erst seit wir den mischschriftlichen Text auf dem gleichen Flur über einen postscriptfähigen Laserdrucker ausgeben lassen können, ist die Arbeit mit der endgültigen Form der Edition möglich und normal geworden. Dies kam gerade rechtzeitig für die Phase der Arbeit, in der es notwendig wurde, das ganze Material in der endgültigen Form für die vergleichende Weiterarbeit auf dem Papier zusammen zur Verfügung zu haben.

Negativ ist die postbabylonische Sprachverwirrung. Was man sich als Benutzer als unvermeidliches Übel angeeignet hat, geht in Details plötzlich nicht mehr.

Fazit. Ohne den Rechner wäre die in Arbeit befindliche Glossar-Edition nicht in Angriff genommen worden. (1) Die elektronische Umsetzung der Transkription in die Originalschrift, (2) die Möglichkeit der elektronischen Herstellung von alphabetisierten Wortformenverzeichnissen für die sprachgeschichtliche und die editorische Arbeit, (3) die Möglichkeit der elektronischen Veränderung des Transkriptionstextes auf Grund neuer Einsichten, (4) der elektronischen Suche im Text sind einige Stichwörter. Die Jiddistik und speziell die Beschäftigung mit alten jiddischen Quellen ist durch die EDV-Nutzung einen bedeutenden Schritt vorangekommen.


aus: Protokoll des 67. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 6. Juli 1996