Aus dem Protokoll des 62. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 26. November 1994

 

Wolfgang Schenkel, Knut Buroh

Die altägyptischen Sargtexte.
Verfahrensschritte bei der Erschließung eines großen und komplizierten Textcorpus

1. Das ägyptologische Projekt

Die altägyptischen Sargtexte sind Texte, die zwischen dem Ende des 3. und der Mitte des 2. vorchristlichen Jahrtausends meist auf den Innenwänden von kastenförmigen Särgen betuchter Personen angebracht wurden. Sie sind in der Hauptsache gedacht als Wissensvorrat für den Verstorbenen zum Gebrauch im Jenseits. Dem Ägyptologen sind sie eine wahre Fundgrube für religionshistorische und linguistische Fragen.

Die Texte stehen in einer lebenden Texttradierung und -weiterentwicklung zwischen den Pyramidentexten aus der Mitte des 3. vorchristlichen Jahrtausends und dem Totenbuch, das seit der Mitte des 2. Jahrtausends v. Chr. die Sargtexte ablöst. Dem Umfang nach sind die Sargtexte die größte der drei Textgruppen. Sie umfassen - soweit ediert - Texte im Gesamtumfang von ca. 140 000 laufenden Wörtern. Die Texte sind - soweit ediert - im Schnitt 3,8 Mal bezeugt, so daß das Textcorpus insgesamt mehr als eine halbe Million laufende Wörter umfaßt. Da die Textzeugen nicht unbeträchtlich voneinander abweichen, ist letztere Zahl die für das Projekt maßgebende.

Für die Verarbeitung im Computer wurden die Texte nicht in der Hieroglyphenzeichenfolge erfaßt, die die Edition bietet - eine solche linguistisch zu interpretieren, wäre hochkompliziert -, sondern in einer linguistischen Transkription, die mit graphematischen Informationen angereichert ist, mithin in zweiter Linie auch die Hieroglyphenzeichenfolge abbildet.

Ursprünglich war Ziel, eine Konkordanz zu den Sargtexten zu erstellen, d.h. die Belege für die einzelnen Lexeme mit ihrem Kotext wiederzugeben. Dieses Ziel wurde zwar nicht aufgegeben, aber einstweilen noch vertagt, da eine mechanische Gewinnung der Kotexte entweder, wenn z.B. als Kotexte einheitlich sinnvolle Textabschnitte wie Sätze oder Teilsätze gewählt würden, diese die Konkordanz zu voluminös machten, oder, wenn man mechanisch kürzere Kotexte ohne Rücksicht auf den Sinnzusammenhang abgrenzen würde, die Konkordanz nur schwer zu benutzen wäre, da ägyptische Wortformen - in Hieroglyphen oder in Transkription - in weit höherem Maße mehrdeutig sind als etwa deutsche. Statt dessen werden, um auch einmal ein Ergebnis zu haben, Register produziert, lexikalische, morphologische, graphematische. Danach sollen die Texte syntaktisch analysiert werden und die syntaktischen Strukturen bei der Abgrenzung von Kotexten für die Zwecke einer echten Konkordanz genutzt werden.

Im übrigen werden übergroße Belegmengen für ein und dasselbe Textelement - Lexeme sind bis gegen 30 000 Mal belegt - mit Hilfe manueller Eingriffe derart reduziert oder strukturiert, daß ein Leser die Aufstellungen auch tatsächlich benutzen kann (statt z.B. 10 000 Belege nachzuschlagen, würde man besser die Edition durchlesen).

2. Die philologische Prozedur

Die Aufnahme der Texte (in Transkription) ist so kompliziert und damit fehleranfällig, daß sie nicht in einem Zug durchgeführt werden kann. Im übrigen stand weder von Anfang an noch steht heute fest, was man notiert, und was nicht; die Ansprüche wuchsen und wachsen mit dem Projekt. Anfangs bestand die Textaufnahme vor allem aus der Notation des Wortlauts und textkritischen Zusätzen, später kamen Angaben zu den Graphien hinzu, schließlich soll künftig einmal eine syntaktische Analyse zugeordnet werden - und dergleichen mehr. Die Erstellung der Texte für die Verarbeitung im Computer erfolgt also zyklisch oder besser: spiralförmig. Die Textaufnahmen werden in Etappen "aufgeschaukelt". Dabei liefern frühere Etappen oft mehr als den Textbestand selbst: Die mehrfach bezeugten Texte wurden derart gewonnen, daß ein - beliebiger - erster Textzeuge vervielfältigt wurde und durch Korrektur in die anderen Textzeugen verwandelt wurde. Oder: Für die Zufügung der graphematischen Informationen zu den zuvor hergestellten Transkriptionen des Wortlauts wurde ein graphematisches Wörterbuch produziert, das jede mögliche Graphie einmal enthielt, und aus diesem wurden dann die Graphien der einzelnen Wortformbelege ausgewählt.

Für das "Aufschaukeln" der Textaufnahme ist von wesentlichem Belang, daß zwischen den Zyklen Register erstellt werden können - z.B. sehr früh schon ein lexikalisches Register -, mit deren Hilfe man die Textaufnahmen auf Konsistenz hin überprüfen kann.

3. Die TUSTEP-Prozedur

Es gibt stets eine maßgebende Fassung des Textcorpus. Diese Fassung bietet die Texteinheiten in einer Reihenfolge, z.B. in der Folge des Textes oder in der lexikalischen Folge. Will man die Elemente in anderer Reihenfolge haben, muß diese "Maßgebende Textfassung" des Corpus entsprechend umsortiert werden. Es spricht allerdings nichts dagegen, neben der "Maßgebenden Textfassung" des Corpus in einer bestimmten Sortierung auch nicht-maßgebende Fassungen in anderer Sortierung zu haben. Abstrakt überlegt, wäre die Arbeit mit einer Datenbank praktischer, in der Praxis dagegen ist das gewählte Verfahren ohne Datenbank durchaus zweckmäßig, da man sich im allgemeinen in der Folge der Zyklen sehr lange auf eine einzige Reihenfolge konzentriert.
Die "Maßgebende Textfassung" muß drei Bedingungen erfüllen: Wesentliche TUSTEP-Eigenschaften - neben den allgemeinen Qualitäten - sind für unsere Zwecke vor allem diese: Den immensen positiven Qualitäten des Werkzeugs TUSTEP stehen ein paar Nachteile gegenüber, etwa diese: Die genannten Problem-Punkte sind für die Zwecke des Projekts praktisch gelöst. Es steht zu vermuten, daß die Probleme weitestgehend mit den spezifischen Besonderheiten der benutzten Transkription und mit der Eigenart des Textcorpus zusammenhängen, Speziallösungen also gerechtfertigt sind.

4. Beispiel einer Druckausgabe: der Druck der lexikalischen Konkordanz

Da ein wesentliches Ziel des Projekts ist, die wichtigsten Ergebnisse in der klassischen Form eines gedruckten Buches zu veröffentlichen, das nach wie vor für den Ägyptologen das meistgebrauchte Arbeitsmittel darstellt, war es von einem gewissen Grad der "Aufschauklung" und Sortierung der Daten an sinnvoll und erwünscht, diese schon als Teil- oder Zwischenergebnis in einer der endgültigen Druckgestalt nahekommenden, wenn nicht sogar identischen Form zu produzieren. Als Schnittstelle zu diesem Produktionsschritt dient die oben § 3 eingeführte "Maßgebende Textfassung", die die Daten in ihrer jeweils aktuellsten Form enthält.

Die einzelnen Sätze der "Maßgebenden Textfassung" werden hierzu durch eine Kaskade von TUSTEP-Kopiere- und TUSTEP-Satz-Programmen geschickt, in deren Verlauf die Daten verglichen und reduziert, interne Codes in explizite TUSTEP-Satz-Codes umgewandelt sowie für den Satz und für das Druckbild nötige Ergänzungen vorgenommen werden. Am Ende des Durchlaufs steht ein TUSTEP-Satz-Programm, das dann die endgültige Ausgabe, letztlich auf Papier besorgt.
Die Schritte im einzelnen:

Die relativ hohe Zahl von Durchgängen und Parameterzeilen läßt die Frage aufkommen, ob eine Zusammenfassung von Verarbeitungsschritten in TUSTEP-Kopiere nicht möglich und wünschenswert wäre. Zwar ist dies theoretisch ohne weiteres denkbar, in der Praxis ginge dies aber auf Kosten der Nachvollziehbarkeit der einzelnen Programmschritte und ihrer Wirkungen im komplexen Daten- und Codebestand. Durch die Verteilung auf vier, in ihren Aufgaben klar voneinander getrennte Teilprogramme, wird die Fehlersuche und Fehlerbeseitigung wesentlich vereinfacht. Manuelle "Schönung" der TUSTEP-Satz-Ausgabedatei ist nicht vorgesehen. Datenfehler, die in den Zwischenausdrucken festgestellt werden, werden in der "Maßgebenden Textfassung", also in den Quelldaten korrigiert, Programmfehler im Programm abgefangen. Wie bereits erwähnt, ist es unter den gegenwärtigen Bedingungen jederzeit möglich, einen Ausdruck zu erstellen, der der endgültigen zu druckenden Form weitestgehend entspricht. Im Wesentlichen hängt es vom angestrebten Perfektionsgrad der "Maßgebenden Textfassung" ab, wann der Druck erfolgen kann.


aus: Protokoll des 62. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 26. November 1994