Aus dem Protokoll des 75. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 6. Februar 1999

 

Wolfgang Röllig, Wolfgang Pempe (Tübingen)

Das mittelassyrische Keilschriftarchiv aus Tall Seh Hamad in Syrien

Nach dem Fund der ersten Tontafeln im Jahre 1977 wurden bereits seit 1978 auf dem Tall Seh Hamad in Nordost-Syrien Ausgrabungen durch Hartmut Kühne von der FU Berlin durchgeführt. Dabei sind von 1978 bis 1984 auf der Südwest-Kuppe des beherrschenden Talls die Tontafeln eines mittelassyrischen Verwaltungsarchivs geborgen worden. Sie waren dort in einem Verwaltungsgebäude untergebracht, das bei einem Brand zerstört wurde. Deshalb sind die Tafeln aus dem 1. Stock in das Erdgeschoß bzw. in einen Kellerraum hinabgestürzt und also nicht in ihrer ursprünglichen Lage gefunden worden. Sie wurden vielmehr vergesellschaftet mit Scherben und Knochen gefunden, waren durch den Brand auch teilweise zerstört, teilweise schwarz geschmaucht. Dennoch wurden rd. 450 Tafeln und Tafelfragmente geborgen.

Das Archiv besteht aus verschieden großen Keilschrifttexten, die zwischen 8 und 60 Zeilen umfassen. Ein kleiner Teil der Texte ist gesiegelt, d.h. durch Rollsiegel besonders gekennzeichnet. Es handelt sich dabei meist um eine Art Darlehensurkunden. Ein weiterer kleiner Teil der Texte war mit Hüllen versehen, wie es in der altbabylonischen Zeit z.B. bestimmte Rechtsurkunden sind. Einmal konnte auch eine Tafel direkt einer Hülle zugeordnet werden.

Inhaltlich handelt es sich bei den Texten um:

  1. Briefe, die meist geschäftlichen Inhalts sind, allerdings auch von beträchtlichem historischen Interesse für die Zeit der Blüte des mittelassyrischen Reiches zur Zeit Salmanassar I. und Tukulti-Ninurta I. (zwischen 1270 und 1230 v. Chr.).

  2. Listen, vor allem Listen von Personen, die als Arbeiter auf den staatlichen Feldern beschäftigt waren. Diese sind entweder lediglich mit ihren Namen aufgeführt oder mit den Rationen, die ihnen zugeteilt waren. Ferner gehören dazu Viehlisten, vor allem von Kleinvieh, Rindern und Eseln.

  3. Lieferscheine und Quittungen. Hier sind vor allem die Lieferscheine über Getreide, über Öl und andere Dinge zu nennen, auch Schweinefett und Wolle spielt offensichtlich in der Wirtschaft des Ortes Dur Katlimmu eine wichtige Rolle.

  4. Eine Anzahl von Texten, die Abrechnungen über die Ernte und die Vorratshaltung an Getreide für das kommende Jahr zum Gegenstand haben. Diese "Feldertexte" sind besonders wichtig, weil sie uns über die Erträge der Felder in der ariden Region des Unteren Habur unterrichten.

  5. Eine Anzahl von Texten läßt sich nicht in die genannten Kategorien einfügen. Sie sind aber als Unikate ebenfalls von besonderer Wichtigkeit.

Das Archiv ist ein staatliches Archiv, kein privates. Es gibt uns Einblick in die Wirtschaft der mittelassyrischen Zeit (um 1250 v. Chr.) und läßt auch die Beziehungen zwischen der Provinzstadt Dur Katlimmu und der Hauptstadt Assur hervortreten. Die weitere Erschließung der Texte läßt nicht nur neue Daten zur Wirtschaftsgeschichte erwarten, sondern ermöglicht es z.B. auch durch die Deutung der Namen der in den Listen genannten Arbeiter, die ethnische Zusammensetzung der Bevölkerung am Habur im 2. Jt. zu erschließen.

Die systematische Erschließung der sehr vielen Eigennamen der jeweiligen Familienmitglieder und ihrer Zusammengehörigkeit wird auch Aussagen über das Bevölkerungswachstum bzw. die Verminderung der Bevölkerung zulassen.

Schwierigkeiten bereiten bisher noch die für Keilschrifttexte gebräuchlichen Umschriftsysteme, die mit Silbenzeichen, Wortzeichen, Determinativen und phonetischen Komplementen arbeiten, die jeweils mit verschiedener Typographie zu gestalten sind, damit sie sich deutlich voneinander abheben. Ziel dieser in der Assyriologie seit einigen Jahrzehnten entwickelten und verfeinerten Umschrift ist es, den Originaltext der Keilschrifttafel so deutlich zu umschreiben, daß für den Leser eine Rekonstruktion dieses Textes optisch möglich ist, ohne Einblick in die Tafel selbst zu haben. Nur bei genauer Beachtung dieser Umschriftmethoden, die in der Assyriologie entwickelt worden sind, ist es auch möglich, bestimmte Schreibereigentümlichkeiten bzw. Eigentümlichkeiten von Schreibbüros herauszuarbeiten und zu analysieren.

Die EDV-technischen Probleme bei der Bearbeitung des Textmaterials

Erfassung und Datenspeicherung

Die Erfassung der Textdaten geschah zunächst mit Word (Version 5.0), wobei die Umschriften der einzelnen Texte hintereinander in Dateien geschrieben wurden, deren Größe aus praktischen Erwägungen den jeweils im Institut gängigen Diskettenformaten bzw. deren Speicherkapazitäten angeglichen wurde. Als Überschrift bzw. Referenz wurde die jeweilige Museumsnummer des Museums von Der ez-Zor gewählt, wo die Tontafeln aufbewahrt werden. Um nach der Umschrift eines Textes zu suchen, waren stets eine oder mehrere Dateien zu durchsuchen, da die Reihenfolge der Texte in den Dateien nicht immer der der Museumsnummern entsprach. Um schnelleren Zugriff zu den Umschriften einzelner Texte zu erhalten, wurde für jeden Text eine Datei angelegt, die nach der Museumsnummer der jeweiligen Tontafel benannt wurde.

Weitergehende Informationen zu den einzelnen Texten wie Grabungsnummer, Zustand, Größe und Färbung der Tontafel, Siegelung mit Rollsiegel u.a.m. waren in einer separaten Kartei (Zettelkasten) vermerkt.

Datenformat

Die Formatierung der Daten war dem seinerzeit verwendeten Instituts-Drucker, einem 24-Nadel-Drucker, der von Word aus nur in 12-Punkt Courier angesprochen werden konnte, angepaßt. Wenn also die Umschrift einer Zeile auf der Tontafel nicht auf eine Zeile auf dem Papierausdruck paßte, so wurde an der entsprechenden Stelle in der Datei von Hand umbrochen und der Rest der Zeile mit Tabulatoren nach rechts geschoben. Weiterhin wurde von Hand eine Zeilenzählung in 5er-Schritten vorgenommen. Auf den Tontafeln eingeritzte horizontale Linien, die dazu dienten, den Text semantisch zu untergliedern, wurden ebenfalls druckbildspezifisch formatiert.

Mit der Anschaffung eines neuen Druckers und der Verwendung einer skalierbaren Schrift (Times Roman) mußten die Texte sukzessive von Hand umformatiert werden, um zu einem halbwegs übersichtlichen Druckbild zu kommen.

Erschließung der Texte

Die auf die oben beschriebene Weise abgelegten Textdaten wurden durch von Hand erstellte Register nach Personen- und Ortsnamen erschlossen. Wenn also z.B. die Lesung einer beschädigten Textpassage aufgrund neuerer Kollationen verbessert werden konnte, mußten sowohl die Textdaten als auch die Register aktualisiert werden, was je nach Länge der betreffenden Textpassage erheblichen Aufwand verursachte, ebenso die Neuerfassung mancher Texte.

Eine Wortsuche innerhalb der Computerdaten war aufgrund des oben erwähnten Umschriftsystems, das nicht den Wortlaut, sondern die Orthographie (Silben- und Wortzeichen, Komplemente und Determinative) und den Erhaltungszustand (textkritische Zeichen) der Keilschrift wiedergibt, praktisch unmöglich.

Anforderungen an eine "Komplettlösung"

Aufgrund der unbefriedigenden Erfahrungen mit den eben genannten Arbeitsabläufen bzw. mit der Art der Datenspeicherung suchten wir seit 1993 nach einer Lösung, die die Arbeitsschritte - und mit ihnen potentielle Fehlerquellen - reduziert, d.h. die die zu diesem Zwecke zu lemmatisierenden und in einer Datei zusammengefaßten Computerdaten durchsuchbar macht und die sowohl die Registererstellung als auch die Ausgabe der Texte unabhängig von Drucker und Satzspiegel weitestgehend automatisiert.

Als Werkzeug hierfür bot sich TUSTEP an, das alle gewünschten Funktionen in einer einheitlichen Umgebung zur Verfügung stellt. Sowohl Erfassung, Korrektur und Verwaltung der Text- und Metadaten als auch Registererstellung und Satz lassen sich auf einfache Weise innerhalb einer TUSTEP-Sitzung realisieren.

Lemmatisierung und Datenstrukturierung

Um die Textdaten sowohl für die Suche im Editor als auch für auswertende und ausgebende Programme greifbar zu machen, mußten sie zunächst nach TUSTEP konvertiert, lemmatisiert und in eine (SGML-ähnliche) Struktur gebracht werden, die es ermöglicht, jedes Wort referenzierbar zu machen, d.h. nach Museums-, Zeilen- und Wortnummer.

Die Konvertierung wurde im wesentlichen von einem (TUSTEP-)Programm vorgenommen, das gleichzeitig die in 5er-Intervallen eingebrachten Zeilennummern dazu nutzte, die Zeilen und dann - in einem nächsten Schritt - die Wörter durchzunumerieren.

Die Lemmatisierung war weitgehend Handarbeit, die aber durch einige Hilfen erleichtert werden konnte: Der Datenbestand wurde vorher in eine Form gebracht, in der jedes Wort in einer Zeile stand, anschließend wurden die Daten so sortiert, daß - unabhängig von textkritischen Zeichen - Wörter gleicher bzw. ähnlicher Schreibweise untereinander zu stehen kamen, so daß die Lemmatisierung über weite Strecken im Editor via "Copy-Paste" vorgenommen werden konnte. Um in Zweifelsfällen schnell auf den Originalkontext einer Graphie zugreifen zu können, wurde in einem zweigeteilten Editorfenster gearbeitet: oben die sortierten Daten, unten die Daten im Textzusammenhang. Bei schwierigen oder mehrdeutigen Schreibungen sorgte ein Editormakro anhand der vor jeder Graphie stehenden Text-, Wort- und Zeilennummer dafür, daß im unteren Editorfenster auf Wunsch der jeweilige Originalkontext des auf Cursorposition stehenden Wortes im oberen Editorfenster sichtbar wurde. Bei der Lemmatisierung wurden außerdem bestimmte Typen von Einträgen unterschieden: Personennamen, Eponymennamen (datierend, nicht datierend), Toponyme, Monatsnamen und sonstige.

Erweiterung der Datenbasis

Vor die Textdaten einer Tafel wurde jeweils ein Header mit Metadaten eingefügt, der die bisher in der Kartei verzettelten Informationen zu den einzelnen Keilschrifttafeln beinhaltet, so daß nun neben Fund- und Museumsnummer auch Informationen zu etwaigen Siegelabrollungen, Texttyp, Abguß, Photographien, Tafelgröße und Datierung für auswertende Programme explizit greifbar sind.

Weiterhin sind Felder innerhalb der Textdaten selbst vorgesehen, die es ermöglichen, an den betreffenden Stellen Kollationsvermerke und Kommentare einzubringen, die beim Satz optional mit ausgegeben werden können. Um die Ausgabe der horizontalen Linien unabhängig von Drucker und Satzspiegel proportional zur Laufweite des Textes zu halten, befindet sich am Anfang eines Textes eine im Druckbild unsichtbare Zeile, die eine "repräsentative" Zeile des jeweiligen Textes enthält und die dazu dient, die Laufweite der an den betreffdenden Stellen im jeweiligen Text aufgerufenen Linien zu definieren.

Datenbasis und Dienstprogramme

Die Datenbasis zu den Seh Hamad-Texten wurde mit Hilfe der oben beschriebenen Prozeduren in zwei Portionen 1994 und 1996 erstellt und wird mit gutem Erfolg gepflegt. Änderungen bzw. Ergänzungen der Textdaten müssen nun nur noch an einer Stelle, in der Datenbasis, vorgenommen werden; Listen, Register und ein KWIC-Index werden von Programmen erstellt, die die Datenbasis nach vorgegebenen Kriterien auswerten. Auch der Satz erfolgt per Programm, wobei ein doppelter Satzlauf dafür sorgt, daß überlaufende Zeilen nach rechts geschoben werden. Auch Änderungen des Satzspiegels oder der Typographie müssen nur an einer Stelle, an den Parametern für das TUSTEP-Satzprogramm, vorgenommen werden. Die Ausgabe erfolgt im Postscript-Format, so daß eine gewisse Drucker-Unabhängigkeit gewährleistet ist.

Die Arbeit an den Daten wird außerdem durch einige Editormakros erleichtert, und bei systematischen Korrekturen leisten die "Zeige"-Anweisungen des TUSTEP-Editors unverzichtbare Dienste.


aus: Protokoll des 75. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 6. Februar 1999