Aus dem Protokoll des 61. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 2. Juli 1994

 

Annegret Fiebig (Berlin)

Mittelalterliche Schreiber und sprachliche Eigenheiten.
Maschinelle Auswertung deutschsprachiger Urkunden des 13. und 14. Jahrhunderts


Die Voraussetzung zu den folgenden Ausführungen sind Überlegungen zur Entstehung mittelalterlicher Originalurkunden. Im Unterschied zu Büchern, also zu Handschriften mit im engeren Sinne literarischem Inhalt, handelt es sich bei Originalurkunden nicht um Abschriften von einer Vorlage. Urkunden wurden zwar unter Verwendung von Formeln und wiederkehrenden Wendungen verfaßt, und ältere Vorlagen haben sicherlich als Muster gedient. Der Text wurde aber jeweils neu formuliert, weshalb Urkunden als frühe Vertreter mittelalterlicher "Originale" gelten können.

Die Methode zur computergestützten Sprachuntersuchung wurde für deutschsprachige Urkunden aus Österreich aus dem 13. und frühen 14. Jahrhundert entwickelt und bildet einen Teil meiner Dissertation. Ich verfolge damit zwei Ziele: Zum einen sollen bestimmte sprachliche Konstanten und Varietäten ermittelt werden. Neben der Analyse des Schreibdialekts werden die syntaktischen Konstruktionen, die Mittel für die Textgliederung sowie "innere Urkundenmerkmale" ausgewertet. Der zweite Schritt besteht darin, aus den Ergebnissen weiterführende Schlüsse zu ziehen: Läßt sich aus den erarbeiteten Daten der Nachweis führen, daß bestimmte sprachliche Merkmale für einen individuellen Schreiber oder für ein Skriptorium konstitutiv sind? Die Auffindung sprachlicher Abweichungen und Übereinstimmungen könnte somit einen erweiterten "Diktatvergleich" darstellen und Aufschluß über Schreibzusammenhänge und Schriftorganisation geben.

Auswahl des Untersuchungsmaterials

Um die Tragfähigkeit einer Untersuchungsmethode zu erweisen, muß von einer vergleichbaren Textbasis ausgegangen werden. Etwa 470 Urkunden aus der Region Niederösterreich bilden die Untersuchungsgrundlage. Es handelt sich dabei vor allem um Urkunden, die im Zusammenhang mit den "Landherren", den aufstrebenden österreichischen Ministerialen im 13. Jahrhundert, stehen. Als erstes Landherrengeschlecht in Österreich urkundeten die einflußreichen Herren von Kuenring auf deutsch (1281). An Leutold von Kuenring, dem Inhaber des Schenkenamts unter Rudolf von Habsburg und Anführer des Aufstands gegen den Herzog, ist die Zeitspanne für die Untersuchung orientiert: 1281, der Beginn österreichischer Beurkundung in deutscher Sprache, und 1312, das Todesjahr Leutolds von Kuenring, bilden die Eckdaten. Das Kriterium für die Auswahl war eine Beteiligung am Beurkundungsgeschäft - als Aussteller, Empfänger, Zeuge oder in sonstiger Funktion. Zum Vergleich wurden Urkunden der Herren von Ebersdorf aufgenommen, deren gesamtes mittelalterliches Archiv im Niederösterreichischen Landesarchiv überliefert ist. Eine dritte Urkundengruppe stellen die städtischen Urkunden Wiens dar.

Aufbereitung des Materials bei der Computererfassung

Die deutschsprachigen Urkunden des 13. Jahrhunderts sind in diplomatischem Abdruck im Corpus der altdeutschen Originalurkunden ediert. Sie wurden über das Texterkennungssystem "Optopus" in Tübingen eingelesen. Hinzu kommen lateinische Urkunden sowie Urkunden aus dem 14. Jahrhundert, die in österreichischen Archiven vom Original transkribiert wurden. Dabei wurde der Text mit folgenden Codierungen ausgezeichnet: Zusätzlich wurde der aus dem handschriftlichen Original erschlossene Befund eingearbeitet:

Kriterien für die Untersuchung. Untersuchungsschritte

Vom gesamten Textcorpus wurde ein Wortindex sowie ein KWIC-Index erstellt. Für weitere Untersuchungsschritte kann als einzig sichere Annahme vorausgesetzt werden, daß jede Urkunde für sich genommen ein eigenes Schreibsprachsystem darstellt. Ein Schreiber hat mit einem bestimmten Diktat oder von einer bestimmten Vorlage zu einem bestimmten Zeitpunkt eine Urkunde, in der ein bestimmtes Rechtsgeschäft beurkundet wird, geschrieben. Da für jede andere Urkunde davon auszugehen ist, daß sich zumindestens einer der genannten Faktoren verändert hat, ist es notwendig, jeden Text gesondert auszuwerten.

1. Gliederungszeichen und Layout

Der Aufbau einer Urkunde und die Unterteilung des Textes spielen eine wichtige Rolle beim Textvergleich. Hierbei ist zu unterscheiden zwischen "äußeren Urkundenmerkmalen", der Ausführung von Initialen und Majuskeln, Schriftrand etc. und den Zeichen zur Textgliederung, die als sprachliche Merkmale zu bezeichnen sind. Zur inhaltlichen Untergliederung eines Textes werden Interpunktionszeichen verwendet, Initialen, Majuskeln oder litterae notabiliores. Auch Zeilenwechsel können mitunter die Funktion von sinnhaften Einschnitten haben.

Interpunktion
Es wird zwischen dem Inventar der Zeichen in einer Urkunde und ihrer Funktion unterschieden. Insgesamt erscheinen in den Urkunden die Zeichen punctus in verschiedenen Positionen auf oder über der Zeile, virgula suspensiva, virgula plana, punctus elevatus, Komma, Apostroph, Kolon, Doppelpunkt, Bindestrich und paragraphus. Hinzu kommen diverse Schlußzeichen, deren zum Teil sehr aufwendige Ausführung die maschinelle Erfassung nicht sinnvoll erscheinen läßt. In jeder Urkunde tritt eine bestimmte Auswahl dieser Zeichen in jeweils unterschiedlicher Zusammenstellung auf.

Das Inventar ist über den Wortindex leicht zu erfassen. Dabei ist die Angabe der relativen Häufigkeit der Zeichen wichtig, denn die Frequenz der Interpunktionszeichen schwankt in den einzelnen Urkunden beträchtlich.

Der KWIC-Index gibt eine Übersicht über die Funktionen: Interpunktionszeichen können zur Abgrenzung der einzelnen Formularteile verwendet werden, in Aufzählungen, als Referenzpunkte, zur Hervorhebung von Zahlen oder als Abschluß vor neuen Zusatzbestimmungen.

Für die Gewinnung von Daten über die Frequenz der Interpunktionszeichen, ihre Relevanz für die Prosodie und über ihre Bedeutung als Zäsur in der mündlichen Rede ist es für die maschinelle Auswertung notwendig, zu vereinfachen. Hier erwies sich die Zahl der Wörter zwischen einzelnen Zeichen als tragfähiges Kriterium. Über ein #KOPIERE-Programm werden die Wörter zwischen Interpunktionszeichen zunächst ausgezählt und aus den Zahlen der empirische Mittelwert errechnet. Da dieser Wert allein keine tragfähige Aussage erlaubt, wurde darüber hinaus die empirische Standardabweichung ausgerechnet. Diese rein quantitativen Werte enthalten keine exakten Informationen über den Sprachrhythmus und inhaltlich betonte Schwerpunkte in einer "Redeeinheit". Die Zahlen können jedoch als Näherungswerte interpretiert werden.

Im Anschluß ergab die Diskussion, daß die einzelnen Formularteile gesondert ausgewertet werden müssen. Denn besonders an den Zeugenlisten wird offensichtlich, daß hier, aufgrund der Abgrenzung der Namen durch Zeichen, eine viel höhere Frequenz von Interpunktionszeichen vorliegen muß als in den anderen Teilen einer Urkunde.

2. Wortfolgen

Die Dispositio beginnt in den meisten Fällen mit einem daz-Satz. Danach treten in der größten Zahl der Urkunden bestimmte Wortfolgen zur Anbindung von rechtlichen Zusatzbestimmungen auf: Neue Sinneinheiten setzen häufig mit Konjunktionen oder pronominalen Subjekten ein. An zweiter Stelle folgt meistens das finite Verb: man sol, vn hat, ich han ouch und ähnliches. Mit folgenden Konjunktionen und Pronomina werden neue Bestimmungen häufig angebunden: man, ouch, also, so, vnd. Speziell in rechtssetzenden Urkunden treten außerdem konditionale Fügungen auf. Der Stil der Urkunden unterscheidet sich unter anderem durch die Wortwahl und -position beim Einsatz neuer Bestimmungen. Über den KWIC-Index ist die Analyse der Funktion möglich: Es ist schnell zu ersehen, ob beispielsweise vnd in erster Linie in Aufzählungen oder mit nachfolgenden Verben als Einleitung von neuen Sätzen oder Bestimmungen auftritt. (In der Urkundensprache werden häufig zusätzliche rechtliche Informationen und Grundlagen als neue Redeeinheiten formuliert, ohne daß das vorher genannte Subjekt wiederholt werden würde.)

3. Wortstellung

Das finite Verb entscheidet über die Art der Rechtshandlung - über Verkauf, Stiftung, Schenkung, Testament, Privilegienbestätigung, Schlichtung, Einigung oder Gesetzgebung. Dabei variieren beispielsweise verkoufen - koufen - ze koufenne geben, (ver)lihen - ze lihenne geben. Ist die Wahl der Vokabel für den Urkundentyp wichtig, so im Hinblick auf die Schreiberpraxis ihre Position: Das Verb kann schon bald nach Beginn der Dispositio gesetzt sein, unmittelbar hinter dem Subjekt. Im Unterschied dazu kann es jedoch auch erst viel später, nach Dativobjekten der Person, Akkusativobjekten der Sache, möglicherweise auch nach adverbialen Wendungen und präpositionalen Ergänzungen erscheinen. Der Satzrahmen kann noch beliebig erweitert werden durch den Einsatz von adverbialen und präpositionalen Ergänzungen. Entsprechend entsteht eine geringe oder hohe Satzspannung. Obwohl aufgrund der Lemmatisierung die Position der Verben mit rechtlicher Bedeutung maschinell ausgezählt werden könnte, enthält ein solches Verfahren eine zu hohe Fehlerquote. Die Formulierungen mit Verben in Sperrstellung variieren zu sehr, außerdem erschweren anakoluthische Konstruktionen die exakte maschinelle Zählung. Sinnvoller erscheint es, den Beginn der Dispositio festzuhalten und bei der Lektüre selbst Wahl und Position des Verbs festzustellen.

4. Abkürzungen

Die Markierung der Abkürzungen bei der Eingabe ermöglicht es, rasch festzustellen, für welche Silben und Buchstaben Kürzel verwendet wurden und wie oft. In deutschen Texten erscheinen wesentlich weniger Abkürzungen als in lateinischen Urkunden, weshalb die auftretenden Unterschiede der Verwendung weniger stark ins Gewicht fallen. Sie sind aber dennoch von Bedeutung für die Schreibpraxis. Hinsichtlich der Ausführung von Kürzeln muß im Einzelfall das handschriftliche Original herangezogen werden.

5. Lexikalischer Befund, Vokabular   6. Schreibungen, Graphie

Die Lemmatisierung ermöglicht eine objektive und vom Eindruck der Schreibungen unabhängige Auswertung des Vokabulars. Auch bei der Analyse der einzelnen Schreibungen kann auf die normalisierten Wortformen rekurriert werden. Auf diese Weise werden die Wörter nach "normalmittelhochdeutschen" Lang- und Kurzvokalen, Diphthongen und den Konsonantenschreibungen im An- und Inlaut sortiert.

7. Analyse der Formularteile

Zusätzlich zu den sprachlichen Auswertungen wird das Urkundenformular untersucht. Die Kennungen geben an, welche Teile in einer Urkunde enthalten sind und in welcher Reihenfolge sie erscheinen. Zu den "inneren Merkmalen" einer Urkunde gehört außerdem die Formulierung von Protokoll und Eschatokoll, besonders die Datierungsangabe sowie möglicherweise Corroboratio und Renuntiationsformel. Eine objektive Vergleichsmöglichkeit entsteht dadurch, daß der normalisierte Text der einzelnen Formularteile untereinandergeschrieben und verglichen wird.

8. Orts- und Personennamen

Ergänzend zum Wortindex wird auf der Grundlage der normalisierten Schreibungen ein Register der Orts- und Personennamen erstellt. Die Liste enthält Angaben über die jeweilige Funktion beim Beurkundungsvorgang: Es kann sich um Aussteller, Empfänger, Zeugen oder Urkundsparteien in sonstiger Funktion handeln, um Ausstellungsorte, verhandelte Liegenschaften, Ort der mündlichen Rechtsabmachung o.ä.

9. Äußere Urkundenmerkmale, paläographischer Befund

Zur Überprüfung der Untersuchungsergebnisse ist die paläographische Auswertung und Überprüfung der äußeren Urkundenmerkmale unerläßlich. Übereinstimmungen oder Abweichungen des paläographischen und sprachlichen Befundes erlauben Schlüsse auf die Tragfähigkeit der Methode.

Bisherige Ergebnisse

Bisher lassen Einzelergebnisse erkennen, daß der sprachliche und der paläographische Befund einander entsprechen. Beispielsweise konnten fünfzehn Urkunden unterschiedlichen Typs aufgrund von Übereinstimmungen der Interpunktion, der Wortstellung und der Schreibungen zu einer Gruppe zusammengestellt werden. Alle Urkunden sind der gleichen Hand zuzuordnen, die als Kuenringer-Schreiber "Kuenr. K" identifiziert werden konnte (Sigle von Zawrel).

Eine zweite Gruppe von sechs Urkunden stammt ebenfalls von derselben Hand aus dem Bereich der Wiener städtischen Kanzlei.


aus: Protokoll des 61. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 2. Juli 1994