Der Nutzen des Repertorium Germanicum liegt nicht so sehr in der politischen Korrespondenz der Päpste, die durch Regesten nur unzureichend erschlossen wird und eigentlich einen Vollabdruck erfordert, sondern in der Unzahl prosopographischer Daten, vom Pfründenbesitz über Indulgenzen und Tragaltäre bis zu allerlei Dispensen (uneheliche Geburt, zu niedriges Alter, Nichterfüllung der Residenzpflicht wegen Studium oder Fürstendienst usw.). Vor allem bietet sich eine sozialgeschichtliche Auswertung an, was Herkunft und Karriere der Geistlichkeit in Deutschland sowie der Deutschen im päpstlichen Dienst, aber auch adelige und bürgerliche Bittsteller an der römischen Kurie angeht. Ebenso werden Finanztransaktionen zwischen Deutschland und Rom erhellt. Die einzelnen Einträge sind nach Kirchenrecht und Kanzleibrauch hochgradig formalisiert, so daß durch die Gleichförmigkeit fast der Eindruck serieller Geschichtsquellen entsteht.
Drucklegung und Erschließung des Repertorium Germanicum wurden wesentlich durch den Einsatz von TUSTEP beschleunigt, zu dem sich das Deutsche Historische Institut in Rom auf Initiative des unvergessenen Dr. Hermann Diener ( 1988) zusammen mit dem Max Niemeyer Verlag, dem Zentrum für Datenverarbeitung der Universität Tübingen und der pagina GmbH in Tübingen entschlossen haben. Bei Martin V. (1417-31) lag der Text 1958 vor, das Personenregister erschien 1979, das Ortsregister steht noch aus. Bei Nikolaus V. (1447-55) erschien der Text 1985; mit Hilfe von TUSTEP konnte der Indexband 1989 folgen. Seither werden Text und Indices gemeinsam erstellt, was mehrere Vorteile bringt. Indem man frühzeitig die Zettel in den Computer eingibt, kann das Manuskript schneller zusammengestellt werden. Oft sieht man erst mit Hilfe der Indices, daß zwei Einträge sich auf dieselbe Person oder denselben Ort beziehen, so daß etwa für Pius II. der Umfang von 6455 auf schließlich 5984 Personen und Orte schrumpfte. Unvermeidliche Tippfehler fallen in den Indices leichter auf. Außerdem enthalten nun die Indices, wie schon lange gefordert, nicht bloß die Personen- und Ortsnamen, sondern auch Patrozinien, Orden und religiöse Gemeinschaften, Kalenderdaten, Fundstellen und Sachbetreffe. Das macht die Bände vielseitiger benutzbar.
Bisher wurden in die Indices zu übernehmende Textpassagen jeweils durch acht
besondere Steuerzeichen eingeschlossen:
$ Personen
+ Orte
§ Patrozinien
% Orden und religiöse Gemeinschaften
* akademische Grade
" Standesbezeichnungen
& Kalenderdaten der Einträge
&/ in dem Eintrag genannte Vordaten.
TUSTEP und die sachlich knappe
Regestenformulierung erlauben jedoch, solche Kodierungen künftig auf ein
Minimum zu beschränken. Namen beispielsweise sind durch Großbuchstaben, Orte
durch nachfolgendes dioc., Patrozinien durch voraufgehendes s., ss., b., bb.
eindeutig gekennzeichnet. So werden Kodierungsfehler vermieden, und außerdem
gewinnt der Bearbeiter Zeit für wichtigere, nicht durch EDV zu leistende
Arbeitsschritte wie die Gewinnung des Zunamensindex aus den Vornamen. Wilhelmus,
Johannes et Bertoldus fr. et com. in Hennberg muß nämlich bei den Vornamen
dreimal unter W, J und B stehen sowie bei den Zunamen einmal unter H.
Als besonders schwierig erwies sich die Vereinheitlichung der Flexionsformen schon bei gewöhnlichen Wörtern. Ein vidimus (beglaubigte Urkundenabschrift) darf nicht unter videre (sehen) verschwinden. Der Prior eines Klosters muß von prior (früher) unterschieden werden. Mense kann der Ablativ von mensis (der Monat) oder der Genitiv usw. von mensa (der Tisch) sein. Mitunter hilft ein KWIC-Index (key word in context), um etwa m. mit den Bedeutungen mandare, mandatum, marca und murus zu differenzieren. Noch komplizierter wird die Vereinheitlichung bei Namen, denn hier geht es nicht nur um Flexion - Theoderico zu Theodericus, während Otto trotz Endung auf -o bleibt -, sondern auch um Varianten. Während Hinricus, Henricus und Arigo eindeutig unter Heinricus stehen müssen, wäre z.B. bei Rutgerus und Ratgerus eine philologische Abklärung notwendig.
Bei so viel Handarbeit, die trotz des TUSTEP-Einsatzes notwendig bleibt, erfüllen die Indices natürlich nicht alle Wünsche. Der Text wird aber auf Band gespeichert, so daß Interessierte für spezielle Anliegen darauf zurückgreifen können. Beispielsweise kann man sich Pfründen mit mehr als 20 Mark Silber Jahreseinkünften heraussuchen lassen oder Personen, bei denen angegeben wird, daß sie jünger als 14 Jahre sind, oder Uneheliche mit einem Priester als Vater und einer unverheirateten Frau als Mutter: def. nat. (p., s.). Wünschenswert wäre, daß die bereits gedruckten Bände mit einem Scanner eingelesen werden, damit man ihre Angaben in ähnlicher Weise auswerten kann.
Da der Text lateinisch und abgekürzt ist, wodurch viele Flexionsformen wegfallen, kommt das Repertorium Germanicum TUSTEP entgegen. Eben deshalb lassen sich andererseits hier gemachte Erfahrungen nicht ohne weiteres übertragen. Dennoch treten einige Probleme bei allen spätmittelalterlichen und frühneuzeitlichen Urkunden, Kopial- und Registerbüchern, Lehenbüchern, Bürgerlisten und Rechnungen auf. Wie oft beklagt wird, kapitulieren Bearbeiter von Urkundenbüchern und Regesten in Deutschland häufig vor der ab etwa 1300 einsetzenden Materialfülle; TUSTEP könnte einen Ausweg aus dieser mißlichen Lage eröffnen.
Mit dieser Strategie mußten zwei Ziele erreicht werden:
Trotz dieser und weiterer Vorkehrungen ergaben sich bei fast allen Arbeitsschritten immer wieder neue Anforderungen, die erst bei der Registerarbeit selbst auftauchten, wie: Erzeugung von zusätzlichen Registereinträgen; Überführung von flektierten Formen in die Grundform; Sortierung der vorgefundenen graphischen Formen nach davon verschiedenen Ansetzungsformen.
Außerdem wurde klar, daß der für die "technische" Seite Verantwortliche äußerst vorsichtig mit den Daten umgehen mußte, da er nur einen kleinen Teil der sachlichen Anforderungen überblickte und daher den Herausgebern in jeder Phase die Möglichkeit geben mußte, auch seine Verständnisfehler aufzuspüren. So mußten speziell Entscheidungen, die auf Grund falscher oder unvollständiger Regeln getroffen wurden, wieder rückgängig zu machen sein.
Im Laufe der Bearbeitung der Register stellte sich außerdem heraus, daß die bei der Erfassung manuell vorgenommene Kennzeichnung der Registereinträge häufig unvollständig oder falsch war. Als Folge davon haben wir es als notwendig erachtet, zunächst - also zu Beginn der Registerarbeit - die Namen der genannten Personen und Orte an Hand einer unsortierten Liste auf Vollständigkeit zu prüfen und gegebenenfalls zu ergänzen.
Aus der Erfahrung, daß trotz manueller Vorarbeit alle Einträge kontrolliert werden mußten, und aus der Tatsache, daß der Repertorien-Text selbst stark formalisiert ist, ergab sich bald die Überlegung, für die weiteren Bände die Kodierungsarbeit zu sparen und zu versuchen, die Namen der Personen und Orte automatisch aus dem Text zu gewinnen. Dieses Verfahren wurde inzwischen bei der Registerarbeit zu weiteren Bänden des Repertorium erprobt.
Die erste Korrektur der Register-Einträge wird dann in der Datei durchgeführt, in der alle Orts- und Personennamen noch in der Reihenfolge stehen, in der sie im Text vorkommen. Vor jedem Eintrag steht eine Kodierung, die das zugehörige Register angibt, z. B: o: (Ort), n: (Name), ?: (Registerzuordnung ungewiß). Der Bearbeiter kontrolliert und korrigiert die Einträge in dieser Datei (bei Verschreibungen zusätzlich in der Text-Datei). Soll ein automatisch erzeugter Eintrag ganz gelöscht werden, so wird der Eintrag nicht aus der Datei entfernt, sondern durch "-:" als Registerkennzeichen markiert.
Nach der ersten Korrektur werden die Registereinträge per Programm auf die Dateien für die verschiedenen Register verteilt.
Für die Personennamen werden in einem zweiten Arbeitsschritt per Programm die flektierten Formen der Vornamen in den Nominativ überführt; gleichzeitig wird für jeden Bestandteil des Namens, der mit einem Großbuchstaben beginnt, durch die bereits erwähnte zyklische Permutation ein eigener Registereintrag erzeugt. Bei Personennamen, die eine Ortsbezeichnung enthalten, müssen auch entsprechende Einträge für das Ortsregister erzeugt werden. Diese werden, sofern automatisch erkennbar, mit einer entsprechenden Markierung versehen.
Nun werden die Registereinträge nach Regeln sortiert, die ein Zusammenführen gleicher, aber verschieden geschriebener Namen ermöglichen, wobei also z.B. th wie t behandelt, Doppelbuchstaben wie ein Einzelbuchstabe einsortiert werden. In das dabei entstehende Register wird außerdem eine Liste schon bekannter Zuordnungen von vorgefundenen Namensformen zu zugehörigen Ansetzungsformen in Form von Verweisen einsortiert, z.B.: Guillermus siehe Wilhelmus.
Es folgt ein weiterer Korrekturschritt, bei dem neben den übrigen Korrekturen die noch fehlenden Verweise auf Ansetzungsformen ergänzt und überflüssige als solche markiert werden.
Die in diesem so durchkorrigierten Register enthaltenen Verweise werden dazu benutzt, um per Programm jedem vorkommenden Namen seine Ansetzungsform beizugeben, nach der das Material anschließend sortiert wird. Die Verweise von der Textform auf die Ansetzungsform bleiben selbstverständlich erhalten.
Die hier eingeschlagene Strategie für die Zusammenarbeit zwischen einer mehr technisch orientierten Stelle einerseits und den Fachwissenschaftlern andererseits, die sich auf die sachlichen Fragen beschränken wollen und sollen, hat sich bei den Registern von Orts- und Personen-Namen bereits bestens bewährt. Prinzipiell die gleichen Regeln gelten natürlich auch für die Sachregister, auch wenn der Ausgangspunkt und die einzelnen Schritte der Arbeit sich in vielen Einzelheiten unterscheiden.
aus: Protokoll des 55. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 4. Juli 1992