Protokoll des 33. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 9. Februar 1985

 

Allgemeine Information

Im Zentrum für Datenverarbeitung (ZDV) läuft seit Anfang dieses Jahres der Nachfolgerechner des TR440, eine BASF 7/88 unter dem IBM-Betriebssystem MVS. TUSTEP wird auf dem neuen Rechner nicht vor Mitte 1985 zur Verfügung stehen.
 

Paul Sappler (Deutsches Seminar)

Initien-, Namen-, Stichwort-Register zum Repertorium des Meistergesangs

"Das Repertorium der Sangsprüche und Meisterlieder des 12. bis 18. Jahrhunderts", so der volle Titel der bevorstehenden Publikation, hat die Aufgabe, eine besonders lange Gattungstradition zu erschließen. Sie umfaßt die Sangspruch- und Lieddichtung der mittelalterlichen "Meister" seit dem späten 12. Jahrhundert - höfischer Berufsdichter, wie Walther von der Vogelweide und Michel Beheim, und zahlreicher anderer, oft anonymer Autoren in unterschiedlichen sozialen Situationen - und die Lieder des städtischen, vorwiegend von Handwerkern getragenen und vor allem durch Hans Sachs geprägten Meistergesangs des 15. bis 18. Jahrhunderts. Die Einheitlichkeit der Gattungstradition ergibt sich nicht zuletzt aus der Verwendung eines spezifischen Strophentyps, der gesungenen Spruchstrophe, und aus der Übung, "Töne", das sind Strophenformen samt zugehöriger Melodie, immer wieder zu verwenden.

Erhalten ist nicht wenig: etwa 17500 Texte, nur zum kleineren Teil gedruckt, ein Material, das nicht unberücksichtigt bleiben sollte für Literatur- und Zeitgeschichte, vergleichende Erzählforschung, die Geschichte der Musik und Musiktheorie, die der handschriftlichen und gedruckten Überlieferung, die der Frömmigkeit und der Bildung (Literarisierung des Stadtbürgertums, Rezeption scholastischer Theologie und Philosophie, humanistischer Bildung und reformatorischer Glaubenslehre).

An dem Projekt wird mit Förderung der Deutschen Forschungsgemeinschaft seit 1974 in zwei Arbeitsstellen in Nürnberg und Tübingen gearbeitet. Es werden zunächst Kataloge hergestellt, im Zentrum ein Liedkatalog, das ist eine beschreibende Aufnahme der Lieder und Liedüberlieferungen nach einem festen Schema, das aber doch die Mitarbeiter in ihren Ausdrucksmöglichkeiten nicht zu stark einschränkt; die wichtigsten Einzelrubriken der Liedaufnahme sind (im älteren und im jüngeren Teil leicht unterschiedlich):

Die "mittelstarke" Strukturierung dieser Daten ist bestimmt von den Erfordernissen der Darbietung im Druck. Die Kataloge sind aber auch Grundlage für Register zu den meisten Rubriken - Register, die vorläufig als Arbeitsmittel für die weitere Aufnahme und die inhaltliche und redaktionelle Durcharbeitung dienen; zum (bald bevorstehenden) Abschluß des Ganzen sollen diese Register großenteils - dann in einer dem Benutzer zumutbaren Form - gedruckt werden.

Die Druckvorbereitung überhaupt und die Registerherstellung geschehen mit Hilfe des Programmpakets TUSTEP, dessen Standardprogramme ergänzt sind durch Fortran-Programme meist aus der Frühzeit des Projekts, die aus Aufrufen von TUSTEP-Unterprogrammen bestehen. Es ist positiv anzumerken, daß die spezifischen Verfahren, Programme und Folgen von Programmaufrufen einerseits immer wieder leicht verändert und verbessert werden konnten, andererseits aber in ihren wesentlichen Zügen zwei Maschinenwechsel überstanden haben.

Es seien hier einige wenige Besonderheiten und Probleme der Registerherstellung skizziert:

1. Den einzelnen Liedüberlieferungen sind Kennungen zugeordnet, nach denen sie sortiert sind und die in den Registern als Referenzen (Stellenangaben) dienen. In ihnen ist festgehalten:

Beispiele:
1Bop/2/503c (2 ist die Nummer des Tons im Boppe-Teil);
2S/2829 (2829 ist die Liednummer im Sachs-Teil);
2S/689a/7 (689a bezeichnet einen Liedzyklus).

Weil nun also, wie deutlich wird, die Kennungsteile nicht immer alle erscheinen und Zahl und Reihung von Buchstaben- und Zahlenteilen unfest ist, weil ferner zur typographischen Differenzierung später Kleindruck und Hochstellung genutzt werden, sind die Kennungen so schwer sortierbar wie viele Bibliothekssignaturen der Vor-EDV-Zeit (schwierig auch die Von-Bis-Zusammenfassung aufeinander folgender Stellenangaben dieser Art im Register). Trotzdem hat es sich gelohnt, die Schwierigkeiten zu lösen, sind doch diese Referenzen viel sprechender als eine einfache Numerierung und dazu nicht länger als jeweils sinnvoll.

2. Ein Initienregister, das nach den normalmittelhochdeutschen Reimen angeordnet ist, existiert, wird aber aus Platzmangel wohl nicht veröffentlicht werden. Ausgangspunkt für seine Herstellung sind die ersten Liedverse samt Reimpartnern, die überlieferungsgetreu aufgenommen und mit Steuerzeichen für die Erzeugung des normalmittelhochdeutschen Wortlauts versehen sind. Daraus werden mittels Programm solche Sortiereinheiten gebildet:

Beispiel:
a - az - waz - haz -
Armuot ich wil niht wizzen waz : haz -
Armut jch wil nicht wissen was : haß -
1Frau/10/106a.3

Bemerkenswert ist, wie einfach die Regeln für das Ermitteln des Reimtyps (dann unschwierig auch des Reimklangs) in TUSTEP formuliert werden können. In den allermeisten Fällen genügt eine Abfrage auf die Kombination eines Vokals (auch Langvokals oder Diphthongs) mit fakultativen Konsonanten und einem ebenfalls fakultativen Endungsteil, der mit (unbetontem) e beginnt: alle drei Dinge sind in kurzen Tabellen festgehalten; selten muß im Programm das Vorliegen bestimmter kompletter Reimwörter geprüft werden, noch seltener ist vorherige Markierung in den Daten nötig.

3. Die Namenrubriken enthalten in der Regel standardisierte Namen; es bestand aber das Bedürfnis, einigen von ihnen als ganzen oder auch einem ihrer Teile die überlieferte Form beizugeben. Diese Formen sollten in den Registern nicht nur in Gestalt eines Verweises auftauchen, sondern auch vor allem beim Verweisziel, dem eigentlichen Namenartikel, erscheinen, ohne daß hier allerdings der Name mit einer Variante in einem neuen Haupteintrag nach dem Namen ohne diese oder nach demselben Namen mit einer anderen Variante stehen sollte. Insbesondere Namenvarianten im Innern der Sortiereinheit stören aber beim Zusammenfassen des Zusammengehörigen im Register. Die Lösung besteht darin, die Varianten vor dem Sortieren ans Ende der Sortiereinheiten zu stellen und erst nach dem Zusammenfassen wieder nach vorn an ihren Platz zu transportieren.

4. Das Register der Inhaltsstichwörter enthält neben einfachen Begriffen auch Kombinationen von solchen, und zwar in bloßer Reihung wie in syntaktischer Verbindung. Damit diese Kombinationen auch in anderer Reihenfolge der Begriffe ohne besonderen Aufwand ins Register gelangen, sind die Einträge mit Steuerzeichen versehen, aufgrund derer sie vervielfacht und jeweils umgeformt werden.

Manche der angedeuteten Lösungen sind erst nach einigem Probieren gefunden worden. Es ist hervorzuheben, daß ein gutes Werkzeug wie das Tübinger System von Textverarbeitungs-Programmen (TUSTEP) zum Weitersuchen und Verbessern des Verfahrens anregt.

Literatur

Brunner, Horst: Das Repertorium der Sangsprüche und Meisterlieder. Über ein Forschungsprojekt.- In: LiLi 9 (1979) H. 34, S. 130-141.

Wachinger, Burghart: Ein Tönekatalog zu Spruchdichtung und Meistergesang.- In: Maschinelle Verarbeitung altdeutscher Texte. Beiträge zum dritten Symposion. Tübingen 1980, S. 156-166.

Siehe auch das Protokoll des 11. Kolloquium am 20.11.1976
 

Ulrich Rebstock (Orientalisches Seminar)

Katalogisierung arabischer Handschriften aus Mauretanien

Der hier besprochene Versuch, Kurzbeschreibungen arabischer Handschriften aus Mauretanien in Katalogform zu bringen, ist eine Notlösung. Seit 1978 finanziert die Deutsche Forschungsgemeinschaft (DFG) unter dem obigen Titel ein Forschungsprojekt am Orientalischen Seminar der Universität Tübingen in Zusammenarbeit mit dem "Institut Mauritanien de Recherche Scientifique" (IMRS) in Nouakchott / Mauretanien. In siebenjähriger Sammelarbeit wurden 2.500 arabische Manuskripte (ca. 300.000 Folio) auf Mikrofilm gesichert. Den zweiten Schritt zu vollziehen, nämlich die Auswertung, Zusammenstellung und Veröffentlichung des überwiegend noch unbekannten Textmaterials in Katalogform, verhindert vorläufig noch der libanesische Bürgerkrieg: Die mit dem Druck der ersten vier Bände des deutscharabischen Handschriften-Kataloges beauftragte Beiruter Druckerei wurde mehrfach ausgebombt .

Als mittelfristiger Ausweg bot sich mit Hilfe des Tübinger Textverarbeitungsprogramms die Erstellung eines Rohkatalogs an, von welchem Band I (MS-Nr. 1-1000) vorliegt, Band II (MS-Nr. 1001-2250) im Laufe des Jahres erscheinen wird.

Der Rohkatalog zerfällt in zwei Teile, den Katalog- und den Registerteil.

Aus der Sicht der Datenverarbeitung bietet der Katalogteil keine besonderen Probleme. Die Eingabe der sieben Untereinheiten (MS-Nummer; Autor; Titel; Thema; Datum der Kopie- bzw. Originalabfassung; Ort der Aufnahme; Umfang, Zustand) umfassenden Handschrifteneinheiten erfolgt mit OCR-A, für Band II mit OCR-B. Die ASCII-Codierung ermöglicht die Wiedergabe aller notwendigen Sonderzeichen für die Transkription des arabischen Textes. Ein Formatiere- und Satzprogramm bringt die Beschreibungseinheiten in die adäquate äußere Form.

Etwas schwieriger gestaltet sich die Erstellung des Registerteils: Ein umfangreiches Programm erzeugt aus den eingegebenen Handschriftenbeschreibungen vier getrennte Register (Register der Autoren, der zitierten Autoren, der Stammes- und Gruppennamen; Register der Titel, der zitierten Titel; Register der Themen und Unterthemen; Register der Aufnahmeorte, der Bibliotheks- und Besitzernamen). Die einzelnen Registereinträge werden jeweils direkt aus den entsprechenden Untereinheiten der Handschriftenbeschreibungen durch Kopieren mit dem TUSTEP-Baustein KOPIERE gewonnen.

Die Darstellung der Personennamen orientiert sich an der Dreiteilung (laqab, ism, nisba) der arabischen Namensform. Jedem Eigennamen werden - soweit in der Quelle angegeben - zu seiner Eingabeform Verweise beigegeben. So treten bei den Personennamen Verweise auf bis zu drei laqab-Formen, seine ism-Form und bis zu fünf nisba-Formen hinzu (1). Die Umstellung der Namensteile, ebenso der Ausgleich phonetischer (z.B. Vokalassimilationen) und grammatikalischer (z.B. status constructus) Änderungen erfolgen innerhalb des Programmablaufs. Ein einfaches System von Steuerzeichen legt diese Namens- und Verweisformen bei der Eingabe fest.

Auch im Titel zitierte Autoren (Kommentare, Subkommentare) werden so behandelt. Zur Unterscheidung zwischen Originalen und Zitiertem ist ein anderer Schrifttyp verwendet.

Numerische Verhältnisangaben beim Themen- und Ortsregister geben zusätzlich Aufschluß über die quantitative Verbreitung der einzelnen Themen bzw. die Bibliotheksgröße in Bezug auf das Gesamtmaterial des Rohkatalogs.

Die Sortierung der Registereinträge geschieht entlang dem arabischen Alphabet. Im Verlauf dieser Katalogarbeiten sind Überlegungen in Gang gekommen, eine Druckausgabe in arabischer Schrift im Tübinger Zentrum für Datenverarbeitung einzurichten.

Die Basis ist hierzu mit der Schaffung eines Alphabets gelegt, welches durch eine lineare Transliteration des arabischen Textes unter Zuhilfenahme des lateinischen Alphabets und eines zusätzlichen Sonderzeichens (2) die Textumwandlung ökonomisch und laiengerecht bewältigt.

Anmerkungen

(1) vgl. hierzu das elaborierte System von Fedwa Malti-Douglas und Geneviève Fourcade: The Treatment by Computer of Medieval Arabic Biographical Data.- (= Série Onomasticon Arabicum 6) Biographies - Colloques - Travaux Préparatoires, Institut de Recherche et d'histoire des Textes, Editions du CNRS, Paris 1976, S. 39 ff.

(2) vgl. die umständlichere Lösung mit 5 Sonderzeichen von Pierre A. Mackay: TEX for Arabic Script.- In: 6th International Conference on Computers and the Humanities 1983, S. 391-400

 
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 30. Oktober 2002