Protokoll des 17. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 17. Februar 1979

Allgemeine Information

Ein Schwerpunkt der EDV-Anwendung in der Abteilung LDDV des ZDV Tübingen ist die Unterstützung der Herstellung von kritischen Editionen. Daher wird das Thema dieses Kolloquiums "Berichte aus laufenden Editionsprojekten" bei den nächsten Kolloquien wieder aufgenommen werden, u.a. durch Referate von Dr. Heinrich Schepers (Münster) über die Arbeit an der Leibniz-Edition und von Dr. Hans Walter Gabler (München) über die kritische Edition des "Ulysses" von James Joyce.

 

Berichte aus laufenden Editionsprojekten


 

Walter Simon (SFB 8: Spätmittelalter und Reformation)

Kritische Gesamtausgabe und Index-Band zum Sentenzen-Kommentar des Gregor von Rimini

Der Augustiner-General Gregor von Rimini veröffentlichte ums Jahr 1346 seinen Kommentar zu den Sentenzen des Petrus Lombardus (12. Jh.). Der Sentenzenkommentar ist in mehreren Handschriften erhalten, zu denen noch einige Frühdrucke hinzutreten, unter denen wiederum einer besondere Bedeutung hat, weil er der verlorenen Urschrift nahe zu stehen scheint, nämlich der Druck Venedig 1522. Die Wichtigkeit dieses Druckes beruht teils auf seinen reichen Randbemerkungen, teils auf der Tatsache, daß er Doppelfassungen einzelner Textstücke enthält, die man bislang als eine spätere Redaktion ansah, die sich aber im Laufe der Editionsarbeit großenteils als frühere Entwürfe erwiesen haben.

Da der Augustiner Gregor die philosophische Richtung des Nominalismus in einzigartiger Weise vertritt und seine Wirkung auf den Reformator Martin Luther, der demselben Orden angehörte, weitgehend unerforscht blieb, begann man Anfang der 70er Jahre in Tübingen (SFB8/PBO) mit der Edition des genannten Sentenzenkommentars, um erst einmal eine Grundlage für alle weiteren Fragestellungen der Lehrmeinung Gregors und seiner Wirkungsgeschichte zu schaffen: Die kritische Ausgabe ist auf 6 Textbände und einen Registerband berechnet. Da Gregors Sentenzenkommentar seit 400 Jahren nicht mehr ediert worden ist, bot sich jetzt die Notwendigkeit und die Chance zugleich, eine kritische Ausgabe zu erstellen, die allen Erfordernissen der kritischen Philologie gerecht wird:

  1. Gereinigter Text mitsamt den Doppelfassungen
  2. Angabe abweichender Überlieferung in einem Apparat (Variantenapparat)
  3. Nachweis von Zitaten, Anspielungen etc. (Testimonienapparat)
  4. Bewahrung der Marginalien der Handschriften in einem 3. Apparat
  5. Genaue Kennzeichnung der Doppelfassungen durch Leitbemerkungen und in einem 4. Apparat
  6. Lebende Kolumnentitel
  7. Zeilenzählung, auf welche die Varianten bezogen sind: zudem sollen Begriffe im Register-Band mit Seite und Zeile angegeben werden
  8. Kennzeichnung des Kolumnenwechsels der Ausgabe Venedig 1522 durch eine Virgel im Text und entsprechende Angabe am Rand
  9. Geometrische Zeichnungen, die den Handschriften zur Illustrierung des Textes beigegeben sind
  10. Register-Band mit einem Namen- und Autorenregister, einem Verzeichnis der Bibelstellen, einem Begriffsregister und einem Literaturverzeichnis.
Band 1 und 4 (letzterer bereits erschienen: Berlin 1979) enthalten zudem ausführliche Einleitungen, in denen die Textüberlieferung dargelegt ist und einiges zur Methode der Textgestaltung gesagt wird.

Die genannten Erfordernisse wurden mit dem Verlag de Gruyter abgesprochen und in mehreren Probedrucken realisiert, wobei alle auftretenden Schwierigkeiten berücksichtigt wurden, zusätzlich der folgenden: Kursivierung bei Anfang und Beginn der Doppelfassungen ("Additionen") und den Bemerkungen des Editors in den Apparaten, Kapitälchen mit Versalie bei Namen in den Apparaten, Punkt auf Mitte gelegentlich im Kolumnentitel, griechische Buchstaben in den Apparaten und in der Einleitung sowie halbfettes Alphabet in der Einleitung.

Das alles ließ sich verwirklichen, solange es sich um 4seitige Satzproben handelte, doch als der Druck eines 400 Seiten starken Bandes beginnen sollte, ergaben sich Schwierigkeiten, die samt und sonders mit der Kostenfrage zusammenhingen: Die auftauchenden Schwierigkeiten, teilweise auch bedingt durch die begrenzten Möglichkeiten des herkömmlichen Bleisatzverfahrens, sollten eine umbruchabhängige Zeilenzählung nicht ermöglichen, desgleichen keine Kursivierung im Text (die hochgestellten Buchstaben bei Varianten brauchten das Alphabet von a-z auf); beim Umbruch sollten die Apparate nur in Kolumnenform (neue Zeile für jede Variante) an den Fuß der Seiten kommen, also nicht in fortlaufenden, übergreifenden Zeilen, was beim Varianten-Apparat wegen der kurzen Textstücke zu erheblichen Freiräumen geführt hätte.

Das Tübinger Satzprogramm konnte hingegen alle Wünsche erfüllen. Zudem war hier die Möglichkeit gegeben, den schwierigen Umbruch maschinell vorzunehmen (a), die Varianten auf Zeilen zu beziehen und so die Exponenten von a-z zu unterdrücken (b) und schließlich jetzt schon den künftigen Register-Band vorzubereiten durch Speicherung des gesamten Wortmaterials und der Quellen. Die Normalisierung der Orthographie und der Zitierweise konnte außerdem an Hand von Wortlisten vorgenommen werden.

Ausgehend von einem definitiven Typoskript, bestehend aus drei Teilen (Text, Varianten, Quellen), wurde zunächst eine maschinenlesbare Abschrift angefertigt (OCR). Schwierigkeiten boten sich bei der Korrektur dieser Abschrift insofern, als die Steuerzeichen ein hohes Maß an Aufmerksamkeit beanspruchten; denn schon in diesem Stadium wurden die vier Apparate, sämtliche Überschriften und die Kolumnentitel erfaßt. Nach der Korrektur etwaiger Schreibversehen ging den Editoren eine Probebelichtung zu, die ein zweites Mal sorgfältig korrigiert wurde. Das Endprodukt waren dann seitenumbrochene montierbare Filme, die dem Verlag als Druckvorlage zugingen.

Diskussion

Zwei Themen standen in der ausführlichen Diskussion im Vordergrund:
  1. Die finanzielle Seite der Edition:
    Der Druck konnte in der gewünschten Form nur mit Hilfe der Satzprogramme realisiert werden, da der vom Verlag veranschlagte hohe Druckkostenzuschuß (mehrere zehntausend DM pro Band) für die Herstellung im Bleisatzverfahren von den zuständigen Gremien nicht zur Verfügung gestellt werden konnte. Der Verlag übernahm schließlich die Kosten für die EDV-unterstützte Herstellung selbst (pro Seite etwa 20 bis 25 DM). Dadurch fielen auch die Restriktionen für die Auflagenhöhe weg: statt - wie ursprünglich geplant - 500, betrug die Auflage jetzt 800 Exemplare. Ein Band kostet im Buchhandel 200 DM, wobei die Verlagskalkulation sich weniger an den Herstellungskosten als am Marktpreis orientiert.
  2. Die technische Seite der Edition:
    Der Hauptvorteil des Einsatzes der Satzprogramme liegt in der automatischen Herstellung der Wort- und Autorenregister. Dieses Registermaterial wird bereits jetzt ausgezogen und gespeichert. Nach Fertigstellung des letzten Bandes wird das Registermaterial zu allen sechs Bänden im Computer zusammensortiert. Die Arbeitsersparnis gegenüber konventioneller Karteiarbeit ist beträchtlich.
    Werden die zu edierenden Texte bereits auf einer früheren Stufe der Editionsarbeit maschinenlesbar erfaßt, als es bei diesem Projekt der Fall war, ergeben sich weitere Vorteile: KWIC- und Wortindices (mit Häufigkeitsangaben) werden automatisch hergestellt und helfen dem Herausgeber z.B. bei der Normalisierung von orthographischen Varianten und bei der Angleichung der Zitierweise von Namen. Am gespeicherten Text können laufend Korrekturen vorgenommen werden, bis der endgültige Text für die Edition vorliegt.
    Die wissenschaftliche Arbeit am Text mit dem Computer erfolgt zum Institutstarif. Nur der abschließende Lauf durch die Satzprogramme wird (bei Herstellung durch die Firma pagina) zum kommerziellen Tarif abgerechnet, der etwa das 43fache des Institutstarifs beträgt. Der Verlag kann bei diesem Verfahren außerdem weitgehend die redaktionelle Betreuung einsparen.

Ferner gab es einen regen Informationsaustausch über Methoden und Tricks beim Schreiben der OCR-Belege zur Erzielung eines einwandfreien Leseergebnisses auf dem Belegleser.

 

Sonderforschungsbereich 8 (Spätmittelalter und Reformation)

Teilprojekt Gesamtausgabe Johann von Staupitz

 

Richard Wetzel

Staupitz' "De exsecutione aeternae praedestinationis" -
Teilautomatisierter Satz einer lateinisch-deutschen Paralleledition

Zum Autor, zur Überlieferung seines vielgestaltigen Werks und zum - höchst disparaten - Editionsstand sei auf die "Einführung in die Gesamtausgabe" verwiesen (S. 3ff.).

Über die Einrichtung der Edition heißt es in der "Einleitung" (S. 45f): "Die Einrichtung dieser Edition wird bestimmt durch den Parallelabdruck von Original und Übersetzung, die jeweils ihrer Eigenart entsprechende unterschiedliche Apparate verlangen. Parallel sind nur die beiden textkritischen Apparate, die durch Lemmata mit Paragraphenziffer und Zeile auf den jeweiligen Text bezogen sind. Der kommentierende Apparat (Bibelstellen- und Quellennachweise, Verweisungen auf inhaltliche und sprachliche Parallelen bei Staupitz selbst, Sacherläuterungen und Hinweise auf Übersetzungsprobleme enthaltend) bezieht sich - durch Ziffern-Exponenten - naturgemäß überwiegend auf das lateinische Original, gelegentlich auch, seltener allein auf die deutsche Übersetzung. Zu dieser bietet ein vierter Apparat dem germanistisch nicht vorgebildeten Leser Verständnishilfen, auf die durch Buchstaben-Exponenten aufmerksam gemacht wird. Im übrigen reproduziert die Einrichtung der Edition, soweit möglich, das Erscheinungsbild der beiden ihr zugrundegelegten Drucke. Sie übernimmt deren Kapiteleinteilung und -überschriften, (stillschweigend korrigierte) Paragraphenzählung, sowie Marginalien. Diese in Originaltext und Übersetzung ausnahmslos auf Bibelstellen verweisenden Marginalien sind (nachprüfbar berichtigt) dem lateinischen Text beigegeben, und zwar am Innenrand, damit sie auf den deutschen mitbezogen werden können. Den Buch- und Kapitelangaben der Originaldrucke werden (in runden Klammern) die der Verse hinzugefügt. Ebenfalls sind die (teilweise ergänzten) Folio-Angaben der Drucke beigegeben."

Zum Problem wird dieser Paralleldruck zweier Texte (links: Original, rechts: Übersetzung) durch die Asymmetrie der editorischen Zutaten, vorab den umfangreichen kommentierenden Apparat (Sachapparat). Er ist normalerweise erheblich länger als der Sprachapparat zum deutschen Text und muß auf die jeweils rechte Seite hinübergeführt werden. Dadurch werden aber alle Stücke auf einer Doppelseite zu von einander abhängigen Größen: Es findet darauf nur soviel deutscher Text + Sprachapparat Platz, wie auch noch lateinischer Text + Sachapparat untergebracht werden kann. Die restlichen Stücke fallen bei der Verteilung weniger ins Gewicht: Am meisten tun das noch die textkritischen Apparate; bei den Marginalien ist zwar durch verringerte Satzbreite des lateinischen Textes der Platz grundsätzlich reserviert, aber die Höhe ihres Sitzes zeilen(umbruch)abhängig; für die Vergabe von Kolumnentiteln schließlich müßte der jeweilige Beginn einer neuen Seite schon bekannt sein.

Der Ausweg aus dieser Schwierigkeit liegt in einem Kompromiß zwischen voll automatisiertem Satz und Umbruch und manueller Puzzle-Arbeit :

  1. Schritt: Alle Hauptstücke werden mit dem Tübinger Satzprogramm glatt (d.h. nur mit Zeilen-, aber ohne Seitenumbruch) abgesetzt:
    • der lat. Text, in den zuvor die (im Endzustand durch Zeilenzahl und Lemma auf den Text bezogenen) Angaben des textkritischen Apparats mit entsprechender Codierung ebenso inseriert worden sind wie die Marginalien mit ihrer Codierung.
    • der dt. Text samt seinen entsprechenden Einschiebseln
      (Da die textkritischen Angaben sich in unserem Fall auf die Zeilen eines Paragraphen und nicht - wie standardmäßig vorgesehen - einer Seite beziehen sollen, wird ein Trick angewendet: Die Paragraphen werden behandelt, als wären sie Seiten, so daß das Satzprogramm die Bezugszeilen errechnen und automatisch in die Apparatadresse einsetzen kann. Es wäre nach unseren Erfahrungen besser gewesen, den lat. Text zunächst ohne Marginalinserate abzusetzen und erst in den fertig berechneten Zeilensatz die Marginalien von einer separaten Datei hereinzukopieren.
      Das Ergebnis des ersten Schrittes für den Text sind also kurze Pseudo-Seiten mit jeweils sofort anhängendem textkritischem Apparat.)
    • die Sach- und Sprachanmerkungen, bei deren glattem Satz sich keine vergleichbaren Aufgaben stellen.
  2. Schritt: Papier-Puzzle eines mit Kopien der Probebelichtung vorzuklebenden vorläufigen Umbruchs.
  3. Schritt: Am vorläufigen Umbruch orientierte Eingriffe in die glatt abgesetzten Dateien am Sichtgerät.
    Nachdem nunmehr feststeht, wo im zeilenumbrochenen Text jeweils eine neue Seite beginnen soll, kann für den endgültigen Durchlauf durch das Satzprogramm das Kommando für den Seitenwechsel - und damit auch für die Vergabe eines Kolumnentitels - an der richtigen Stelle eingefügt werden. Ebenfalls eingefügt werden die für die paragraphengleiche Parallelisierung der Texte noch allfälligen Leerzeilen. Die zum textkritischen Apparat gehörigen Zeilen werden - mit den im ersten Schritt errechneten Adressen - am Ende einer zukünftigen Seite durch Umstellen gesammelt.
  4. Schritt: Seitenmontage.
    Für die endgültige Doppelseiten-Montage hat nunmehr der Metteur nur noch vier Stücke zusammenzupassen: eine Seite lat. Text samt Kolumnentitel, Marginalien und textkritischem Apparat, die entsprechende Seite dt. Text mit den entsprechenden Zutaten, die zu beiden Seiten gehörenden Sachanmerkungen und die zur dt. Seite gehörenden Sprachanmerkungen.

Diese Simulation eines konventionellen Umbruchs hätte sicherlich noch weiter automatisiert werden können. Nur stellt sich angesichts der auch innerhalb dieses Projektes singulären Aufgabe eines solchen Parallelsatzes die Gegenfrage nach dem Verhältnis von Aufwand und Ertrag. Das Team sieht den Sinn von EDV-Einsatz in seiner Arbeit nicht in der Perfektionierung dieses Instrumentes selber, sondern in der weitestmöglichen Eigenentlastung von mechanischer Arbeit. Wo die Grenze liegt zwischen dem, was man unvermeidlicherweise eigenhändig tun muß, und dem, was einem die Maschine abnehmen kann, sieht natürlich der fortgeschrittene Anwender besser.
 

Wolfram Schneider-Lastin

Staupitz' "De exsecutione aeternae praedestinationis" -
Teilautomatisch lemmatisiertes Register (mit lateinischen Äquivalenten) zur frühneuhochdeutschen Übersetzung des Christoph Scheurl

Das hier vorgestellte, in Sujet und Form neuartige Glossar im Anhang einer zweisprachigen Text-Edition (Johann von Staupitz: "De exsecutione aeternae praedestinationis"; Christoph Scheurl: "Von der entlichen volziehung ewiger fürsehung") erschließt den vollständigen Wort- und Formenschatz einer frühneuhochdeutschen Übersetzung und präsentiert darüber hinaus die lateinischen Entsprechungen (Äquivalente) ihrer zeitgleichen Übersetzungsvorlage. Damit wird einerseits dieser zeitlich noch vor Luthers volkssprachlichen Schriften liegende deutsche Text für die lexikographische Auswertung bestmöglich aufbereitet, andererseits ein Hilfsmittel für alle Arten philologischer Beschäftigung mit ihm und - in der Konfrontation mit dem Wortschatz des lateinischen Originals - über ihn hinaus zur Verfügung gestellt. Hinsichtlich des Einsatzes der EDV kann diese Arbeit als ein Beispiel dienen für die Erstellung eines Registers zu einem Text, für dessen Sprache kein maschinenlesbares Lexikon zur Verfügung steht (wie dies etwa für die in Tübingen entstandene Vulgata-Konkordanz der Fall war).

Die Hauptschwierigkeit bei der Entstehung eines sogearteten Registers besteht in der Lemmatisierung, d.h. in der Zusammenfassung der vorgegebenen Wortformen sowie der gewünschten Fügungen unter eine Grundform, ein Stichwort (Lemma). Das ist neben dem philologischen - das, obwohl die meiste Arbeit verursachend, hier nicht ausgeführt werden soll - zunächst einmal ein technisches Problem.

Der Bearbeiter hat ein Verfahren entwickelt, das eine weitgehend automatische Zuordnung der Wortformen zu ihren Lemmata erlaubt, anders ausgedrückt: ein Verfahren, das ein zeitraubendes Hinzusetzen der Grundform zu jedem einzelnen Wort umgeht - der Text hat immerhin ca. 25.000 Wörter.

Aus Platzgründen können hier nicht alle Arbeitsschritte bis zum fertigen Register dargestellt werden. Nur der eigentliche Lemmatisierungsvorgang wird erläutert. Bei allen Operationen wurden die Tübinger Standardprogramme zur Textverarbeitung verwendet.

  1. Text
    Ausgangspunkt der Registererstellung ist der (von allen Satzzeichen, Registereinträgen, Satzsteuerzeichen) gereinigte deutsche Text, in dem die Blanks verdoppelt werden. In diesem Text soll zu jeder Wortform das entsprechende Lemma gesetzt bzw. jede Wortform durch sich selbst + ihr Lemma ausgetauscht werden.

  2. Austauschkarten
    Mit Hilfe der Standardprogramme wird eine alphabetische Wortformenliste erstellt, und aus dieser werden dann Parameterkarten für das Austauschprogramm vorbereitet.
    Beispiel:
    xx             : beschicht : beschicht/beschicht :
    Sodann wird das spätere, meist künstlich zu erschließende Lemma sozusagen in die Austauschkarte 'hineinkorrigiert' bzw. die Wortform nach dem Schrägstrich durch das Lemma ersetzt.
    Beispiel einer fertigen Parameterkarte für den Austausch:
    xx             : beschicht : beschicht/beschehen :

  3. Ausgetauschter Text
    Nach dem Lauf des Austauschprogramms geschieht mit dem stark aufgeblähten Text folgendes:
    1. Homographentrennung und dementsprechende Korrektur z.B.: sein (Verb) - sein (Possessivpronomen).
    2. Verba mit getrenntstehenden Präfixen (z.B.: ste auf) müssen in Form und Lemma verbunden werden.
    3. Eintragung der Fügungen. Fügungen werden dann - notwendigerweise - aufgenommen, wenn mehreren Wörtern im Deutschen ein lat. Äquivalent entspricht (z.B.: es beschicht widerstandt - resistitur). Die Fügungen werden bereits in diesem Stadium mit einem Stern (*) versehen, damit sie im späteren Registerartikel automatisch ans Ende geordnet werden.
    Der ausgetauschte Text hat jetzt folgende Gestalt (Beispiel):
    wann/wann
    die/der
    peen/pen
    schlechlich/schlechtlich
    nit/nicht
    angenomen/annemen
    wirdet/werden
    sunder/sunder(k)
    ir/ich
    alsvil/alsvil
    möglich/möglich
    ist/sein(v)
    *es=beschicht=widerstandt/widerstand
    beschicht/beschehen
    doch/doch
    on/on
    *on=entgelt/entgelt.

Nach der automatischen Vertauschung der Reihenfolge Form/Lemma in Lemma/Form ist die Lemmatisierung des Textes beendet; eine erste Rohform des Registers kann durch Sortieren erstellt werden, in die folgende weitere Zusätze - z.T. per Hand, z.T. per Programm - eingetragen werden:

  1. Alle erschlossenen Lemmata werden automatisch durch eine hochgestellte Null gekennzeichnet.
  2. Von Hand werden die lat. Äquivalente (bei Wechsel der Wortart oder bei Änderung in der Übersetzung in Klammern; z.T. mit Stellenangabe) eingetragen.
  3. Verweise auf andere Lemmata, Formen, Fügungen werden aufgenommen.
  4. Die Steuerzeichen für den Lichtsatz (die verschiedenen Schrifttypen, das Rechtsbündigsetzen der Äquivalente, die Kolumnentitel etc. betreffend) werden automatisch eingesetzt.
  5. Die Registerdatei durchläuft die Satzprogramme und wird auf Film belichtet.

Die Gestalt des endgültigen Registers mit seinen verschiedenen Schrifttypen und seiner graphischen Gestaltung ist hier leider nicht reproduzierbar. Kopien einzelner Seiten können jedoch Interessenten zugesandt werden; ebenso steht der Bearbeiter für weitere Erläuterungen zur Verfügung.

Diskussion

Zur Registerherstellung: Wenn bei der Redaktion der automatisch erstellten Rohform eines Registers viele Umstellungen notwendig werden, besteht die Gefahr, daß die Kontrolle bzw. der Überblick verloren geht und sich dadurch Fehler einschleichen.

Grundsätzlich stellt sich nach Fertigstellung dieser Edition, die durch ein ausgeklügeltes Zusammenspiel manueller und automatisierter Arbeitsschritte zustandegekommen ist, die Frage, ob und wie die hierbei erworbenen Erfahrungen und Kenntnisse für spätere Projekte nutzbar gemacht werden können. Auch durch die Beschreibung des Verfahrens in der Einleitung der Edition oder in einer ausführlicheren Darstellung (etwa im Rahmen eines Aufsatzes) kann nur ein Teil der Erkenntnisse, und dieser nur unvollkommen, weitervermittelt werden.

 
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 22. April 2002