Protokoll des 18. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 30. Juni 1979

 

Allgemeine Informationen

  1. Vom 12.-14. Dezember 1979 tagen die LDV-Fittings ("Kolloquium über Dialogsysteme und Textverarbeitung") und die ALLC (Association for Literary and Linguistic Computing) ("Problems and Methods in Lemmatisation") in Bonn.
  2. Die Arbeitsgemeinschaft philosophischer Editionen veranstaltet ihr 3. Internationales Rundgespräch "Aufgaben und Methoden philosophischer Editionen" vom 3.-5. März 1980 in Tübingen.

 

Berichte aus laufenden Editionsprojekten

 

Hans Walter Gabler, Charity Scott Stokes, Wolfhard Steppe
(Institut für Englische Philologie der Universität München)

Ulysses in EDV-unterstützter Edition

 
1. Zielsetzung

Die Ausgabe des Romans Ulysses (1922) von James Joyce ist eine kritische Textedition mit zweifacher Zielsetzung:

Das der Edition zugrundeliegende Konzept beruht auf weiterentwickelten und auf die spezifische Text- und Überlieferungssituation des Ulysses abgestimmten Prinzipien moderner Editionstheorie und -praxis in der anglistischen und germanistischen Editorik. Es ist unabhängig vom Einsatz elektronischer Datenverarbeitung entworfen worden. Doch gestattet die elektronische Datenverarbeitung die optimale Erfüllung der Grundanforderungen an Textgenauigkeit, Exaktheit der Dokumentation und Nachvollziehbarkeit editorischer Entscheidungen, welche an eine moderne wissenschaftliche Edition zu stellen sind. Daher wird die Editionsarbeit in jeder Phase - Texterfassung, Kollation, Textkonstitution, Druck - mit Hilfe des Systems der Tübinger Programme zur Textverarbeitung (TUSTEP) bewältigt.

2. Textsituation

Ulysses wurde - nach mehrjährigen, in ihren Materialien nicht mehr belegten Vorarbeiten - in einem Zeitraum von vier Jahren (Ende 1917 bis Ende 1921) kapitelweise geschrieben. Jedes Kapitel konsolidierte sich zunächst in einer letzten Entwurfsniederschrift. Hiervon wurde, zumeist, unmittelbar eine autographe Reinschrift angefertigt. Die erhaltenen Kapitelautographe - fünfzehn Kapitel in Reinschrift und drei Kapitel in letzter Entwurfsniederschrift - bilden heute die Sequenz des sog. Rosenbach-Manuskripts (R).

Gleichzeitig mit R in der Textentwicklung eines jeden Kapitels entstand ein fremdgefertigtes Typoskript (T), dem für neun Kapitel R selbst, für die weiteren neun aber die (nicht erhaltene, nachweislich jedoch gegenüber dem in R repräsentierten Textstand noch zusätzlich überarbeitete) letzte Entwurfsniederschrift (W = working manuscript) als Vorlage diente.

Damit steht R für die Hälfte der Kapitel außerhalb der direkten Linie der Textüberlieferung. Allerdings ist es für eben diese Hälfte der Kapitel möglich, aus dem gemeinsamen Zeugnis von R und T einen Grundtext und die letzten Revisionsschichtungen des nicht erhaltenen W zu erschließen.

T bildete durchwegs die Grundlage für die Umsetzung des Romans in den Druck.

Von einem (verlorenen) Durchschlag wurden 1918-1920 bereits vierzehn Romankapitel in Vorveröffentlichung in der amerikanischen Zeitschrift "The Little Review" (L) - und in Auszügen ebenfalls im englischen "The Egoist" (E) - publiziert.

Ein Mischexemplar aus Typoskriptoriginalseiten und -durchschlägen wurde zur Druckvorlage für die Buchveröffentlichung (1922). Sie ist für die ersten fünf Kapitel verloren, sonst jedoch fast durchgängig erhalten.

Den dokumentierten Textstand von R, bzw. den (aus dem gemeinsamen Zeugnis von R und T rekonstruierbaren) Textstand von W, revidierte James Joyce und erweiterte ihn bis zur Buchveröffentlichung um ca. ein Drittel. Dies geschah in handschriftlichen Zusätzen zu T und zu den Druckfahnen, welche bis zu neun sukzessive Revisionsstadien durchliefen.

Von W/R bis zu den Revisionen auf den jeweils letzten Druckfahnen liegt also - verteilt über eine Sequenz von Textträgern - der volle Romantext der Erstveröffentlichung in fortlaufender vielfach überschichteter, insgesamt überwiegend autographer Verzeichnung vor. Das "fortlaufende Autormanuskript" bildet den zu konstituierenden, kritisch zu edierenden und in seiner Textentwicklung darstellbaren Text der kritischen Ausgabe. Dabei bestimmt die beschriebene Textsituation die EDV-unterstützten Verfahren der Texterfassung, Textrezension und Textkonstitution.

3. Stütztext: Erfassung und Verarbeitung

Soll sich die Textkonstitution in stufenweiser kritisch kontrollierter Verknüpfung der gesamten handschriftlichen Verzeichnung des Textes vollziehen, so erfordert der Einsatz des Hilfsmittels der Datenverarbeitung einen die im Computer eingespeicherten Einzeldokumente übergreifenden konstanten Bezugs- und Referenzrahmen. Die publizierte Textgestalt des Ulysses in der Erstveröffentlichung von 1922 (22) - wenngleich von Überlieferungsvarianz überfremdet - repräsentiert den Werktext in seiner vollen Erstreckung und als das Ergebnis seiner Entstehung. Daher wird er als Rahmen und Stütztext für die kritische Textkonstitution verwendet.

Dazu ist seine Erfassung in exakter Wort- und Zeichentreue erforderlich. Diese wird durch eine Doppeleingabe erzielt. Zur Eingabekontrolle dient dabei nicht eine Reduplikation von 22, sondern der Neusatz des Romans von 1926 (26).

Ein automatischer Vergleich (Programm TXTVERGLEICH) deckt alle Unterschiede der Eingaben 22 und 26 auf. Im Rückvergleich per Hand mit den Vorlagen werden die Eingabeversehen im Vergleichsprotokoll zuerst markiert; dann werden sie mit dem Tübinger Texteditor am Bildschirm eliminiert. Die verbleibende Varianz stellt die echte Textdifferenz 22 : 26 dar, bei der im weiteren noch die Autor- von der Fremdvarianz zu trennen ist.

Um die ihm zugedachte Rolle im Editionsverfahren zu spielen, wird der wort- und zeichentreue Erstveröffentlichungstext 22 in Computerdateiform verdoppelt.

Eine Kopie (22K) dient als editionstechnischer Rahmen. In ihn wird der kritische Text eingepaßt, wobei der tatsächliche 22er Textzustand sukzessive "ausgehöhlt" wird: Schrittweise werden seine Wort- und Zeichenelemente überall dort ausgetauscht, ergänzt oder entfernt, wo sie von denen des fortlaufenden Autormanuskripts abweichen.

Eine zweite Kopie (22G) bleibt textlich unberührt; doch werden in ihr die in 22K veränderten oder ersetzten Elemente automatisch mit Markierungen versehen, welche Ort und Zeitpunkt des Eindringens der Abweichungen vom Autortext bezeichnen. Auch werden alle editorisch in den kritischen Text übernommenen Überlieferungsvarianten des Erstveröffentlichungstextes ausgezeichnet.

Damit lassen sich nach Abschluß der kritischen Textkonstitution aus einem maschinellen Vergleich des Editionsergebnisses mit 22G die lemmatisierten Apparate der zurückgewiesenen wie der akzeptierten Überlieferungsvarianz automatisch herstellen.

4. Textkonstitution I: Frühtextedition

4.1 Texterfassung (Frühtext)

Die Basis für die kritische Konstitution des fortlaufenden Autormanuskripts bildet R.

R wird vollständig, und bereits mit präziser diakritischer Auszeichnung seiner internen Revisionsschichtung, erfaßt. Zur Gewährleistung der Wort- und Zeichentreue wird zunächst eine dreifache unabhängige Handkollation, anschließend eine automatische Kollation mit dem ebenfalls vollständig erfaßten T durchgeführt. Die Typoskripterfassung bedarf ihrerseits einer eigenen Textkontrolle, insbesondere dort, wo T nicht von R abstammt, sondern gemeinsam mit R auf das verlorene W zurückgeht und daher eine höhere eigenständige Zeugenqualität besitzt. Als Doppeleingabe zu T dienen L und E.

Aus L/E lassen sich zugleich von den Überschichtungen im erhaltenen Typoskriptexemplar jene auktorialen Textveränderungen isolieren, welche bereits unmittelbar nach der kapitelweisen Herstellung von T durchgeführt wurden. Darunter befinden sich einige Autorrevisionen, die nicht in allen Typoskriptexemplaren eingetragen wurden und daher nur aus L/E wiederzugewinnen sind.

Darüber hinaus dient L dort als Vertreter von T, wo das Typoskript in Teilen ganz verloren ist.

In diesen eingegrenzten Bereichen wird zur zusätzlichen Eingabekontrolle noch der gesetzte Grundtext der ersten Druckfahnen (P = placards) erfaßt.

4.2 Edition (Frühtext)

Zur Sicherung der frühen Stufen des fortlaufenden Autormanuskripts ist demnach eine Dreifach-, z.T. eine Vierfachaufnahme realer Textzeugen erforderlich. Diese Mehrfachaufnahme erlaubt - und die Wechselfälle in der Stemmatik und der Zeugenerhaltung erfordern geradezu - unter Zugrundelegung von R als Basistext (copy-text in der Nomenklatur anglistischer Editorik) eine kritische Frühtextedition (F) als Unteredition im Editionsprozess.

Zur Vorbereitung der Konstitution von F werden mit dem copy-text R als Vergleichsgrundtext die Vergleichsfolgetexte T, L, [E,P] kollationiert (Programm TXTVERGLEICH, Modus S, mit Speicherung der Varianten in der Abfolge "[Lemma] Varianz" in separaten Varianzdateien). In der automatisch erzeugten Referenz sind die Einträge in den Varianzdateien alle auf den Vergleichsgrundtext bezogen. Im System TUSTEP kann daher einerseits mit dem Programm TXTVDRUCKE ein zeilenweise synoptisch koordinierter Paralleldruck der Zeugen hergestellt werden. Er dient als editorisches Hilfsmittel zur Übersicht über die gesamte Frühvarianz. Andererseits gestattet es das System durch die Formatisierung der Referenz, jeden Eintrag als Korrektur zur Abänderung des Vergleichsgrundtextes gemäß der varianten Lesart eines Vergleichsfolgetextes zu verwenden. Der Editionsvorgang stellt also praktisch eine kritische Durchsicht und Aussonderung des in den Varianzdateien gespeicherten Variantenmaterials dar.

In Ausdrucken der Varianzdateien werden alle Varianten, die sich zur genetischen Stufenbildung oder als Emendationen qualifizieren, angemerkt. Entsprechende Markierungen werden über Bildschirmkorrektur in den Dateien vorgenommen. Je Varianzdatei wird für alle infragekommenden Fälle von Varianz als Textentwicklung gemeinsam automatisch die Eintragsform "[Lemma] Varianz" als genetische Abfolge umformatiert und mit den entsprechenden diakritischen Abgrenzungszeichen versehen.

Die gesamte markierte und umformatierte Varianz wird in eine fortlaufende Korrekturdatei zu R zusammengefaßt. Sie wird mit dem Programm TXTKORRIGIERE (derzeit noch TEKO auf der Tübinger Anlage CDC 3300) in eine Kopie von R eingebracht. Das Resultat ist der genetisch geschichtete kritische Frühtext.

Wird eine gesonderte Ausgabe der Unteredition F gewünscht, so läßt sich für sie ein lemmatisiertes Lesartenverzeichnis der Frühtextzeugen aus einer automatischen Kollation mit F als Vergleichsgrundtext und R, T, L, [E, P] als Vergleichsfolgetexten herstellen.

5. Textkonstitution II: Edition des Revisionstexts

5.1 Texterfassung (Revisionstext)

F integriert das fortlaufende Autormanuskript bis zu dem in der Druckvorlage für L erreichten Textstand. Seine Weiterentwicklung wird aus den autorhandschriftlichen Änderungen, Streichungen und Zusätzen im Typoskriptexemplar, das für den Buchdruck als Vorlage diente, und in den sukzessiven Druckfahnen erfaßt.

Nur die autorhandschriftlichen Überschichtungen (nicht der fremdverzeichnete Grundtext) dieser Textträger werden berücksichtigt. Sie werden einzeln erfaßt (ausgenommen bleiben dabei jedoch alle zweifelsfreien Korrekturen von Tipp- und Setzfehlern, die zur vollen Wiederherstellung von Manuskripttext führen), in zeugenbezogenen Dateien zusammengefaßt und zeugenspezifisch automatisch mit diakritischen Abgrenzungszeichen versehen.

Ein einheitliches Referenzsystem der Einzeldateien - vom letzten invarianten Anschlußwort vor jeder Textveränderung wird die Seiten/Zeilen/Wortnummer aus 22 manuell ermittelt - erlaubt es, sie maschinell in ein fortlaufendes Verzeichnis (V1) der gesamten autorhandschriftlichen - und nun bereits schichtenmarkierten - Textveränderung von T bis 22 ineinanderzusortieren (Programme TXTSORTIERE/Standard-Sortierprogramm/TXTRAUSGABE).

Diese abschließende Phase der Manuskripttexterfassung bedarf ihrerseits der Eingabekontrolle. Sie erfolgt durch doppelte unabhängige Handkollation der Einträge und anschließende Maschinenkollation mit den den autorhandschriftlichen Textveränderungen entsprechenden Abschnitten in 22, durch welche zugleich die Einweisungsortung verifiziert wird.

5.2 Edition (Revisionstext)

Zu F wird ein Klartext FC hergestellt, in dem die Erststufen der in F verzeichneten Textentwicklung und der entsprechende diakritische Auszeichnungsapparat eliminiert sind.

FC eignet sich damit zur maschinellen Kollation mit dem editorisch unberührten Textzustand 22. Das Ergebnis ist ein komplettes, jedoch nicht nach Autor- und Fremdvarianz, und auch nicht nach deren Eingangsstufen, differenzierendes Gesamtverzeichnis (V2) der Textveränderung zwischen F und 22. (Programm TXTVERGLEICH, Modus K; FC als Vergleichsgrundtext und 22 als Vergleichsfolgetext wirft die Textveränderung als Plus-Text aus; der Parameter STA 1 liefert zu jeder Varianz maschinell die 22er Referenz.)

Enthielte 22 keine unkorrigiert gebliebene Fremdvarianz in seinem dem Frühtext entsprechenden Bereich, wäre V2 in seiner Erstreckung identisch mit dem nach Zeugen differenzierten V1. Tatsächlich ergibt sich ein Überschuß an Einträgen in V2, welcher Fremdvarianz in 22 darstellt. Hieraus werden zwei komplementäre Korrekturdateien zur Einbringung in 22K und 22G (s.o. unter 3) formatiert.

Nach Abzug des Eintragsüberschusses in V2 entsprechen sich V1 und V2 textlich. Da beide ein auf die S/Z/W-Zählung von 22 bezogenes Referenzsystem haben, können sie kombiniert und zu V3 ineinandersortiert werden.

Werden hierbei textlich korrespondierende Einträge nicht zueinandergeordnet, sind die Referenzen zu überprüfen, um zu entscheiden, ob eine Autoreinweisung durch die Setzer von 22 falsch befolgt wurde oder ein Fehler in der Referenz von V1 vorliegt.

Nach entsprechender Berichtigung ist jeder Eintrag in V3 doppelt vorhanden: mit manuell ermittelter Referenz (Rm) und transkribiertem Text (Tm) aus V1 und automatisch erzeugter Referenz (Ra)- und Textabfolge (Ta) aus V2. Die Doppeleinträge bilden Abschnitte. Das Programm TXTKOPIERE verknüpft aus ihnen Ra und Tm und eliminiert Rm und Ta.

Das ergibt eine Korrekturdatei zu 22K, welche dort die 22er Textgestalt gemäß der Referenz aus V2 durch den Text von V1 ersetzt. Sie wird in einem Arbeitsgang mit den Korrekturen zur Eliminierung der Fremdvarianz aus dem Frühtextbereich in 22K eingebracht.

Der Vergleich mit dem unangetasteten 22er Text deckt sodann die im V1-Bereich zu registrierende (und durch weitere Auszeichnungen in 22G zu vermerkende) Fremdvarianz sowie ebenfalls die Eingabeversehen des manuell erfaßten V1-Textes auf, welche am Bildschirm berichtigt werden.

6. Integration des fortlaufenden Autormanuskripts

22K ist nun zwar durchgängig frei von der Fremdvarianz der Textüberlieferung (sofern nicht aus ihr das fortlaufende Autormanuskript kritisch zu emendieren ist); doch ist die Schichtenauszeichnung zur Darstellung der Textentwicklung erst für die auf den Frühtext folgenden Phasen der Genese eingebracht.

Der Zeilenfall des erreichten Zwischenzustands von 22K wird daher so eingerichtet, daß der aus V1 einkorrigierte Revisionstext eigene Zeilen oder Zeilengruppen (Datei-Sätze) bildet, welche mit Zeilen oder Zeilengruppen alternieren, welche zusammen dem Frühtext entsprechen.

Dieser "Rumpftext" wird unter Beibehaltung von Zeilenfall und (Datei-)Satznumerierung extrahiert und als Vergleichsgrundtext gegen F als Vergleichsfolgetext kollationiert.

Das Kollationsergebnis ist dank der beibehaltenen S/Z/W-Numerierung unmittelbar als Korrekturdatei zum umformatierten 22K verwendbar. Sie bringt dort die Frühtextschichtenmarkierung ein. 22K stellt nun durchgängig den genetisch geschichteten Text des kritisch konstituierten fortlaufenden Autormanuskripts dar.

Zum Abschluß werden die aus den Folgeausgaben der Erstveröffentlichung ermittelten auktorialen Textveränderungen mit eigener genetischer Markierung eingearbeitet. Damit ist die kritische Textkonstitution der Ausgabe in ihrer Gesamtheit vollzogen.

7. Druck

In der Endgestalt wird 22K als die Synopse der darzustellenden Textentwicklung über die Tübinger Satzprogramme gedruckt. Die Synopse wird parallel angeordnet zum Lesetext der Ausgabe, der automatisch als Klartext aus 22K entsteht und selbst über die Satzprogramme in einer Form gedruckt wird, welche mit kapitelweise fortlaufender Zeilenzählung die Referenzgrundlage der Edition abgibt. Die maschinelle Kollation des zum Druck formatierten Klartextes/Lesetextes mit 22G erzeugt die lemmatisierten Apparate, welche, ebenfalls über die Satzprogramme, in zweispaltiger Anordnung appendiziert werden.

Diskussion

Der Unterschied zwischen dem neu edierten und dem bisherigen Lesetext besteht vor allem in zahlreichen Detailänderungen (z.B. Satzzeichen), die im Detail auch ein neues Verständnis begründen können. Offensichtliche, aber auch bisher unbekannte Fehler wurden dabei beseitigt. An etwa 50 Stellen sind Textergänzungen erforderlich, die aber selten mehr als drei Zeilen Umfang haben.

Das Projekt der Ulysses-Neuedition wurde im März 1977 in Angriff genommen. Bisher wurde das Verfahren der Edition erarbeitet und erprobt. Als Ergebnis wurde Mitte des Jahres die Probeedition eines Textausschnittes von etwa 30 Seiten fertiggestellt. Die Neuedition wird voraussichtlich bis zum Jahre 1982 abgeschlossen sein.

 
(Die Kurzfassung des Referates wurde vom Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 2. Mai 2002