Aus dem Protokoll des 56. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 21. November 1992

 

Thomas Rommel (Tübingen)

Akkumulation als Stilphänomen in Lord Byrons epischem Gedicht Don Juan.
Eine computerunterstützte Textanalyse.

Fragestellung

Das Stilphänomen der Akkumulation soll am Beispiel des Gedichts Don Juan von Lord Byron identifiziert, lokalisiert und anschließend klassifiziert werden. Durch die computerunterstützte Aufbereitung des Textes sollen Aussagen über Form, Art, Auftreten, Häufigkeit und Wirkung dieses rhetorischen Mittels gemacht werden.

Der Text wird nach literaturwissenschaftlichen Kriterien analysiert und interpretiert, wobei durch eine umfassende Untersuchung der verwendeten Stilmittel die Wirkung des Gedichts auf den Leser transparent zu machen ist. Dafür wird Don Juan mit Hilfe des Computers für die literaturwissenschaftliche Analyse und Textinterpretation so aufbereitet, daß unterschiedliche Fragestellungen durch die genaue Untersuchung der jeweils relevanten Textpassagen erschöpfend beantwortet werden können. Besonders quantitativ aufwendige Analysen können so systematisiert und übersichtlich gestaltet werden. Damit sind einzelne Schritte der Beispielfindung sowie das Interpretationsergebnis nachvollziehbar und überprüfbar. Neben der Verwendung spezieller TUSTEP-Kommandos liegt das Hauptaugenmerk dabei auf den Einsatzmöglichkeiten weit verbreiteter und überall zugänglicher Standardsoftware, in diesem Fall WordPerfect 5.1 in der DOS-Version.

Der Begriff der Akkumulation in der Literaturwissenschaft

Der Begriff der Akkumulation, von lat. accumulatio = Anhäufung, ist der terminus technicus der Literaturwissenschaft für Worthäufungen, also auffällig dicht beieinander stehende Wörter einer Liste oder Reihe, die meist einen gemeinsamen Nenner haben: Entweder sind sie syntaktisch-grammatikalisch von gleicher oder ähnlicher Form oder sie sind vom semantischen Gehalt her bedeutungsgleich oder sie deuten alle auf einen gemeinsamen Bezugspunkt. Die Akkumulation kann verschiedene syntaktische Formen annehmen: Sie tritt auf als asyndetische und polysyndetische Reihung. Ein Asyndeton ist z.B. veni, vidi, vici. Beim Polysyndeton kommt eine Konjunktion hinzu, und oft entfällt dadurch das Komma: und wiegen und tanzen und singen dich ein.

Akkumulation in Lord Byrons Don Juan

Der subjektive Leseeindruck des Gedichts vermittelt das Bild eines von Reihungsphänomenen dicht durchsetzten Textes, wobei die meisten Akkumulationen syntaktisch parallel arrangiert sind und bestimmte Themenfelder meist weitläufig etablieren. Dabei handelt es sich in der Regel um deutlich hervortretende Listen und Aufzählungen, die entweder durch Konjunktionen oder Interpunktion oder durch Kombinationen von beidem markiert sind. Sie umfassen mindestens drei Einzelelemente (z.B. Don Juan liebt Wein, Weib und Gesang). Die Untersuchung schließt Begriffspaarungen mit nur zwei Begriffen (Sie war blond und schön) aus.

Diese mehrgliedrigen Akkumulationen durchziehen das Gedicht Don Juan vom Anfang bis zum Ende, wobei thematische Schwerpunkte nicht auf Anhieb feststellbar sind.

Lord Byron veröffentlichte die ersten zwei Cantos seines Gedichts Don Juan im Jahr 1819. Nach dem enormen Erfolg dieser ersten 440 Strophen setzte er die Arbeit an seiner epic satire bis zu seinem Tode 1824 fort und veröffentlichte 16 abgeschlossene sogenannte Cantos, der 17. blieb mit 14 Strophen unvollendet. Don Juan ist ein episches Gedicht von ca. 130.000 Wörtern, das entspricht 500 Druckseiten, verteilt auf 17 unterschiedlich lange Cantos. Die Cantos sind etwa vergleichbar mit Kapiteln und stellen inhaltlich abgeschlossene Episoden dar, meist mit Einleitung und Schluß. Die Cantos haben jeweils zwischen 80 und 200 Strophen, so daß sich der Gesamttext aus insgesamt fast 2.000 Strophen zusammensetzt.

Die einzelnen Strophen des Haupttextes sind gleichförmig aufgebaut und bestehen aus jeweils acht Zeilen, wobei das metrische Muster und besonders das Reimschema die Stanzen als Ottaverime Strophenform zu erkennen geben. Das Reimschema lautet "ab ab ab cc"; die Zäsur nach der 6. Zeile betont das schließende Reimpaar besonders stark. Nicht nur formal, sondern auch inhaltlich ergibt sich so eine spezifische Struktur der jeweiligen Strophe, angelegt in der äußeren Form: In den ersten zwei Zeilen wird das Thema etabliert, dann folgt eine Darstellung bzw. die Ausbreitung alternativer Möglichkeiten, und in den schließenden zwei Zeilen sieben und acht erfolgt dann meist epigrammhaft die Rückwendung auf das Anfangsthema. Metrisch sind die Verse als jambische Pentameter gestaltet.

Eine typische Passage aus dem Gedicht: Don Juan kommt als Fremder nach England, und der Erzähler etabliert die Atmosphäre:

  <C 11; S 74>
1 Our hero, as a hero, <252#1-2/6> young and handsome,
  Noble, rich, celebrated, and a stranger, </>
  Like other slaves of course must pay his ransom
  Before he can escape from so much danger
5 As will environ a conspicuous man. Some
  Talk about <253#6-7/5> poetry and "rack and manger"
  And ugliness, disease, </> as toil and trouble -
  I wish they knew the life of a young noble.
   
  <C 11; S 75>
  They are young, but know not youth (it is anticipated),
10 Handsome but wasted, rich without a sou.
  Their vigour in a thousand arms is dissipated.
  Their cash comes from, their wealth goes to a Jew.
  Both senates see their nightly votes participated
  Between the tyrant's and the tribunes' crew.
15 And having <254#7/5> voted, dined, drank, gamed, and whored, </>
  The family vault receives another lord.

Methodischer Zugriff

Ziel der Untersuchung ist es, Methoden des computerunterstützten Filterns zu finden, die asyndetischen und polysyndetischen Reihungen zu markieren und mit dem entsprechenden Kontext auszusortieren, damit sie später interpretiert werden können.

Dabei soll nicht nach gleichförmigen Kriterien innerhalb der einzelnen Akkumulationselemente gesucht werden, sondern die Suche wird auf Interpunktion oder Konjunktion in Verbindung mit einem vordefinierten Wortabstand konzentriert. Am Beispiel bedeutet das: Wird nach Wörtern gesucht, die unmittelbar aufeinander folgen und ein gleiches Präfix oder Suffix mitführen (z.B. *ed als Kennung des past tense in Z. 15), so entgehen dieser Art des Suchens alle jene Reihungsphänomene, die kein gemeinsames Merkmal auf der Oberfläche mit sich führen wie z.B. die Aufzählung von Adjektiven in Zeile 1 und 2.

Gesucht wird folglich nach gehäuftem Auftreten von Komma, Konjunktion sowie einer möglichen Kombination von beidem, wobei ein bestimmter Wortabstand mitzuberücksichtigen ist. An schematisierten Beispielen der möglichen Akkumulationsphänomene wird deutlich, nach welchen speziellen Erscheinungsformen gesucht wird. Allgemein formuliert ist die Suchanforderung für das Asyndeton so zu stellen: Finde im Gedicht Don Juan alle jene Textteile, die in einem auf Länge definierten Bereich eine auffällige Häufung von Kommata und/oder Konjunktionen im Verhältnis zur Wortzahl aufweisen.

Dieses Suchkriterium ist mit mindestens einer Bedingung zu formulieren: Erst wenn eine Reihe von drei unmittelbar aufeinanderfolgenden beliebigen Wörtern durch zwei Kommata, die das zentral positionierte Wort eingrenzen, unterbrochen ist, soll die Fundstellen als potentielle Akkumulation markiert und mit Positionsangabe (Canto/Strophe) und mehrzeiligem Kontext aussortiert werden.

Theoretisch stellen sich die Suchmuster für typische asyndetische und polysyndetische Reihungen folgendermaßen dar:

Asyndeton:

1 XXX , XXX , XXX
- Medals, ranks, ribbons, lace, embroidery, scarlet / Are things immortal to immortal man
   
2 xxx XXX , xxx XXX , xxx XXX
- The time, the clime, the spot, where I so oft
   
3 XXX XXX , XXX XXX , XXX XXX
- True knights, chaste dames, huge giants, kings despotic

Polysyndeton:

4 XXX and XXX and XXX
- she had recourse to nods and signs / And smiles and sparkles of the speaking eye
   
5 XXX , XXX and XXX
- White, cold and pure, as looks a frozen rill
   
6 XXX and XXX , XXX and XXX
- With joy and sorrow, hope and fear

Markier- und Codiervorgehen

In den Text sind als Positionskennzeichen der Strophenanfänge bereits Cocoa- bzw. SGML-Referenzen eingefügt: in Spitzklammern gesetzte Informationen über Canto-Strophenanfang <C 1; S 34>. Die uniforme Markierung hat den Vorteil, daß TUSTEP z.B. auf Absätze zurückgreifen kann; es wird über den Parameter AA (Anfang einer Texteinheit) so jede Strophe als eigenständiger Absatz definiert, damit auch zeilenübergreifende Akkumulationen erfaßt werden. Vor jeder Strophe steht "<C ", und diese Information genügt als eindeutige Kennzeichnung für TUSTEP.

Das Sortierverfahren umfaßt mehrere Durchgänge, deren Ergebnisse jeweils in unterschiedliche Dateien geschrieben werden. Diese Ergebnis- oder Funddateien Akku1, Akku2, Akku3 etc. werden anschließend manuell überarbeitet, wobei die jeweils vom Computer als potentielle Akkumulation erkannte Worthäufung der besseren Übersichtlichkeit halber markiert ist. Wenn die Fundstelle individuell überprüft und als gültige Akkumulation bestätigt wurde, kann im Gesamttext Don Juan mit dem Einfügen der Codierungen begonnen werden.

Vor der entsprechenden Fundstelle, also vor dem ersten Element des Clusters, wird halbautomatisch eine Referenz <252#1-2/6> eingefügt: Halbautomatisch bedeutet, daß im Editor über ein Makro ein Basiscode (Spitzklammer auf, individuelle Clusternummer, #, Schrägstrich, Spitzklammer zu) erzeugt wird, das abhängig von der Fundstelle der Akkumulation zu positionieren und anschließend manuell zu ergänzen ist. Dazu wird die entsprechende Strophe am Bildschirm angezeigt, und der Benutzer ruft ein Editormakro auf, das den Basiscode an der aktuellen Cursorposition in die Strophe einfügt. Automatisch nicht feststellbare Informationen wie etwa Ausdehnung der Akkumulation und Anzahl der einzelnen Glieder werden dann manuell über den bereits richtig positionierten Cursor in die Referenz eingefügt. Anschließend wird hinter das letzte Element der Akkumulation die Endekennung </> eingesetzt.

Zum Aufbau der Codierung: Jeder Cluster führt eine individuelle Referenznummer mit, die immer weiter hochgezählt wird, aber nichts über die Position im Text aussagt. Die Textposition wird darum nicht über die individuelle Referenznummer angegeben, da nach jedem Suchdurchlauf nach einem neuen Häufungskriterium eine höhere Nummer vergeben wird, so daß die höchste Nummer nicht automatisch am Textende steht. Der Vorteil von fest mitgeführten Referenznummern liegt in der Klassifizierbarkeit der Fundstellen: So lassen sich die Akkumulationen separat auch nach unterschiedlichen Kriterien katalogisieren. Es kann eine Liste mitgeführt werden, in der z.B. alle Häufungen abstrakter Werte zusammengruppiert sind, oder alle Adjektive werden katalogisiert.

Auf die Referenznummer folgt direkt das Nummernzeichen (#) als eindeutige Markierung nur für Akkumulationen, damit z.B. ein Zählprogramm alle # innerhalb eines bestimmten Bereiches zählt oder damit später die graphische Umsetzung erleichtert wird. Das Nummernzeichen wird ausschließlich in der Codierung der Akkumulation verwendet. Im Anschluß an die Referenznummer und das Nummernzeichen folgt die Position, also die konkrete Zeilennummer der vom Cluster belegten Zeilen innerhalb der Strophe. Bei versübergreifenden Häufungen werden Ausgangszeile und Endzeile angegeben, jeweils durch Bindestrich getrennt. Auf die Angabe der Position folgt schließlich die Anzahl der einzelnen Cluster-Elemente als Zahl nach einem Schrägstrich, gefolgt von der schließenden Spitzklammer rechts, die das Ende der Codierung angibt.

Durch die feststehende Reihenfolge der Informationsfelder in der Codierung ist es möglich, die einzelnen Elemente in einem weiteren Durchlauf automatisch zu extrahieren, um z.B. daraus dann Wortlisten zu erstellen, Häufigkeiten festzustellen oder die Begriffe thematisch zu sortieren.

Typische Fehler

Durch den automatischen Zugriff entstehen naturgegeben Fehler. Es bietet sich aber an, lieber mehr mögliche Fundstellen einschließlich des relevanten Kontextes maschinell auszugeben, da sich der tatsächliche Umfang durchaus noch manuell überarbeiten läßt, als daß der Versuch unternommen wird, von Anfang an fehlerfrei unter Berücksichtigung aller Sonderfälle zu sortieren. Viele "falsche" Fundstellen, die zwar maschinell erfaßt, aber bei der anschließenden Überarbeitung wieder verworfen wurden, verlaufen nach dem Schema "Nomen, gefolgt von zwei nachgestellten Adjektiven", die der Computer entsprechend der Suchzeichenfolge als Reihung einsortiert.

Weitere Probleme ergeben sich bei der Behandlung der vielfältigen Fundstellen direkter Rede: häufige Interjektionen mit den eingeschobenen Namen der angesprochenen Personen sind typische Fundstellen für Pseudo-Akkumulationen.

Das Phänomen der Reihung ohne Konjunktion oder Interpunktion, also die theoretisch denkbare Variante der direkten Akkumulation (he walked loved dined lived ever after) kommt im Text nicht vor. Der Test wurde mit #KOPIERE ausgeführt, wobei identische Prä- und Suffixe über Elementverweise im Parameter ZF+ als Akkumulationskennung verwendet wurden.

Verteilung der Akkumulation

Durch den Einsatz unterschiedlicher KOPIERE-Durchläufe mit jeweils leicht veränderten Parametern konnten im gesamten Text des Don Juan insgesamt 566 unterschiedliche Akkumulationsphänomene isoliert werden, also im Schnitt pro (Druck-) Seite mindestens eine Akkumulation. Die formale Analyse der Clusterverteilung im Gesamttext bzw. in den einzelnen Cantos, ihre individuelle Länge, was die Anzahl der Einzelelemente betrifft, die genaue Position innerhalb der Strophe sowie die Auflistung des gesamten in den Reihen verwendeten Vokabulars und dessen spezifische Verteilung konnten von diesem Moment an automatisch ausgelesen werden.

Durch die Kennung der spezifischen Position der Akkumulation in der jeweiligen Strophe (die Codierung enthält nach dem Nummernzeichen eine Angabe über die Zeilennummer des Fundortes) können jetzt leicht Zahlenwerte für Clusterhäufigkeit ermittelt und auf das Schema der achtzeiligen Ottaverime-Strophe übertragen werden. Das Verarbeiten von Zahlenwerten aus einem Text ist eine besondere Spezialität des KOPIERE-Kommandos in TUSTEP, da mit dem Parameter LIV und den anschließbaren Rechenoperationen über den Parameter RR sehr komfortabel Zahlen aus dem Text ausgelesen werden können, mit denen dann - im gleichen Arbeitsgang - beliebige Berechnungen angestellt werden können.

Zahlen können auch mit WordPerfect erfaßt und verarbeitet werden; allerdings muß dazu der Cursor jeweils genau positioniert werden, um die Zahl über eine Blockfunktion in eine Variable einzulesen, deren Wert erst nach dieser zeitraubenden Überführung für Rechnungen eingesetzt werden kann.

Die Einbindung von Zahlenwerten bietet sich an dieser Stelle an, da durch den besonderen Aufbau der Strophe der Verdacht naheliegt, daß sich Akkumulationen in den letzten beiden Zeilen der 8-zeiligen Strophe, also dem schließenden Couplet, mit größerer Häufigkeit finden. Der Leser hat zudem den Eindruck, daß dazu am Strophenanfang zur Etablierung des Strophenthemas verstärkt Akkumulationen zu finden sind. Beide subjektiven Beobachtungen harmonieren mit den traditionellen Vorstellungen vom typischen Aufbau einer Ottaverima-Strophe und scheinen sich bei der Lektüre des Don Juan bestätigt zu finden. Aus der Datenauswertung wird deutlich, daß sich die Verteilung tatsächlich mit der Beobachtung während der Lektüre deckt und auch mit traditionellen Konzepten des Strophenbauplans der Ottaverime übereinstimmt.

Die Implikationen für eine Interpretation der Funktion der Akkumulation sowie der thematischen Einordnung der einzelnen Glieder sind weitreichend: Wenn Häufungen geballt an funktional zentralen Positionen im Textcorpus auftreten, scheint es sich bei diesem Stilphänomen um mehr als nur sprachliches Füllmaterial zu handeln. Den an den argumentativen Angelpunkten der Strophen positionierten Clustern kommt eine besondere Bedeutung zu, z.B. bei der Etablierung neuer semantischer Felder. Aus diesem Grund ist die Untersuchung des in den Reihungen verwendeten Vokabulars sowie des jeweiligen thematischen Bezugspunktes von entscheidender Bedeutung für das Verständnis des Gedichts. Man kann dann davon ausgehen, daß sich innerhalb der Akkumulationen ein großer Anteil der Begrifflichkeit findet, die die Assoziationen des Lesers steuert und somit die Wirkungsabsicht des Textes in nuce verdeutlicht. Das systematische Auszählen der spezifischen Position der Akkumulation deutet hier schon an, daß in der Analyse und Interpretation des Stilphänomens Akkumulation in Don Juan möglicherweise ein Zugang zum Verständnis des Gesamttextes angelegt ist.

Untersuchung der Einzelelemente

Eine erst quantifizierende und dann qualifizierende Untersuchung der Einzelelemente aus den Akkumulationen kann jetzt einsetzen. Um diese aus dem Gesamttext des Don Juan zu extrahieren, werden alle Wörter, die zwischen einem einleitenden Nummernzeichen und der Cluster-Endecodierung </> stehen, in eine Datei kopiert und anschließend nach absteigender Häufigkeit aufgelistet.

Hier ist ein Vergleich der eingesetzten Arbeitsmittel aufschlußreich: WordPerfect extrahiert im Normalfall über eine Makro-Such- und Kopierschleife in vier Minuten, sortiert dann eine weitere Minute lang die einzelnen Einträge, kann aber anschließend keinen automatischen Index für die ausgewählten Begriffe erstellen. Darum muß man sich an dieser Stelle behelfen: Das Programm bietet eine Funktion zum Sortieren einer systemeigenen Datenbank (z.B. für Adressen, Literaturangaben, Lagerbestände etc.), wobei die einzelnen Datensätze global nach jeweils isoliert stehenden, von Blanks eingeschlossenen Strings durchsucht werden können. Dieses Verfahren wird z.B. bei der Verwendung komplexer Serienbrieffunktionen mit umfangreichen (= informationsreichen) Datensätzen, die viele Datenfelder enthalten, eingesetzt. Definiert man jetzt den gesamten Text des Don Juan als Datenbank und formatiert die Akkumulationen durch Austauschoperationen als separat stehende Datensätze, dann kann über die eingebaute Sortierfunktion in knapp 30 Sekunden eine neue Datei aus dem Ursprungstext extrahiert werden, die nur die Akkumulationen enthält. WordPerfect merkt in diesem Fall nicht, daß es nicht Adreßfelder für Serienbriefe sortiert, sondern stilistische Phänomene filtert.

TUSTEP braucht für alle diese Operationen die Kommandos Register-Vorbereite (#RVORBEREITE), #SORTIERE und Register-Aufbereite (#RAUFBEREITE) sowie 12 Sekunden CPU-Zeit.

Fazit: WordPerfect arbeitet schnell, wenn man eine Bürofunktion umdefinieren kann, aber vergleichsweise umständlich und langsam bei problemorientierten Makros. TUSTEP dagegen arbeitet sehr schnell, ist sehr kurz, präzise und übersichtlich über Parameter zu programmieren und bietet bei weitem den besten problemorientierten Zugriff.

Ziel der eben beschriebenen Arbeitsschritte ist das Erstellen einer detaillierten Auflistung aller Wörter, die in den Clustern enthalten sind. Diese Wortliste präsentiert alle in den Akkumulationen gefundenen Wörter, also auch Artikel, Pronomina und Konjunktionen. Bei einer Gesamtzahl von über 3.500 Wörtern in dieser Liste entfallen so auf jede Häufung im Schnitt gut sechs Wörter.

Während für eine Stilanalyse in der Regel die Untersuchung der hapax legomena interessant ist, zeigt sich bei der Auflistung der Cluster-Elemente deutlich, welcherart die zentralen Kernbegriffe im Don Juan sind. Tatsächlich finden sich ein Großteil abstrakter Nomina mit hohen Häufigkeitswerten wie love, war, time, pride, fame, glory, virtue, ambition und wealth, gefolgt von Adjektiven, die sich auf den Helden Don Juan oder eine seiner Partnerinnen beziehen: young, bright, soft, fair, rich, beautiful und handsome. In dieser Aufstellung, die lediglich Häufigkeiten listet, erscheinen nicht thematisch zusammengruppierte Begriffe wie lange Listen weiblicher Kleidungsstücke, die weiter unten auf der Tabelle verstreut in den hapax legomena zu finden sind. Zumindest aus den Häufigkeiten der Einzelelemente kann auf einen kohärenten, wenn nicht stereotypen Darstellungsmodus in den Akkumulationen geschlossen werden, der sich erst bei der Untersuchung der jeweiligen Bezugswörter erschließt. Mit Bezugswort ist jener Begriff gemeint, der sich als Thema zur Akkumulation etablieren läßt: die Person, Institution oder Sache, auf die sich die Einzelglieder der Wortreihen beziehen. Die Verbindung zwischen Häufung und jeweiligem Thema muß unter individueller Berücksichtigung des Kontextes geschehen und läßt sich nicht automatisieren.

Der Held des Gedichts, der junge Don Juan, ist mit 69 allein auf ihn bezogenen Akkumulationen am häufigsten als thematischer Bezugspunkt vertreten und macht exemplarisch deutlich, daß das Phänomen der Akkumulation im Don Juan mit einer Vielzahl personal ausgerichteter Akkumulationen ein primär zur Personencharakterisierung eingesetztes Stilmittel ist. Im Rückgriff auf die vorher extrahierte Datei der verwendeten Einzelelemente läßt sich ein nach Inhaltskriterien strukturierter Katalog entwerfen, der die jeweils verwendeten Begriffe der Akkumulationen thematisch gruppiert und untersucht, welche Werte, Qualitäten oder Eigenschaften quantitativ dominieren:

Die Abstrakta liegen an erster Stelle, gefolgt von den Akkumulationen, in denen sich Gegenstände aufgereiht finden. Da hier der Anteil der als pars pro toto zu klassifizierenden Begriffe sehr hoch ist, wird die Grenze zwischen Abstrakta wie "Ehre" oder "Leidenschaft" zu referentiell gebrauchten Begriffen aus der Gruppe der Gegenstände wie "Gold" für konkretes Geld bzw. das Konzept "Reichtum" fließend. Diese unscharfen Übergänge zwischen den beiden Gruppen vermitteln das Bild eines hauptsächlich um Vorstellungskreise und Konzepte herum organisierten Aufbaus der Cluster. An dritter Stelle liegen Akkumulationen, die Eigenschaften von Personen auflisten, und die immer noch erstaunlich umfangreiche Gruppe der Namen macht die große Aktualität des Gedichtes zum Zeitpunkt seines Erscheinens deutlich, denn viele Personennamen, die als hapax legomena auftauchen, beziehen sich auf Politiker und Dichter, die das damalige Tagesgeschehen beherrschten.

Auf die genauere Untersuchung und Interpretation dieser Gedichtpassagen für das Textganze soll hier nicht weiter eingegangen werden, da der computerunterstützte Aspekt der Untersuchung im Vordergrund steht. Der Computer mit TUSTEP und WordPerfect dient bis hierher der vollständigen Erfassung und Aufbereitung des Gedichts. Die literaturwissenschaftliche Interpretation setzt danach ein, wenn das Datenmaterial vollständig nach vordefinierten Kriterien durchsucht ist. Anschließend an das computerunterstütze Identifizieren, Lokalisieren und Extrahieren kommt die statistische Umsetzung bzw. die graphische Aufbereitung der isolierten Phänomene. Auch dieser Aspekt der Arbeit wird größtenteils durch den Computer ausgeführt. Die auf die so präparierten, isolierten Einzelphänomene aufbauende literaturwissenschaftliche Analyse und anschließende Interpretation greift dann nicht mehr auf den Computer zur Ergebnisfindung zurück, sondern findet im Rahmen der traditionellen theoriegebundenen Textinterpretation statt.

Das Ziel ist nicht die vielgefürchtete maschinell erstellte, computerisierte Gedichtinterpretation, sondern die computerunterstützte Textanalyse.


aus: Protokoll des 56. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 21. November 1992