Protokoll des 10. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 26. Juni 1976

 

Georg Steer (Seminar für Deutsche Philologie, Universität Würzburg)

Erwartungen eines Textherausgebers von der EDV.
Erfüllte und erfüllbare Forderungen

Die Möglichkeiten, EDV bei der Edition von mittelalterlichen deutschen Texten zu nutzen, sind vielfältig. Allerdings verlangt die Ausnutzung der durch EDV gebotenen Hilfsmittel auch eine beträchtliche Umstellung des editorischen Verfahrens.
  1. Bisher wurden in erster Linie Indizes und Register von bereits editorisch fertigen Texten, von edierten Texten, gemacht. Will man Indizes für die Texterstellung nutzen, um zu sicheren und objektiveren textkritischen Entscheidungen zu kommen, ist es vorteilhaft, zunächst einen vorläufigen, "unsauberen" Text (Handschriften-Abschrift) zu machen, dessen Elemente (Wörter, Wortformen) nach verschiedenen, vom Editionsziel her gesteuerten Gesichtspunkten aufzulisten (Häufigkeit, Belegstellen) und mit Hilfe dieser Listen den "unsauberen" Text "nachzubessern". Aus der Übersicht aller Wortbelege lassen sich erkennen:
    1. im graphematischen (orthographischen) Bereich:
      Sonderschreibung oder Schreibfehler (1 megen gegen 30 mögen);
    2. im morphologischen Bereich:
      genereller und abweichender Gebrauch;
    3. im lexikalischen Bereich:
      Varianz der Worte und Wortformen sowie deren Authentizität (lebend : lebendig);
    4. im syntaktischen Bereich:
      bestimmte Satzmuster, Satzanfänge, Nebensatzkonstruktionen, Textgliederungszeichen (Interpunktion);
    5. generell:
      durch die alphabetische Auflistung Fehlentscheidungen des Editors, fehlerhafte Abschriften und Texteingaben (ischof - bischof).
  2. Mit Hilfe von EDV ist es möglich, jede gewünschte (Editionsziel) Sprachgestalt des zu edierenden Textes mit geringstem Arbeitsaufwand zu erzielen (Graphemmanipulation):
    1. einen nach der Grammatik normalisierten mittelhochdeutschen Text (Meister Eckhart-Ausgabe);
    2. einen nach dem vorherrschenden Gebrauch der Leithandschrift ausgeglichenen Text (1 ablass, 3 ablazz, 4 ablas, 59 ablaz: Ausgleich aller Belege nach ablaz);
    3. einen in der Schreibweise historisch getreuen Text nach einer Leithandschrift mit beigefügter Graphem-, Morphem- und Lexemanalyse.
  3. Unterstützung kann EDV aber auch bieten bei folgenden Phasen der editorischen Arbeit:
    1. beim Sammeln der Textzeugen (tabellarische Auflistungen; Vollständigkeit des Textbestandes, etwa bei reich-überlieferten Vokabularen des Spätmittelalters);
    2. beim Kollationieren von Texten nach einer Bezugshandschrift (Formalisierung der überlieferten Textvarianz nach Textzusatz, Textersatz, Textumstellung, Textauslassung);
    3. beim Ordnen von Variantenreihen innerhalb der Überlieferung (Stemma);
    4. beim Erstellen von Auswahlregistern und Glossaren zum edierten Text (vgl. das Protokoll des 9. Kolloquiums am 14.2.1976);
    5. beim Synoptisieren von Textfassungen: im Satz wie beim auswertenden Vergleich.

Eine Reihe der hier angedeuteten Möglichkeiten muß allerdings in der Praxis erst noch erprobt werden.

 
 

Paul Sappler (Deutsches Seminar)

Vor-Überlegungen zur Textaufnahme
(Codierungsprobleme im Hinblick auf Edition)

Das Kurzreferat ging von der Erfahrung aus, daß man sich als Philologe nur schwer in ein vorgegebenes Kodierungssystem hineinfindet; man kann sich nicht vorstellen, wie die weitere Verarbeitung vor sich geht, und man will bei der Datenaufnahme dann doch Dinge berücksichtigen, für die es bis zu diesem Augenblick keine Standardkodierung gibt. Besonders leicht hat man es, wenn man selbst programmiert und seine Konventionen in dem Rahmen, den die verwendeten Grund- und Anschlußprogramme bieten, selbst festlegt. Immer noch günstig ist es, wenn man die wesentlichen Schritte der Verarbeitung durchschaut. Jedenfalls aber ist es von Nutzen, über Umkodierungsmöglichkeiten Bescheid zu wissen; man erweitert damit seinen durch wirkliche und vermeintliche technische Zwänge begrenzten Spielraum.

Es wurden mehrere Arten von Überführung eines Textes aus einer Kodierung in eine andere herausgehoben; für den größeren Teil von ihnen gibt es hier in Tübingen schon Standardprogramme:

  1. Umsetzung von Zeichen in andere Zeichen,
  2. Umsetzung von Zeichenketten in andere Zeichenketten,
  3. dasselbe unter Berücksichtigung der Stellung und der Umgebung, wobei Gruppen von Zeichen in Tabellen vorgegeben werden.

Oft ist verschieden umzukodieren je nach der Stellung von Textpartien innerhalb oder außerhalb von Anfangs- oder Schluß-Steuerzeichenketten (Klammern); eine Rolle spielen auch Anordnungsmarken, die nicht in Zeichenketten, sondern in eine bestimmte Aufteilung und Anordnung des Textes umzusetzen sind (und umgekehrt).

Der Nutzen leichten Umkodierens liegt darin, daß man für jede Art der Beschäftigung mit dem Text diesen in eine geeignete Form bringt: für Schreiben, Korrigieren, Durchsuchen und Aufschlüsseln nach Merkmalen, Setzen und vieles andere. Auch muß dann nicht jede Einzelheit der Auswertung vorher geplant werden, nur sollte man keinen ungedeckten Zuwachs an Informationen erwarten.

Zum Beispiel braucht man sich bei der Textaufnahme nicht auf den kritischen oder einen Lesetext oder den diplomatisch wiedergegebenen Text als alleinigen Gegenstand der Verarbeitung festzulegen; wo sich das eine aus dem anderen nicht per Programm herstellen lassen will (dies ist das Gewöhnliche), kann man einen 'mittleren Text' aufnehmen, aus dem sich durch Umkodierung die genannten Ausprägungen erzeugen lassen, ohne daß die Aufnahme in jedem Fall überlastet werden müßte.

Diskussion

In einem kurzen Beitrag schilderte G. Fichtner seine Erfahrungen bezüglich des Codierungsproblems. Schwierigkeiten entstünden auf zwei Ebenen:
  1. psychologisch:
    Man lerne am besten, wenn man sich an Vorhandenes anschließt - später könne man individuell vorgehen;
  2. technisch:
    Es sei unumgänglich, mit verschiedenen Medien zu arbeiten, wodurch z.B. beim Übergang von der Schreibmachlne (OCR) auf das SIG51 die Codierung zu ändern sei. (Als praktisch erweist es sich, darauf zu achten, daß man für die Codes Zeichenfolgen wählt, bei denen Groß/Kleinschreibung nicht allzu häufig abwechselt).

Ott wies auf die Entstehungsgeschichte der Tübinger Code-Vorschläge (die für Eingabedaten für das Satzprogramm verbindlich sind und teilweise deshalb auch in anderen Programmen bevorzugt unterstützt werden) hin, die an die verschiedenen jeweils vorhandenen Daten-Eingabe-Medien gebunden ist: Lochstreifen-Schreibmaschine, OCR, SIG51, Lochkarte für Korrekturzwecke und Programme/Programmaufrufe (Parameter).

Fichtner bedauerte mangelnde Kompatibilität der verschiedenen Eingabemedien, was den Herstellern zum Vorwurf gemacht werden könne.

Sappler schlug als Alternative zur "starken Anlehnung" an vorhandene Codierungs-Anweisungen vor, sich beim Start eines Projektes zu überlegen, welche Anforderungen an die Codierung gestellt werden, und anhand vorhandener Anweisungen sich eine optimale Codierung zusammenzustellen. Das Ausnützen der Variabilität der Codes führt oft zu erheblicher Vereinfachung und folglich größerer Fehlerfreiheit in der Erfassung.

Die Diskussion ergab, daß die Frage der unterschiedlichen Code-Vorschriften auch an der personellen Ausstattung eines Projekts orientiert werden sollte: Je nachdem, ob jemand allein arbeite oder mit Schreibkräften (mit jeweils verschiedenen Aufgaben), gelten andere Überlegungen.
Beispiel: Doktoranden einerseits (die nur ihr eigenes Projekt bearbeiten) und Datentypistinnen andererseits (die auf die Dauer an verschiedenen Projekten arbeiten).

Die Praxis am ZDV war bisher, daß die Codes bei Beratung nach den Erfordernissen eines Projektes vorgeschlagen wurden (u.U. auch mehrere verschiedene Code-Vorschriften, wobei aber die Aufgaben möglichst sauber zu trennen sind).
 

(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 19. März 2002