I.
Es ist offensichtlich, daß beim Computereinsatz in der
Klassischen Philologie derzeit die textbezogenen und
textwissenschaftlichen Aspekte und Interessen dominieren.
Zwar besitzen die auf dem Gebiete der Sprachwissenschaft
und Linguistik, bedauerlicherweise ohne nennenswerte
Beteiligung seitens unserer Disziplin, erzielten
Fortschritte (namentlich in der automatischen Sprach- und
Syntaxanalyse) auch für die Klassische Philologie nicht zu
unterschätzende Bedeutung, werden jedoch derzeit erst noch
in geringem Umfange genützt. Im Bereich der
interpretierenden Literaturwissenschaft bleibt dagegen
beherrschend, was man eine "holistische" Sehweise genannt
hat, und nicht zuletzt aus diesem Grunde sind die Ansätze
zu einer Algorithmisierung des methodischen Zugriffs noch
nicht sehr weit gediehen. Für die Literaturwissenschaft
beschränkt sich daher der Nutzen, vorläufig
wenigstens, auf Hilfestellung bei der Textarbeit und bei Literaturrecherchen.
Im vorliegenden Zusammenhang ergibt sich somit eine Konzentration auf "Text" und "Textwissenschaft", wobei das Nebeneinander bereits eine Differenzierung andeutet, die begrifflich trivial, für die Art des Computereinsatzes (und auch für die Ansprüche an die Software) dagegen keinesfalls belanglos ist: "Text" bezieht sich dabei in erster Linie auf das Medium (Kommunikationsmittel) und bezeichnet alle Arten von Dokumentation und von Textbeständen, wohingegen es der "Textwissenschaft" um Text als Objekt und um alle Formen des wissenschaftlichen Umgangs mit Text, um Textanalyse und (nicht zuletzt) um Textedition geht.
Bezogen auf die Möglichkeiten des Computereinsatzes ergeben sich daraus wesentliche Unterschiede. Im Falle von "Text" zielt der Einsatz auf die Oberfläche des Textes, auf seine Erstellung und Manipulation: Der Computer fungiert als Schreibmaschine mit enorm gesteigerter Leistungs- und Speicherfähigkeit "problem- und lösungsunterstützend". Der textwissenschaftliche Einsatz ist forschungsbezogen und richtet sich auf die inneren Strukturen des Textes; ferner gestattet er, über vertiefte Analysen hinaus, die Abfolge der einzelnen methodischen Schritte zu koordinieren und, soweit dies mit den verfügbaren Programmen sinnvoll verwirklicht werden kann, auch zu automatisieren; es können weiterhin Fragestellungen, die bisher aus arbeits- und mnemotechnischen Gründen nicht zu leisten waren (wie die systematische Abfrage und Analyse extrem großer Textkorpora), in Angriff genommen und Kombinationen in Erwägung gezogen werden, welche eine Vielfalt automatisierbarer linguistischer Methoden (Analysen im Bereich der Morphologie, der Syntax, des Lexikons usw.) in die Textarbeit als "sprachliches Kontextwissen des Computers" miteinbeziehen: Der PC fungiert damit als Forschungsinstrument "problem- und lösungsmodellierend".
II.
Versucht man nun, die Einsatzmöglichkeiten auf dem
PC-Niveau etwas konkreter zu charakterisieren, so geht es
zunächst in einem elementaren Sinne um "Textverarbeitung",
wie sie für die Bürokommunikation usw. entwickelt worden
ist, allerdings mit der für die philologische Arbeit
entscheidenden Erweiterung um fremdsprachliche
Zeichensätze wie etwa den des Griechischen mit allen
diakritischen Zeichen.
1. Die Textverarbeitung gliedert sich dabei in drei Teilbereiche:
Zu a.: Für die Texterstellung muß die Software alle Schreibfunktionen zweisprachig bereitstellen (Positionierung der Schreibstelle, Einfügungen, Löschungen, automatische Sicherung, Fuß- und Endnotenverwaltung, multiple Textverarbeitung in "Fenstern", Druckerausgabe usw.).
Für b. haben als wichtigste Komponenten einer elementaren Oberflächenanalyse zu gelten: Suchroutinen, Ersetzungsroutinen, Feststellung von Rekurrenzen, automatische Erstellung von Wortlisten und Indizes, Rechtschreibungsprüfung, stilistische Hilfen.
Zu c. gehören auf dieser Ebene: Verwaltung und Zugriff auf umfassende Datenbestände, Einsatz von Massenspeichern.
2. Für die bei der wissenschaftlichen Textarbeit, besonders bei der kritischen Edition, anfallenden Aufgaben bringt die unter 1. skizzierte Schreibtechnik schon erhebliche Erleichterungen, nützt aber noch längst nicht alle Möglichkeiten, die für eine "gehobene" Verwendung des Computers charakteristisch sind. Dies betrifft insbesondere die Verknüpfung und Koordination von Einzelschritten der Textverarbeitung, gepaart mit einer Systematisierung und Automatisierung der methodischen Schritte, wofür als Beispiele anzuführen sind: die Verwaltung kritischer Apparate und ihre Koordination mit dem Text, die Systematisierung wiederkehrender methodischer Schrittfolgen (wie konkomitanter Eintrag in Wortlisten, Standardisierung der druckgraphischen Gestaltung, automatische Kollation u.ä.).
Die meisten Softwareangebote sind den Erfordernissen der reinen Textverarbeitung (gemäß 1.) durchaus gewachsen. Für die unter 2. skizzierten Aufgaben stehen noch kaum Fertigprodukte zur Verfügung, die den fachspezifischen Anforderungen in jeder Hinsicht entsprechen. Soweit es Lösungen gibt, sind sie meist "partikulärer" Natur und können nicht ohne weiteres von der (philologischen) Allgemeinheit genutzt werden. Der Philologe kommt so ohne eigene Programmierkenntnisse (oder die seiner Mitarbeiter) nicht aus. Andererseits genügt es für viele der notwendig werdenden "partikulären" Lösungen, wenn das benutzte Textverarbeitungsprogramm selbst eine gewisse Programmierbarkeit aufweist und die Einrichtung automatisch ablaufender Sequenzen von Einzelschritten erlaubt, wenn es also über "Makros" verfügt. So sehr der Zwang zur Programmierung, auch in bescheidenem Umfange, auf den Computer-Neophyten abschreckend wirken mag, so deutlich zeigt die Erfahrung, daß mit wachsender Vertrautheit gerade auch das Interesse an der Makrofähigkeit wächst und diese sich am Ende als unentbehrliche Hilfe erweist.
In der Vergangenheit warf die Bildschirmdarstellung eines zweiten Zeichensatzes wegen der technisch bedingten Beschränkung auf den "erweiterten" ASCII-Bereich (ASCII 128-255) das Problem auf, in ihm alle Sonderzeichen und alle Kombinationen mit diakritischen Zeichen unterzubringen. Mit den allmählich zum Standard gewordenen Zusatzkarten (Herkules Plus, EGA, VGA) fallen derartige Schwierigkeiten weg, und die Tendenz geht durchaus in die Richtung, philologisch orientierte Software mit umfassenderen Zeichensätzen auszurüsten (je nach Zusatzkarte 512 bis 1024 Zeichen).
Eine zweite grundsätzliche Frage betrifft das Verhältnis von Bildschirmdarstellung und Druckerausgabe. Es gibt Einstufenprogramme, bei denen das Gedruckte exakt die Textgestaltung auf dem Bildschirm reproduziert, der Bildschirm also alle Textauszeichnungen, die Anlage des Seitenformats, die Fußnoten usw. in der endgültigen Gestalt aufweisen muß (mit einem Anagramm von "what you see is what you get" als WYSIWYG-Systeme bezeichnet). Derartige Systeme sind im Grunde nur dann akzeptabel, wenn sie bei jedem Texteingriff das gesamte Dokument schnell zu aktualisieren und (auf dem Bildschirm) neu zu formatieren imstande sind, was einen erheblichen Rechenaufwand und die entsprechende Rechnerleistung voraussetzt; die Texterstellung ist häufig an eine umständliche Menüführung gebunden.
Den WYSIWYG-Programmen stehen Zwei-Stufen-Programme gegenüber, bei denen das Edieren (Schreiben des Textes) und das Formatieren (Druckerausgabe, die allerdings auch als preview auf den Bildschirm gebracht werden kann) in getrennten Schritten erfolgt. Der Vorteil solcher Systeme liegt darin, daß sie ziemlich unbekümmerte und darum auch sehr schnelle Texterstellung erlauben; der Nachteil ist, daß Steuerzeichen und Steuerkommandos auf dem Bildschirm sichtbar bleiben und je nach Bedarf immer wieder einmal in den Text eingefügt werden müssen. Ein befriedigendes Arbeiten ist darum ganz davon abhängig, ob sich erstens diese Steuerung standardisieren und durch "Makros" automatisieren läßt (so daß ggf. immer nur ein Kommando eingeschoben werden muß), und zweitens, ob man sich laufend über das Aussehen des Druckbildes in previews vergewissern kann. Viele Fachleute bevorzugen wegen der größeren Flexibilität Zwei-Stufen-Programme.
III.
Im Konkreten war über mehr als zweijährige
Erfahrungen mit dem Einsatz von PWP/Deutsch-Griechisch
(früher AcademicFont) zu berichten; weitere Software, die
zumeist erst im Laufe von 1987 verfügbar geworden ist,
soll später getestet werden. PWP ist als
Zwei-Stufen-Programm ausgelegt und erfüllt alle im vorigen
Abschnitt aufgestellten Forderungen. Es erweist sich als
besonders flexibel durch: umfassende Makrofähigkeit beim
Edieren wie beim Formatieren (selbst extrem komplizierte
Programmabläufe können mit einer einzelnen
Tastenkombination oder einem einzigen Steuermakro
aufgerufen werden), variable Tastenbelegung (auch während
des Schreibens), frei vereinbare Variabeln (Kürzel), die
in verschiedener Weise belegt werden können mit
Die seitens des Systems gebotenen Möglichkeiten wirken sich namentlich im Rahmen wissenschaftlicher Editionsvorhaben vorteilhaft aus. Der Herausgeber einer kritischen Ausgabe ist in besonderem Maße darauf angewiesen, ein möglichst fehlerfreies Druckmanuskript zu erstellen und wird in der Regel, auch um der Textentscheidung im letzten Augenblick willen, diesen Arbeitsgang selbst übernehmen. Die Vorteile des PC-Einsatzes im Hinblick auf Fehlerminimierung, Fehlerbeseitigung, Parallelbearbeitung von Text und Apparaten usw. liegen auf der Hand. Der Herausgeber hat zugleich aber auch ein vitales Interesse daran, daß das auf solche Weise optimal erstellte Manuskript im Zuge der Drucklegung nicht erneut durch Setzerfehler entstellt wird. Als Ausweg bietet sich dafür die direkte Übernahme des PC-erstellten Textes in den Drucksatz an, und zwar auf zweierlei Weise:
Das vorgestellte System verfügt (noch) nicht über weitergehende Fähigkeiten wie über eine automatische Koordination von Text und Apparat oder über Einbindung von "sprachlichem Kontextwissen" des Computers. Integrierte Lösungen dieser Art waren bei dem zuletzt vorgestellten Verfahren noch nicht erforderlich und gehören eigentlich schon zu den abschließend noch zu erwähnenden Perspektiven.
IV.
Der vernünftige Einsatz von Computern im Bereich
unserer Wissenschaft macht auf Dauer eine Ergänzung
fachlicher Kompetenz durch theoretische und praktische
Qualifikationen im Bereich der Informatik unentbehrlich.
Damit stellt sich die Frage nach entsprechenden
Ausbildungskonzepten, die jedoch im Rahmen unseres Faches
allein nicht zu erarbeiten sind. Die meisten Hochschulen
haben jedoch in der Zwischenzeit damit begonnen, auch
Geisteswissenschaftlern einen Zugang zur Informatik und zu
(zusätzlicher) Qualifikation zu öffnen.
Welchen Weg die weitere Entwicklung nehmen und welche
Rückwirkungen diese auf die philologische Arbeit haben
wird, ist im einzelnen schwer zu prognostizieren. Es
dürfte aber außer Frage stehen, daß sowohl die
sprachwissenschaftlichen Komponenten (das mehrfach
angesprochene "Kontextwissen") als auch der
arbeitsbegleitende Rückgriff auf umfassende Textcorpora in
Massenspeichern dabei eine entscheidende Rolle spielen
werden. So können inzwischen dank umfangreicher
Entwicklungsarbeiten in Harvard, Brown University und
Santa Barbara Compact Discs mit einer Auswahl von 178
Autoren des Thesaurus Linguae Graecae (dasselbe Corpus
wie für den Ibycus-Rechner von Packard) auch in
einer IBM-kompatiblen Umgebung benützt werden, und man darf
vermuten, daß gerade von solchen Einsatzmöglichkeiten
starke Impulse speziell für die Klassische Philologie
ausgehen werden.
Wilhelm Ott
Wissenschaftliche Textdatenverarbeitung.
Der Forschungsschwerpunkt 08 "Wissenschaftliche
Textdatenverarbeitung" (FSP), den das Land
Baden-Württemberg von 1985 bis 1989 mit zusätzlichen
Personal- und Sachmitteln fördert
(vgl.
34. Kolloquium vom 6. Juli 1985), hat die Hälfte dieser Förderungszeit
überschritten. Dies ist Anlaß für einen
Zwischenbericht und für Überlegungen über die
Fortführung der Arbeit nach 1989.
Zweieinhalb Jahre Forschungsschwerpunkt 08
Neben der Verbesserung der für die Geisteswissenschaften notwendigen Hardware-Ausstattung in Tübingen gehörten zu den wichtigsten Zielen, für die die Förderung seinerzeit beantragt worden war, die Weiterentwicklung, Konsolidierung und Dokumentation von TUSTEP, seine Verfügbarkeit auf weiteren Rechnern - auch auf solchen, die in Tübingen nicht als Rechenzentrumsanlagen betrieben werden - und die Einbeziehung der Personal Computer in die wissenschaftliche Textdatenverarbeitung.
Diese Förderung von TUSTEP ist auf dem Hintergrund seiner Bedeutung als Instrument für den Einsatz der EDV in den Geisteswissenschaften zu sehen, die deutlicher wird, wenn man sich einige wichtige Eigenschaften vergegenwärtigt, die es von anderen dort eingesetzten Programmen unterscheiden:
Optische Datenerfassung
Anstelle des bis dahin benutzten,
1985 stillgelegten OCR-A-Lesers in Ulm steht jetzt ein
AEG-Blattleser für Schreibmaschinen-Belege und ein
KDEM-Omnifont-Leser für die Erfassung von gedruckten
Texten zur Verfügung, der auch von Institutionen
außerhalb der Universität Tübingen mitbenutzt wird.
Datenübernahme vom PC
Aus FSP-Mitteln wurde 1985 ein
Diskettenkonverter beschafft, der die gängigsten 8-, 5
1/4-, 3 1/2- und 3-Zoll-Diskettenformate verarbeiten kann.
Von PCs, die direkt am Terminalnetz der Universität
angeschlossen sind, ist mit KERMIT ein direkter
Dateitransfer zum und vom Großrechner möglich. Mit
dem im FSP entwickelten Programm KONVERT können Textdateien der
verbreitetsten PC-Textverarbeitungsprogramme (PC-WRITE,
WORD, WORDPERFECT, WORDSTAR) vor der Übertragung mit
möglichst wenig Informationsverlust nach TUSTEP-Konventionen
umgewandelt werden (die Programme T3 und ScienTEX
werden nicht unterstützt); andere Dateien können mit
dem Programm UM7 so aufbereitet werden, daß mit
TUSTEP-Mitteln auf jeden Code der Ausgangsdatei
zugegriffen werden kann.
Datenausgabe
Der Matrixdrucker und die Typenraddrucker
wurden durch Laserdrucker abgelöst. Auf dem Lasergrafix
2400 können mit ähnlicher Geschwindigkeit wie auf dem
Zeilendrucker, aber mit annähernd
Schreibmaschinenqualität, Texte mit (z.Zt.) lateinischen,
griechischen, hebräischen und syrischen Buchstaben
einschließlich der Akzente bzw. (fürs
Hebräische) Vokalzeichen gedruckt werden;
weitere Schriften sind in Vorbereitung.
Satzsimulation
Eine entscheidende Verbesserung der
Arbeitsmöglichkeiten in Tübingen hat der Einsatz des
Lasergrafix 2400 zur Simulation der Setzmaschine gebracht.
Das auf diesen Drucker zugeschnittene Programm SASIM
ermöglicht eine Simulation der Satzausgabe auf dem
Laserdrucker, die - wie davor die Simulation auf dem
Plotter - bezüglich Seitenaufteilung mit dem späteren
Satz identisch ist, die darüber hinaus aber schnell genug
ist, um ganze Bücher auszugeben, und die hinsichtlich
Zeichenvorrat und Druckqualität für Korrekturzwecke
ausreicht. Es wird eine Schrift mit Times-Charakter
benutzt, die (in normalem, kursivem und halbfettem Schnitt
und in verschiedenen Schriftgrößen zwischen 6 und 12
Punkt) alle für westeuropäische Sprachen notwendigen
Akzente und Sonderzeichen enthält; dazu passend steht eine
griechische und eine hebräische Schrift zur Verfügung.
Die Qualität der Ausgabe entspricht derjenigen von DTP (desk top publishing)-Systemen; obwohl für den Zweck der Vorab-Korrektur professioneller Satzausgabe konzipiert, werden die TUSTEP-Programme SATZ und SASIM deshalb gelegentlich auch für "DTP"-Aufgaben eingesetzt; mit der Grafiksoftware DISSPLA erstellte Grafiken können in die Satzsimulation auf dem Laserdrucker integriert werden.
Als interne Dokumentation von TUSTEP und als Nachschlagewerk für Programmierer, die selbst TUSTEP-kompatible Programme schreiben wollen, dient eine auf den aktuellen Stand gebrachte Beschreibung der TUSTEP-Unterprogramme.
An der Universität Würzburg gehört TUSTEP inzwischen zum Lehrangebot des seit WS 1985/86 bestehenden Aufbaustudiengangs "Linguistische Text- und Informationsverarbeitung".
Über das Teilprojekt "rechnergestützte Lexikographie", in dem unter Leitung von Paul Sappler Verfahren zur Unterstützung philologischer Wörterbucharbeit (u.a. zur Lemmatisierung, Homographentrennung, Verarbeitung von Mehrwortgefügen, Berücksichtigung von Textvarianten und Vorlagenbezügen) entwickelt werden, die nach Möglichkeit in TUSTEP integriert werden sollen, soll später eigens berichtet werden.
MVS (IBM und kompatible),Dies ist nicht nur Voraussetzung für die Kontinuität der Arbeit mit TUSTEP in Tübingen selbst (ab Jahresende 1987 ist der Betrieb der SPERRY UNIVAC, auf der - nach dem TR 440 - TUSTEP bis zum Beginn des Berichtszeitraums allein verfügbar war, eingestellt), sondern auch für die Weitergabe des Systems an andere Hochschulen. Letzteres ist auch für Tübingen selbst wichtig, da immer häufiger in Tübingen begonnene Projekte - z.B. im Rahmen von Berufungen oder Gastprofessuren - an anderen Orten weitergeführt werden oder umgekehrt, oder Kooperationen mit Instituten anderer Hochschulen zustandekommen.
VM/CMS (IBM und kompatible; noch ohne SATZ),
VMS (DEC VAX; noch ohne SATZ).
Die folgende Übersicht gibt die TUSTEP-Installationen außerhalb Tübingens Anfang 1988 wieder (unter dem jeweiligen Betriebssystem in der zeitlichen Reihenfolge der ersten Installation):
Betriebssystem OS/1100 (EXEC 8): | Marburg, Trier, Göttingen |
Betriebssystem MVS: | Würzburg, Heidelberg, Berlin, Leiden, Pisa |
Betriebssystem VM/CMS: | Marburg, München, Konstanz, Bonn, Münster, Jerusalem, Stellenbosch, Rom, Freiburg, Pisa, Köln |
Betriebssystem VMS: | Ulm, Bayreuth, Dublin, Oxford. |
Deshalb wurde an die Teilnehmer appelliert, entsprechende Interessen an geeigneten Stellen in der Universität und bei der Landesregierung zu artikulieren.
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)