Protokoll des 41. Kolloquiums

Protokoll des 41. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 28. November 1987

Allgemeine Informationen

Die UNIVAC 1100/80 ist ab Jahresende 1987 außer Betrieb. Bis auf weiteres steht für TUSTEP-Benutzer in Tübingen nur noch die BASF 7/88 allgemein zur Verfügung. Der Laserdrucker QMS Lasergraphix 2400 ist jetzt an der BASF angeschlossen. Die UNIVAC-Terminals UTS 400 sollen durch VT 320 von DEC bzw. durch PC's von Atari ersetzt werden.
Im Zusammenhang mit der Stillegung der UNIVAC haben die Teilnehmer - vorwiegend Geisteswissenschaftler - einstimmig ein Votum an den Präsidenten der Universität Tübingen, Herrn Dr. Adolf Theis, beschlossen. Darin bringen sie ihre große Sorge zum Ausdruck, daß ihre künftigen Arbeitsmöglichkeiten im EDV-Bereich möglicherweise gravierende Beeinträchtigungen erfahren werden, insbesondere durch Wegfall von Druckkapazität, durch voraussichtlich nicht mehr rechtzeitige Installation der HP-Laserdrucker an der BASF und durch vorhersehbare Verzögerungen bei der Bereitstellung von Ersatzterminals für die wegfallenden UTS 400. Die Teilnehmer beauftragten Herrn Dr. Ott, in einem Brief an den Präsidenten die Bitte zu richten, evtl. erforderliche Mittel bereitzustellen und dafür Sorge zu tragen, daß die Anschlußarbeiten der Terminals und Drucker vordringlich in Angriff genommen werden.
Hinweis auf Termine
- 7.-12. März 1988 in Saarbrücken: Jahrestagung 1988 der Gesellschaft für Linguistische Datenverarbeitung (GLDV) mit dem Thema "Computerlinguistik und ihre theoretischen Grundlagen"
- 5.-9. Juni 1988 in Jerusalem: XVth International ALLC (Association for Literary and Linguistic Computing) Conference; in unmittelbarem Anschluß daran:
- 9.-13. Juni 1988 in Jerusalem: Second International Conference of the Association Internationale Bible et Informatique (AIBI)
- 22.-27. August 1988 in Budapest: The XIIth International Conference on Computational Linguistics (COLING 88)

Alexander Kleinlogel (Universität Bochum)

Datenverarbeitung in der (Klassischen) Philologie:
Anwendungen, Probleme und Perspektiven des PC-Einsatzes

Der Vortrag verstand sich in zweierlei Hinsicht als Erfahrungsbericht: zum einen über Erfahrungen mit Arbeitsplatzlösungen auf der Ebene des PC und mit speziell für die Bedürfnisse der Klassischen Philologie entwickelter Software, zum anderen über Erfahrungen im speziellen Bereich der wissenschaftlichen Edition, ergänzt um Ausblicke, die sich namentlich durch die Verfügbarkeit von Massenspeichern bei der Arbeit mit dem PC abzeichnen (CD-ROMs des Thesaurus Linguae Graecae von Irvine). Die an den Anfang gestellten grundsätzlichen Überlegungen (I) sollten weder eine wissenschaftstheoretische Standortbestimmung vornehmen noch den PC-Einsatz apologetisch rechtfertigen, sondern zu einem mehr oder minder systematischen Überblick (II) führen, um Beurteilungsgrundlagen und konkrete Kriterien für Entscheidungen über Geräte und Software zu gewinnen; der Bericht über konkrete Erfahrungen (III) schloß mit einigen Perspektiven (IV).

I.
Es ist offensichtlich, daß beim Computereinsatz in der Klassischen Philologie derzeit die textbezogenen und textwissenschaftlichen Aspekte und Interessen dominieren. Zwar besitzen die auf dem Gebiete der Sprachwissenschaft und Linguistik, bedauerlicherweise ohne nennenswerte Beteiligung seitens unserer Disziplin, erzielten Fortschritte (namentlich in der automatischen Sprach- und Syntaxanalyse) auch für die Klassische Philologie nicht zu unterschätzende Bedeutung, werden jedoch derzeit erst noch in geringem Umfange genützt. Im Bereich der interpretierenden Literaturwissenschaft bleibt dagegen beherrschend, was man eine "holistische" Sehweise genannt hat, und nicht zuletzt aus diesem Grunde sind die Ansätze zu einer Algorithmisierung des methodischen Zugriffs noch nicht sehr weit gediehen. Für die Literaturwissenschaft beschränkt sich daher der Nutzen, vorläufig wenigstens, auf Hilfestellung bei der Textarbeit und bei Literaturrecherchen.

Im vorliegenden Zusammenhang ergibt sich somit eine Konzentration auf "Text" und "Textwissenschaft", wobei das Nebeneinander bereits eine Differenzierung andeutet, die begrifflich trivial, für die Art des Computereinsatzes (und auch für die Ansprüche an die Software) dagegen keinesfalls belanglos ist: "Text" bezieht sich dabei in erster Linie auf das Medium (Kommunikationsmittel) und bezeichnet alle Arten von Dokumentation und von Textbeständen, wohingegen es der "Textwissenschaft" um Text als Objekt und um alle Formen des wissenschaftlichen Umgangs mit Text, um Textanalyse und (nicht zuletzt) um Textedition geht.

Bezogen auf die Möglichkeiten des Computereinsatzes ergeben sich daraus wesentliche Unterschiede. Im Falle von "Text" zielt der Einsatz auf die Oberfläche des Textes, auf seine Erstellung und Manipulation: Der Computer fungiert als Schreibmaschine mit enorm gesteigerter Leistungs- und Speicherfähigkeit "problem- und lösungsunterstützend". Der textwissenschaftliche Einsatz ist forschungsbezogen und richtet sich auf die inneren Strukturen des Textes; ferner gestattet er, über vertiefte Analysen hinaus, die Abfolge der einzelnen methodischen Schritte zu koordinieren und, soweit dies mit den verfügbaren Programmen sinnvoll verwirklicht werden kann, auch zu automatisieren; es können weiterhin Fragestellungen, die bisher aus arbeits- und mnemotechnischen Gründen nicht zu leisten waren (wie die systematische Abfrage und Analyse extrem großer Textkorpora), in Angriff genommen und Kombinationen in Erwägung gezogen werden, welche eine Vielfalt automatisierbarer linguistischer Methoden (Analysen im Bereich der Morphologie, der Syntax, des Lexikons usw.) in die Textarbeit als "sprachliches Kontextwissen des Computers" miteinbeziehen: Der PC fungiert damit als Forschungsinstrument "problem- und lösungsmodellierend".

II.
Versucht man nun, die Einsatzmöglichkeiten auf dem PC-Niveau etwas konkreter zu charakterisieren, so geht es zunächst in einem elementaren Sinne um "Textverarbeitung", wie sie für die Bürokommunikation usw. entwickelt worden ist, allerdings mit der für die philologische Arbeit entscheidenden Erweiterung um fremdsprachliche Zeichensätze wie etwa den des Griechischen mit allen diakritischen Zeichen.

1. Die Textverarbeitung gliedert sich dabei in drei Teilbereiche:

Texterstellung
Textanalyse (oberflächenbezogen)
Textarchivierung.

Der entscheidende Vorteil liegt dabei in dem, was man statt "Dynamik" besser die "Plastizität" des Textes nennen könnte, in der uneingeschränkten Disponibilität des Textes für Änderungen, Korrekturen, Revisionen usw.

Zu a.: Für die Texterstellung muß die Software alle Schreibfunktionen zweisprachig bereitstellen (Positionierung der Schreibstelle, Einfügungen, Löschungen, automatische Sicherung, Fuß- und Endnotenverwaltung, multiple Textverarbeitung in "Fenstern", Druckerausgabe usw.).

Für b. haben als wichtigste Komponenten einer elementaren Oberflächenanalyse zu gelten: Suchroutinen, Ersetzungsroutinen, Feststellung von Rekurrenzen, automatische Erstellung von Wortlisten und Indizes, Rechtschreibungsprüfung, stilistische Hilfen.

Zu c. gehören auf dieser Ebene: Verwaltung und Zugriff auf umfassende Datenbestände, Einsatz von Massenspeichern.

2. Für die bei der wissenschaftlichen Textarbeit, besonders bei der kritischen Edition, anfallenden Aufgaben bringt die unter 1. skizzierte Schreibtechnik schon erhebliche Erleichterungen, nützt aber noch längst nicht alle Möglichkeiten, die für eine "gehobene" Verwendung des Computers charakteristisch sind. Dies betrifft insbesondere die Verknüpfung und Koordination von Einzelschritten der Textverarbeitung, gepaart mit einer Systematisierung und Automatisierung der methodischen Schritte, wofür als Beispiele anzuführen sind: die Verwaltung kritischer Apparate und ihre Koordination mit dem Text, die Systematisierung wiederkehrender methodischer Schrittfolgen (wie konkomitanter Eintrag in Wortlisten, Standardisierung der druckgraphischen Gestaltung, automatische Kollation u.ä.).

Die meisten Softwareangebote sind den Erfordernissen der reinen Textverarbeitung (gemäß 1.) durchaus gewachsen. Für die unter 2. skizzierten Aufgaben stehen noch kaum Fertigprodukte zur Verfügung, die den fachspezifischen Anforderungen in jeder Hinsicht entsprechen. Soweit es Lösungen gibt, sind sie meist "partikulärer" Natur und können nicht ohne weiteres von der (philologischen) Allgemeinheit genutzt werden. Der Philologe kommt so ohne eigene Programmierkenntnisse (oder die seiner Mitarbeiter) nicht aus. Andererseits genügt es für viele der notwendig werdenden "partikulären" Lösungen, wenn das benutzte Textverarbeitungsprogramm selbst eine gewisse Programmierbarkeit aufweist und die Einrichtung automatisch ablaufender Sequenzen von Einzelschritten erlaubt, wenn es also über "Makros" verfügt. So sehr der Zwang zur Programmierung, auch in bescheidenem Umfange, auf den Computer-Neophyten abschreckend wirken mag, so deutlich zeigt die Erfahrung, daß mit wachsender Vertrautheit gerade auch das Interesse an der Makrofähigkeit wächst und diese sich am Ende als unentbehrliche Hilfe erweist.

In der Vergangenheit warf die Bildschirmdarstellung eines zweiten Zeichensatzes wegen der technisch bedingten Beschränkung auf den "erweiterten" ASCII-Bereich (ASCII 128-255) das Problem auf, in ihm alle Sonderzeichen und alle Kombinationen mit diakritischen Zeichen unterzubringen. Mit den allmählich zum Standard gewordenen Zusatzkarten (Herkules Plus, EGA, VGA) fallen derartige Schwierigkeiten weg, und die Tendenz geht durchaus in die Richtung, philologisch orientierte Software mit umfassenderen Zeichensätzen auszurüsten (je nach Zusatzkarte 512 bis 1024 Zeichen).

Eine zweite grundsätzliche Frage betrifft das Verhältnis von Bildschirmdarstellung und Druckerausgabe. Es gibt Einstufenprogramme, bei denen das Gedruckte exakt die Textgestaltung auf dem Bildschirm reproduziert, der Bildschirm also alle Textauszeichnungen, die Anlage des Seitenformats, die Fußnoten usw. in der endgültigen Gestalt aufweisen muß (mit einem Anagramm von "what you see is what you get" als WYSIWYG-Systeme bezeichnet). Derartige Systeme sind im Grunde nur dann akzeptabel, wenn sie bei jedem Texteingriff das gesamte Dokument schnell zu aktualisieren und (auf dem Bildschirm) neu zu formatieren imstande sind, was einen erheblichen Rechenaufwand und die entsprechende Rechnerleistung voraussetzt; die Texterstellung ist häufig an eine umständliche Menüführung gebunden.

Den WYSIWYG-Programmen stehen Zwei-Stufen-Programme gegenüber, bei denen das Edieren (Schreiben des Textes) und das Formatieren (Druckerausgabe, die allerdings auch als preview auf den Bildschirm gebracht werden kann) in getrennten Schritten erfolgt. Der Vorteil solcher Systeme liegt darin, daß sie ziemlich unbekümmerte und darum auch sehr schnelle Texterstellung erlauben; der Nachteil ist, daß Steuerzeichen und Steuerkommandos auf dem Bildschirm sichtbar bleiben und je nach Bedarf immer wieder einmal in den Text eingefügt werden müssen. Ein befriedigendes Arbeiten ist darum ganz davon abhängig, ob sich erstens diese Steuerung standardisieren und durch "Makros" automatisieren läßt (so daß ggf. immer nur ein Kommando eingeschoben werden muß), und zweitens, ob man sich laufend über das Aussehen des Druckbildes in previews vergewissern kann. Viele Fachleute bevorzugen wegen der größeren Flexibilität Zwei-Stufen-Programme.

III.
Im Konkreten war über mehr als zweijährige Erfahrungen mit dem Einsatz von PWP/Deutsch-Griechisch (früher AcademicFont) zu berichten; weitere Software, die zumeist erst im Laufe von 1987 verfügbar geworden ist, soll später getestet werden. PWP ist als Zwei-Stufen-Programm ausgelegt und erfüllt alle im vorigen Abschnitt aufgestellten Forderungen. Es erweist sich als besonders flexibel durch: umfassende Makrofähigkeit beim Edieren wie beim Formatieren (selbst extrem komplizierte Programmabläufe können mit einer einzelnen Tastenkombination oder einem einzigen Steuermakro aufgerufen werden), variable Tastenbelegung (auch während des Schreibens), frei vereinbare Variabeln (Kürzel), die in verschiedener Weise belegt werden können mit

Text,
Sonderzeichen (nur druckbar, in vollem Umfang der Ladekapazität des Druckers),
Druckersteuerung (z.B. statt umständlicher in-line-Kommandos),
Formatierkommandos (auch Makros).

Namentlich die Verbindung von Variabeln und Makros verleihen dem System eine Anpassungsfähigkeit, die in vergleichbarem Maße sonst kaum zur Verfügung steht.

Die seitens des Systems gebotenen Möglichkeiten wirken sich namentlich im Rahmen wissenschaftlicher Editionsvorhaben vorteilhaft aus. Der Herausgeber einer kritischen Ausgabe ist in besonderem Maße darauf angewiesen, ein möglichst fehlerfreies Druckmanuskript zu erstellen und wird in der Regel, auch um der Textentscheidung im letzten Augenblick willen, diesen Arbeitsgang selbst übernehmen. Die Vorteile des PC-Einsatzes im Hinblick auf Fehlerminimierung, Fehlerbeseitigung, Parallelbearbeitung von Text und Apparaten usw. liegen auf der Hand. Der Herausgeber hat zugleich aber auch ein vitales Interesse daran, daß das auf solche Weise optimal erstellte Manuskript im Zuge der Drucklegung nicht erneut durch Setzerfehler entstellt wird. Als Ausweg bietet sich dafür die direkte Übernahme des PC-erstellten Textes in den Drucksatz an, und zwar auf zweierlei Weise:

im "Schreibmaschinenmodus": Der gespeicherte Text wird (ohne steuernde Angaben zur buchtechnischen Gestaltung) auf Disketten oder andere Medien übertragen und im Verlag drucktechnisch aufbereitet, wobei allerdings die (Um-)Codierung des Griechischen Schwierigkeiten macht, sofern Software und Drucksatz dafür verschiedene Codes verwenden;
im direkten Photosatz: Das Manuskript wird mit allen Angaben zur Steuerung des Layout ausgestattet und im Verlag direkt in den Photocomposer eingegeben; Grundvoraussetzung hierfür ist über die Übereinstimmung des Codes hinaus auch die Anpassung an die z.T. sehr spezifischen Steuerkommandos der Photosatzanlage.

Wie man die Möglichkeiten eines Systems wie PWP für ein Verfahren nach b. nützen kann, läßt sich an Beispielen am besten aufweisen. Als Steuerzeichen für den Photocomposer werden "sinnträchtige" Variabeln (mnemonics) eingesetzt: ~g\ schaltet in die griechische Font, ~d\ zurück in die deutsche, ~p\ bewirkt Petitsatz, ~s\ Sperrung usw.; fürs eigene Formatiersystem bleiben die Variabeln z.T. unbelegt und werden beim Drucken ignoriert, andere erhalten eine Belegung, die dann nur in PWP wirksam ist. Zur der Standardisierung des Layout (Gestaltung von Überschriften, von Literaturverzeichnissen usw.) werden Variabeln (ggf. auch wiederkehrender Text) zu Makros zusammengefaßt und mittels der variablen Tastenbelegung durch Einzeltasten aufgerufen usw. Im Anschluß an preview, Papierausdruck und Korrektur wird der Text über ein (Pascal-)Programm umcodiert. Dabei werden der griechische Text an den Code des Photocomposers angepaßt und die Variabeln (fehlerfrei) in seine Steuerkommandos übersetzt. Der umcodierte Diskettentext kann dann unmittelbar gesetzt werden; ein erster nach diesem Verfahren gedruckter Band erscheint 1988.

Das vorgestellte System verfügt (noch) nicht über weitergehende Fähigkeiten wie über eine automatische Koordination von Text und Apparat oder über Einbindung von "sprachlichem Kontextwissen" des Computers. Integrierte Lösungen dieser Art waren bei dem zuletzt vorgestellten Verfahren noch nicht erforderlich und gehören eigentlich schon zu den abschließend noch zu erwähnenden Perspektiven.

IV.
Der vernünftige Einsatz von Computern im Bereich unserer Wissenschaft macht auf Dauer eine Ergänzung fachlicher Kompetenz durch theoretische und praktische Qualifikationen im Bereich der Informatik unentbehrlich. Damit stellt sich die Frage nach entsprechenden Ausbildungskonzepten, die jedoch im Rahmen unseres Faches allein nicht zu erarbeiten sind. Die meisten Hochschulen haben jedoch in der Zwischenzeit damit begonnen, auch Geisteswissenschaftlern einen Zugang zur Informatik und zu (zusätzlicher) Qualifikation zu öffnen.

Welchen Weg die weitere Entwicklung nehmen und welche Rückwirkungen diese auf die philologische Arbeit haben wird, ist im einzelnen schwer zu prognostizieren. Es dürfte aber außer Frage stehen, daß sowohl die sprachwissenschaftlichen Komponenten (das mehrfach angesprochene "Kontextwissen") als auch der arbeitsbegleitende Rückgriff auf umfassende Textcorpora in Massenspeichern dabei eine entscheidende Rolle spielen werden. So können inzwischen dank umfangreicher Entwicklungsarbeiten in Harvard, Brown University und Santa Barbara Compact Discs mit einer Auswahl von 178 Autoren des Thesaurus Linguae Graecae (dasselbe Corpus wie für den Ibycus-Rechner von Packard) auch in einer IBM-kompatiblen Umgebung benützt werden, und man darf vermuten, daß gerade von solchen Einsatzmöglichkeiten starke Impulse speziell für die Klassische Philologie ausgehen werden.

Wilhelm Ott

Wissenschaftliche Textdatenverarbeitung.
Zweieinhalb Jahre Forschungsschwerpunkt 08

Der Forschungsschwerpunkt 08 "Wissenschaftliche Textdatenverarbeitung" (FSP), den das Land Baden-Württemberg von 1985 bis 1989 mit zusätzlichen Personal- und Sachmitteln fördert (vgl. 34. Kolloquium vom 6. Juli 1985), hat die Hälfte dieser Förderungszeit überschritten. Dies ist Anlaß für einen Zwischenbericht und für Überlegungen über die Fortführung der Arbeit nach 1989.

Neben der Verbesserung der für die Geisteswissenschaften notwendigen Hardware-Ausstattung in Tübingen gehörten zu den wichtigsten Zielen, für die die Förderung seinerzeit beantragt worden war, die Weiterentwicklung, Konsolidierung und Dokumentation von TUSTEP, seine Verfügbarkeit auf weiteren Rechnern - auch auf solchen, die in Tübingen nicht als Rechenzentrumsanlagen betrieben werden - und die Einbeziehung der Personal Computer in die wissenschaftliche Textdatenverarbeitung.

Diese Förderung von TUSTEP ist auf dem Hintergrund seiner Bedeutung als Instrument für den Einsatz der EDV in den Geisteswissenschaften zu sehen, die deutlicher wird, wenn man sich einige wichtige Eigenschaften vergegenwärtigt, die es von anderen dort eingesetzten Programmen unterscheiden:

der Leistungsumfang von TUSTEP ist nicht am Bedarf der Büro-Textverarbeitung und der Dokumenterstellung, sondern am Bedarf der geisteswissenschaftlichen Forschung ausgerichtet;
es umfaßt - als System von aufeinander abgestimmten, frei kombinierbaren Programmen - alle Phasen des wissenschaftlichen Umgangs mit Texten (auch solchen in nicht-lateinischen Alphabeten), von der Erfassung und Korrektur über das Absuchen von Texten, ihre Veränderung nach frei definierbaren Regeln, den Vergleich verschiedener Textfassungen, die Erhebung quantitativer Angaben aus den Texten, das Sortieren, die Index- und Registerarbeit bis hin zum professionellen Satz für die Publikation einschließlich der Umbrucharbeiten bei kritischen Editionen; damit werden gleichzeitig Schnittstellenprobleme (etwa zu fremden Satzsystemen) vermieden;
es ist für Großrechner konzipiert und auf die Verarbeitung großer Datenmengen und auf hohe Verarbeitungsgeschwindigkeit ausgelegt; davon wird auch die PC-Version profitieren: die dort installierten TUSTEP-Programme haben den gleichen Leistungsumfang wie die Großrechnerversion;
alle Funktionen, auch die leistungsfähigen Such- und Austauschfunktionen des Editors, stehen auch in einer batch-orientierten Arbeitsweise zur Verfügung; dies ist nicht nur bei großen Datenmengen sinnvoll, sondern sichert die Wiederholbarkeit von Aufgaben und die Reproduzierbarkeit der Ergebnisse;
durch den modularen Aufbau und die Flexibilität und freie Kombinierbarkeit seiner Bausteine hat es den Charakter eines Programmierwerkzeugs;
durch die Verfügbarkeit eines Unterprogrammpakets unterstützt es die Erweiterung durch Benutzerprogramme, die zu den übrigen Bausteinen kompatibel sind; entsprechende Schnittstellen für die Benutzung beliebiger fremder Programme (z.B. SPSS für statistische Auswertung) sind vorhanden;
es hat auf den verschiedenen Rechnern, vom PC bis zum Großrechner, eine identische, vom Betriebssystem unabhängige Kommandosprache, die - bis auf logon und logoff und den Aufruf von TUSTEP selbst - alle benötigten Dienste, einschließlich Datentransport, umfaßt und um benutzereigene Kommandos erweitert werden kann. Dies macht Anwendungen portabel.

Dateneingabe, Druckerausgabe

Nach außen am sichtbarsten sind die Verbesserungen, die der FSP im Ein- und Ausgabebereich gebracht hat.

Optische Datenerfassung
Anstelle des bis dahin benutzten, 1985 stillgelegten OCR-A-Lesers in Ulm steht jetzt ein AEG-Blattleser für Schreibmaschinen-Belege und ein KDEM-Omnifont-Leser für die Erfassung von gedruckten Texten zur Verfügung, der auch von Institutionen außerhalb der Universität Tübingen mitbenutzt wird.

Datenübernahme vom PC
Aus FSP-Mitteln wurde 1985 ein Diskettenkonverter beschafft, der die gängigsten 8-, 5 1/4-, 3 1/2- und 3-Zoll-Diskettenformate verarbeiten kann. Von PCs, die direkt am Terminalnetz der Universität angeschlossen sind, ist mit KERMIT ein direkter Dateitransfer zum und vom Großrechner möglich. Mit dem im FSP entwickelten Programm KONVERT können Textdateien der verbreitetsten PC-Textverarbeitungsprogramme (PC-WRITE, WORD, WORDPERFECT, WORDSTAR) vor der Übertragung mit möglichst wenig Informationsverlust nach TUSTEP-Konventionen umgewandelt werden (die Programme T³ und ScienTEX werden nicht unterstützt); andere Dateien können mit dem Programm UM7 so aufbereitet werden, daß mit TUSTEP-Mitteln auf jeden Code der Ausgangsdatei zugegriffen werden kann.

Datenausgabe
Der Matrixdrucker und die Typenraddrucker wurden durch Laserdrucker abgelöst. Auf dem Lasergrafix 2400 können mit ähnlicher Geschwindigkeit wie auf dem Zeilendrucker, aber mit annähernd Schreibmaschinenqualität, Texte mit (z.Zt.) lateinischen, griechischen, hebräischen und syrischen Buchstaben einschließlich der Akzente bzw. (fürs Hebräische) Vokalzeichen gedruckt werden; weitere Schriften sind in Vorbereitung.

Satzsimulation
Eine entscheidende Verbesserung der Arbeitsmöglichkeiten in Tübingen hat der Einsatz des Lasergrafix 2400 zur Simulation der Setzmaschine gebracht. Das auf diesen Drucker zugeschnittene Programm SASIM ermöglicht eine Simulation der Satzausgabe auf dem Laserdrucker, die - wie davor die Simulation auf dem Plotter - bezüglich Seitenaufteilung mit dem späteren Satz identisch ist, die darüber hinaus aber schnell genug ist, um ganze Bücher auszugeben, und die hinsichtlich Zeichenvorrat und Druckqualität für Korrekturzwecke ausreicht. Es wird eine Schrift mit Times-Charakter benutzt, die (in normalem, kursivem und halbfettem Schnitt und in verschiedenen Schriftgrößen zwischen 6 und 12 Punkt) alle für westeuropäische Sprachen notwendigen Akzente und Sonderzeichen enthält; dazu passend steht eine griechische und eine hebräische Schrift zur Verfügung.

Die Qualität der Ausgabe entspricht derjenigen von DTP (desk top publishing)-Systemen; obwohl für den Zweck der Vorab-Korrektur professioneller Satzausgabe konzipiert, werden die TUSTEP-Programme SATZ und SASIM deshalb gelegentlich auch für "DTP"-Aufgaben eingesetzt; mit der Grafiksoftware DISSPLA erstellte Grafiken können in die Satzsimulation auf dem Laserdrucker integriert werden.

Dokumentation von TUSTEP

Zusätzlich zu den (zuvor ausschließlich) auf Dateien verfügbaren Einzelbeschreibungen der TUSTEP-Programme liegt als Nachschlagewerk ein TUSTEP-Benutzerhandbuch mit 474 Seiten vor. Eine Übersetzung des Handbuchs ins Englische ist in Vorbereitung.

Als interne Dokumentation von TUSTEP und als Nachschlagewerk für Programmierer, die selbst TUSTEP-kompatible Programme schreiben wollen, dient eine auf den aktuellen Stand gebrachte Beschreibung der TUSTEP-Unterprogramme.

Ausbildung in TUSTEP

Dank der personellen Verstärkung durch den FSP konnte der schon traditionelle zweiwöchige TUSTEP-Hauptkurs im Herbst ergänzt werden durch einen zweimal jährlich angebotenen einwöchigen Einführungskurs.

An der Universität Würzburg gehört TUSTEP inzwischen zum Lehrangebot des seit WS 1985/86 bestehenden Aufbaustudiengangs "Linguistische Text- und Informationsverarbeitung".

TUSTEP-Erweiterungen

TUSTEP selbst hat - über die erwähnten Erweiterungen im Ein- und Ausgabebereich hinaus - viele Erweiterungen und Verbesserungen erfahren, die nach außen kaum auffallen, aber wesentlich sind für die Sicherheit und Bequemlichkeit seiner Bedienung und für seinen Einsatz auf einer immer größeren Zahl von Rechnern. Für den Benutzer sichtbar sind vor allem: das neu geschaffene Kommando RETTE zur Wiederherstellung defekter Dateien; die Erweiterung des Kommandos UMWANDLE zur Verschlüsselung von Daten (Datenschutz!) und zur Unterstützung des Transports von Daten über Leitungsnetze und zwischen Rechnern verschiedener Architektur; die Spezifikation CODE in den Kommandos zur Magnetband-Benutzung zur wahlweisen Benutzung von ASCII- oder EBCDIC-Bändern sowie im Kommando DEFINIERE, mit der dem unterschiedlichen Zeichenvorrat der verschiedenen Terminal-Typen Rechnung getragen wird.

Über das Teilprojekt "rechnergestützte Lexikographie", in dem unter Leitung von Paul Sappler Verfahren zur Unterstützung philologischer Wörterbucharbeit (u.a. zur Lemmatisierung, Homographentrennung, Verarbeitung von Mehrwortgefügen, Berücksichtigung von Textvarianten und Vorlagenbezügen) entwickelt werden, die nach Möglichkeit in TUSTEP integriert werden sollen, soll später eigens berichtet werden.

Implementierung von TUSTEP unter weiteren Betriebssystemen

Die weitaus meiste Programmierarbeit ist in die Implementierung von TUSTEP unter weiteren Betriebssystemen geflossen. Seit 1985 ist TUSTEP auf folgenden Betriebssystemen neu verfügbar geworden:

MVS (IBM und kompatible),
VM/CMS (IBM und kompatible; noch ohne SATZ),
VMS (DEC VAX; noch ohne SATZ).

Dies ist nicht nur Voraussetzung für die Kontinuität der Arbeit mit TUSTEP in Tübingen selbst (ab Jahresende 1987 ist der Betrieb der SPERRY UNIVAC, auf der - nach dem TR 440 - TUSTEP bis zum Beginn des Berichtszeitraums allein verfügbar war, eingestellt), sondern auch für die Weitergabe des Systems an andere Hochschulen. Letzteres ist auch für Tübingen selbst wichtig, da immer häufiger in Tübingen begonnene Projekte - z.B. im Rahmen von Berufungen oder Gastprofessuren - an anderen Orten weitergeführt werden oder umgekehrt, oder Kooperationen mit Instituten anderer Hochschulen zustandekommen.

Die folgende Übersicht gibt die TUSTEP-Installationen außerhalb Tübingens Anfang 1988 wieder (unter dem jeweiligen Betriebssystem in der zeitlichen Reihenfolge der ersten Installation):

  Betriebssystem OS/1100 (EXEC 8): Marburg, Trier, Göttingen

  Betriebssystem MVS: Würzburg, Heidelberg, Berlin, Leiden, Pisa

  Betriebssystem VM/CMS: Marburg, München, Konstanz, Bonn, Münster,
Jerusalem, Stellenbosch, Rom, Freiburg, Pisa, Köln

  Betriebssystem VMS: Ulm, Bayreuth, Dublin, Oxford.

Auswärtige Projekte zu Gast in Tübingen

Die Einrichtungen des FSP 08 selbst stehen auch auswärtigen Hochschulen und Forschungseinrichtungen zur Verfügung. 27 auswärtige Projekte, die im Berichtszeitraum in Tübingen die Einrichtungen des FSP nutzten, hier mit TUSTEP arbeiteten und sich - überwiegend für die Vorbereitung kritischer Editionen und für Registerarbeiten - sonstige Unterstützung und Beratung für ihre Arbeit holten, wurden namentlich genannt.

Pläne bis 1989

Neben der Detailarbeit zur Verbesserung und Erweiterung von TUSTEP sollen folgende Punkte bis zum Ende der Förderungszeit erledigt werden:

Implementierung der unter VM/CMS und VMS noch fehlenden Teile
Implementierung von TUSTEP unter den Betriebssystemen BS2000 (SIEMENS) und UNIX (zunächst CONVEX)
Implementierung der wichtigsten Teile unter MS-DOS auf dem PC; noch im Winter 87/88 sollen zumindest der Editor und die organisatorischen Programme (Dateiverwaltung, Umwandeln, Drucken) verfügbar sein.
Englische Übersetzung des Benutzerhandbuchs
Erstellen einer zum Selbststudium geeigneten Einführung in TUSTEP
Einbauen weiterer Leistungen in TUSTEP (einschließlich der im Rahmen des Teilprojekts "rechnergestützte Lexikographie" entwickelten Verfahren)
Darstellung nicht-lateinischer Zeichensätze auf dem PC (als selbständigem Gerät und als Terminal am Großrechner)
Erweiterung des Zeichenvorrats der Drucker; Einbauen einer Schnittstelle zu POSTSCRIPT, dem neuen de-facto-Standard für Druckersteuerung.

Und nach 1989?

Die Zusatzförderung durch das Schwerpunktprogramm des Landes wird voraussichtlich nicht über Ende 1989 hinaus gewährt. Dementsprechend wurden vom ZDV für den Doppelhaushalt 1989/90 Personalstellen und Sachmittel in der entsprechenden Höhe beantragt. Ob diese Anträge von der Universität an das Land weitergegeben wurden, und, wenn ja, ob die Weiterführung der mit den Schwerpunktmitteln begonnenen Arbeiten ähnliches Gewicht bekommen wie andere Vorhaben der Universität (z.B. Ausbau der Informatik, Ostasienkolleg) ist uns nicht bekannt. Vor allem der Wegfall der drei (einschließlich Teilprojekt rechnergestützte Lexikographie: vier) Personalstellen, die jetzt aus den Sondermitteln finanziert werden, würde ernste Probleme aufwerfen, selbst wenn nur der Bestand an Programmen und Beratung gewahrt werden soll; denn mit dem gleichen Personal wie vor der Zusatzförderung müßten statt zuvor 2 Versionen für unterschiedliche Betriebssysteme deren mindestens 7 (MVS, VM/CMS, VMS, BS2000, UNIX, MS-DOS, mittelfristig OS/2) gepflegt und neuen Generationen angepaßt werden; die größere Zahl auswärtiger Installationen macht auch für die Verteilung der Updates und die Verfolgung von installationsabhängigen Problemen mehr Arbeit als vor 1985. Auch der Betrieb der mit Mitteln des FSP beschafften Anlagen (vor allem KDEM Omnifontleser, OCR-Leser, Diskettenkonverter) bindet eine Arbeitskraft.

Deshalb wurde an die Teilnehmer appelliert, entsprechende Interessen an geeigneten Stellen in der Universität und bei der Landesregierung zu artikulieren.

(Die Kurzfassungen der Referate wurden von den Referenten zur Verf�gung gestellt.)

Zur Übersicht über die bisherigen Kolloquien

tustep@zdv.uni-tuebingen.de - Stand: 22. Juli 2003

Betriebssystem OS/1100 (EXEC 8):	Marburg, Trier, Göttingen
Betriebssystem MVS:	Würzburg, Heidelberg, Berlin, Leiden, Pisa
Betriebssystem VM/CMS:	Marburg, München, Konstanz, Bonn, Münster, Jerusalem, Stellenbosch, Rom, Freiburg, Pisa, Köln
Betriebssystem VMS:	Ulm, Bayreuth, Dublin, Oxford.