Aus dem Protokoll des 68. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 30. November 1996

 

Peter Stahl; Werner Wegstein, Würzburg:

Konventionelles und elektronisches Publizieren am Beispiel des Vorlesungsverzeichnisses der Universität Würzburg

1. Vorgeschichte


Als im Herbst 1992 die Zentralverwaltung der Universität erkundete, ob wir an der Neukonzeption des Würzburger Vorlesungsverzeichnisses mitwirken, eventuell auch dessen Satz übernehmen würden, erschien uns diese Aufgabe als eine reizvolle Abwechslung. Nach unseren langjährigen positiven Erfahrungen mit TUSTEP in der Editionsphilologie, bei kritischen Editionen mit text- und überlieferungsgeschichtlichen Apparaten, je nach Textgeschichte auch in mehrspaltiger Synopse unterschiedlicher Fassungen mit zusätzlicher Kommentarspalte und lemmatisiertem Wortformenindex, kam für unseren Ausflug in die administrative Textverarbeitung natürlich ebenfalls nur eine Lösung mit TUSTEP-Bausteinen in Frage.

Ziel des Vorhabens war es, die umständliche, zeitraubende und damit auch kostspielige konventionelle Herstellung des Vorlesungsverzeichnisses - ein mehrfaches Hin und Her von Typoskripten, Fahnen- und Umbruchkorrekturen zwischen Instituten, Fakultäten, Zentralverwaltung und Verlag bzw. Druckerei, von der manuellen Herstellung des Namenregisters ganz abgesehen - durch ein EDV-basiertes Verfahren zu ersetzen, das die für den Ausdruck der Typoskripte ohnehin erstellten EDV-Dateien gleich direkt nutzt, das platzsparend arbeitet und das als Endprodukt lediglich noch eine Satzdatei an die Druckerei liefert. Mit Blick auf eine längerfristige Nutzung schien es uns dabei wichtig, die Daten von vornherein so zu organisieren, daß sie nicht nur für den konventionellen Satz, sondern ohne Weiteres auch für die Darstellung im Netz oder für die Weiterbearbeitung mit einem Datenbankprogramm genutzt werden können.

2. Administrative Textverarbeitung: die Textsorte 'Vorlesungsverzeichnis'


Die Aufgabenstellung wird durch einen Blick auf die Textsorte "Vorlesungsverzeichnis" deutlich. Da ist zunächst das komplexe Gebilde Universität, bestehend aus einer alles überdachenden zentralen Organisations- und Verwaltungsstruktur, die getragen wird von einer historisch gewachsenen und je nach Landeshochschulgesetzgebung und lokalen Besonderheiten unterschiedlich differenzierten Vielfalt von Fakultäten bzw. Fachbereichen mit ebenfalls komplexen, oft wechselseitig miteinander verflochtenen Lehr- und Forschungsaufgaben, die innerhalb der Fakultäten wiederum organisiert sind in einer ebenso differenzierten Vielfalt von Instituten (in der Medizin auch Kliniken und Polikliniken), zu der Lehrstühle mit verwandter Aufgabenstellung (und dazu erforderlicher Ausstattung) zusammengefaßt sind. Aufgabe eines Vorlesungsverzeichnisses ist es nun, das Lehrangebot dieses komplexen Gebildes, auch in seiner Einbettung in die Forschungs- und Verwaltungsstrukturen, für Studierende transparent darzustellen, wobei jeder Teil spezifische Formatierungen verlangt und andere Anforderungen an das Satzprogramm stellt.

Der Verwaltungsteil des Vorlesungsverzeichnisses informiert hierarchisch über die Leitungsorgane der Universität (Präsident, Kanzler, Präsidialkollegium, Senat, Kommissionen und Ausschüsse), die Zentralverwaltung, gegliedert in Abteilungen, Referate und besondere Funktionen und Dienste, zentrale Einrichtungen wie etwa die Universitätsbibliothek oder das Rechenzentrum, Forschungseinrichtungen wie Sonderforschungsbereiche, Forschergruppen oder Graduiertenkollegs, sonstige Einrichtungen und Dienststellen wie den Personalrat oder die verschiedenen Prüfungs- und Praktikumsämter. Er enthält ferner Tabellen zu Studien- und Prüfungsmöglichkeiten, Mitteilungen für die Studierenden, etwa über die Studierendenvertretung oder das Studentenwerk und eine Zeittafel zur Vorlesungszeit. Schließlich gehören auch noch einige Lagepläne und eine kurze Universitätschronik dazu.

Der Fakultätsteil präsentiert sich jeweils zweigeteilt: der Personalteil umfaßt die Verwaltungsstruktur der jeweiligen Fakultät bzw. des Fachbereichs (Dekanat, Fachbereichsrat, Frauenbeauftrage), den Lehrkörper (geordnet in Professoren, Privatdozenten und Lehrbeauftragte) und die Institutsgliederung (in der Medizin erweitert um Kliniken und Polikliniken mit einer eigenen vorgeordneten Verwaltungsstruktur), in der die Lehrstühle noch einmal mit dem zugeordneten Personal aufgelistet sind.

Der anschließende Lehrveranstaltungsteil führt dann das gesamte Lehrangebot der Fakultät auf, je nach Fachverständnis oder historisch gewachsenem Usus gegliedert nach Studienabschlüssen oder Studienfortschritt, nach Fächern, Teilbereichen, Abteilungen, Sachgebieten oder Lehrveranstaltungstypen. (Von den Details des Lehrimports und -exports zwischen den Fakultäten sei hier abgesehen.)

Die Darstellung einer einzelnen Lehrveranstaltung beginnt mit einer zweistelligen Fakultätskennziffer, gefolgt von einer dreistelligen Unterscheidungsnummer. (In Würzburg bietet lediglich die Medizinische Fakultät über 1000 Lehrveranstaltungen an. Dem wird durch die Vergabe von zwei Kennziffern, 03... bzw. 31..., Rechnung getragen.) Dann folgt der Titel der Lehrveranstaltung, meist einzeilig, im Extremfall aber auch mehr als vier Zeilen beanspruchend, gegebenenfalls zusätzliche Kennzeichen, die auf Studien- oder Prüfungsordnungen Bezug nehmen oder Kommentare, die Stundenzahl (mit stark variierenden Angaben zum Ablauf wie 'halbsemestrig' oder 'ganztägig'), sowie Zeitpunkt und Ort der Lehrveranstaltung (sofern schon festgelegt). Am Ende steht (im Druck rechtsbündig und kursiv) der Name der Lehrenden, meist nur eine Person, nicht ganz selten aber auch zwei oder drei Lehrende; im Extremfall kommen hier mehr als zwei Dutzend Namen zusammen.

Das Vorlesungsverzeichnis endet mit einem alphabetischen Namenverzeichnis, das für jede Person nachweist, auf welchen Seiten des Vorlesungsverzeichnisses sie genannt ist. In einem Wintersemester sind das in Würzburg über 3000 Namenseinträge, zweispaltig knapp 32 Seiten. Mit der Neukonzeption wurde auch der Inhalt der Vorlesungsverzeichnisse für Winter- und Sommersemester neu festgelegt: so wird der Personalteil der Fakultäten nur noch in Verzeichnissen für Wintersemester ausgedruckt.

3. Textdatenverarbeitung I: konventionelles Publizieren

Als Kodierungsprinzip für ein solches Textgebilde aus mehrfach ineinandergreifenden Gliederungsebenen und Strukturen mit stark variierendem Datenumfang bietet unseres Erachtens am ehesten eine sachliche Textauszeichnung, wie wir sie beim Satz mit TUSTEP seit langem gewohnt sind, die nötige Flexibilität. Unser Kodierungsansatz wurde von der Zentralverwaltung in Richtlinien für die Datenerfassung in den Fakultäten umgesetzt. Durch den Zeitdruck in der Endphase der Projektentwicklung und kurzfristige notwendige Detailänderungen konnte die angestrebte SGML-konforme Textauszeichnung dabei nicht vollständig durchgehalten werden.

Das Datenverarbeitungskonzept mußte eine Reihe von Vorgaben berücksichtigen: 1. die Daten sollten auf MSDOS-PCs erfaßt und als Datei im ASCII-Format übergeben werden; 2. die TUSTEP-Prozeduren sollten auch von Nicht-TUSTEP-kundigen eingesetzt werden können; 3. die Textverarbeitung mußte sich in die administrativen Abläufe einfügen, d.h. jeder Teil des Vorlesungsverzeichnisses - zentraler Verwaltungsteil, Personalteil und Lehrveranstaltungsteil der Fakultäten sowie das Namenregister - mußte auch separat verarbeitet werden können; 4. die Prozeduren sollten robust, fehlertolerant und wartungsfreundlich sein und angesichts der Datenflüsse zwischen Zentralverwaltung, Fakultäten und Instituten - von der Datenerfassung über den Probesatz mit Korrekturausdruck bis zum endgültigen Satz - Dateiverwechslungen ausschließen. Den Kern der Textdatenverarbeitung bilden daher zwei Prozeduren mit dem TUSTEP-Baustein #KOPIERE: die erste setzt die für die Erfassung verwendeten Textauszeichnungen in eindeutiger Form in die Markierungen um, die für den Satz des Vorlesungsverzeichnisses benötigt werden; die zweite wandelt die Markierungen in die eigentlichen Instruktionen für das TUSTEP-Satzprogramm um. Dabei wird eine Eigenschaft von #KOPIERE genutzt, innerhalb eines Programmaufrufs die Daten auf mehrere, voneinander getrennte Durchgänge zu verteilen und separat zu verarbeiten: jeder Strukturtyp aus mehr als einem Dutzend Textstrukturen wird zwar - je nach Umgebungserfordernis - in einem separaten Durchgang aufbereitet, aber alle Daten der verschiedenen Teile des Vorlesungsverzeichnisses durchlaufen bei der Aufbereitung immer nur ein und dieselbe Prozedur. Darum herum ist eine Reihe weiterer Verarbeitungsroutinen gruppiert, die z.B. den Datenimport nach TUSTEP steuern, die dafür sorgen, daß jeweils die Datei mit dem jüngsten Datum bearbeitet wird, die die vorgegebene Verarbeitung der Namen sicherstellen oder das Namenregister erzeugen.

Die Fülle der Detailarbeiten, die zu erledigen waren, hat uns rückblickend selbst überrascht. Ein Beispiel aus der Namenverarbeitung kann das illustrieren. Nach unserem Kodierungskonzept besteht jeder Name im Kern aus einer normalerweise automatisch vergebenen Fakultätskennziffer, dem Familiennamen und dem Vornamen, an den sich dann, je nach Textumgebung, noch weitere Angaben wie Titel oder Ähnliches anschließen können. Durch Fakultätskennziffer, Familiennamen und Vornamen sind Träger gleicher Namen für das Namenregister zuverlässig zu unterscheiden. (Der extrem seltene Fall, daß innerhalb einer Fakultät zwei Personen mit gleichem Familiennamen und Vornamen auftreten, ist durch eine zusätzliche Markierung geregelt.) Für den Satz wird die Fakultätskennziffer stets als Kommentar markiert und erscheint daher nicht im Druck. Ebenso wird im Lehrveranstaltungsteil mit den Vornamen verfahren, es sei denn, daß innerhalb einer Fakultät ein Familienname mehr als einmal auftritt. Dann soll aus Gründen der Eindeutigkeit nach dem Familiennamen jeweils noch der Vorname ausgedruckt werden. Dafür sorgt eine eigene Routine, die für jede Fakultät ein Register mehrfach auftretender Familiennamen erzeugt und aus der Registerausgabe automatisch eine Subroutine aufbaut, die bei den Namendubletten im Lehrveranstaltungsteil die Kennzeichnung der Vornamen als Kommentar aufhebt.

Für den Satz waren ebenso umfangreiche Detailregelungen zu beachten, die teils noch vom Layout des alten Vorlesungsverzeichnisses übernommen waren, so etwa am rechten Außenrand ein schwarzes Viereck mit der Nummer der Fakultät invers als Griffleiste oder die Zentrierung aller Überschriften, selbst wenn sich dies in einzelnen Fakultäten zu regelrechten Überschriftenbäumen auswächst, wenn Lehrveranstaltungen mit fünf oder sechs Überschriften in Folge - nach Studienabschluß, Prüfungsordnung, Fach, Teilbereich, Abteilung und Studienfortschritt - untergliedert werden, was die Vermeidung von Schusterjungen und Hurenkindern beim Setzen nicht gerade erleichtert. Teilweise waren die Regelungen auch diktiert vom Zwang, Platz zu sparen, so etwa der Wechsel in zweispaltigen Satz bei nicht permanenten Mitarbeiterinnen und Mitarbeitern im Personalteil der Fakultäten. Um den Satz des Vorlesungsverzeichnisses reihen sich ebenfalls weitere Verarbeitungsroutinen, die z.B. die korrekte Silbentrennung kontrollieren.

Zu Beginn des Sommersemesters 1993 startete das neue Verfahren mit der Datenerfassung in den Fakultäten, Mitte Juni 1993 wurden die Satzdaten als PostScript-Datei dem Verlag übergeben, Mitte Juli erschien das Vorlesungsverzeichnis erstmals in der neuen Gestalt, fristgerecht, platzsparend - aus 604 Seiten waren im ersten Anlauf 416 Seiten geworden - und mit kürzeren Vorlaufzeiten und somit nicht nur preiswerter, sondern auch noch aktueller. Das Endprodukt kann inzwischen per E-mail bei schoeningh@aol.com bestellt oder abonniert werden.

4. Textdatenverarbeitung II: Elektronisches Publizieren

Mit der sich rasch verbreitenden Internet-Nutzung kam bald der Wunsch nach einer Internet-Version des Vorlesungsverzeichnisses auf. Ziel der elektronischen Publikation war es, das gedruckte Vorlesungsverzeichnis vollständig, so buchstabengetreu wie mit dem elektronischen Medium möglich und in einer funktionell schlanken Präsentation ohne irgendwelche Browser-Finessen abzubilden. Die dazu notwendigen Prozeduren sollten - wie für die konventionelle Publikation auch - modular angelegt sein und es erlauben, die Verzeichnisdaten nicht nur als Ganzes zu verarbeiten, sondern auch so, wie sie gerade anfallen, also z.B. fakultätsweise oder nach dem individuellen Aktualisierungsrhythmus der verschiedenen Teile des Vorlesungsverzeichnisses, und natürlich sollten sie das Endprodukt, die 'elektronische Edition' - angesichts des Datenumfangs und zur Vermeidung von Fehlern - ohne manuelle Eingriffe erstellen. Es lag daher nahe, auch hierfür TUSTEP einzusetzen.

Das Verfahren setzt bei den Daten an, die durch den ersten #KOPIERE-Baustein für das konventionelle Publizieren erzeugt wurden, nur werden jetzt die eindeutigen Struktur-Markierungen im Text nicht mehr zu Instruktionen für das TUSTEP-Satzprogramm aufbereitet, sondern in HTML-Markierungen für die Internet-Darstellung umgesetzt. Vom Resultat her könnte man deshalb die ganze Kette von TUSTEP-Prozeduren zur Erstellung des gedruckten Vorlesungsverzeichnisses aus nur wenig veränderter Perspektive ebensogut als Programmkomplex für elektronisches Publizieren betrachten, der auch konventionellen Satz beherrscht, eine Perspektive, die bei der Konzeption der Kodierung genau so anvisiert worden war.

Leitende Idee der Umsetzung in die HTML-Struktur ist es, die Ausgangstextdatei durch das Einfügen entsprechender TUSTEP-Kommandoaufrufe in der erforderlichen Form so zu modifizieren, daß TUSTEP anschließend diese Textdatei wie eine Prozedur verarbeitet, die den ursprünglichen Text an dynamisch definierten Stellen segmentiert, auf unterschiedlich viele, kleinere Textdateien verteilt, dazu auch noch die Titelseiten und Leitseiten erzeugt und in diese die für die Verknüpfung aller Dateien miteinander notwendigen 'Links' bzw. 'Aufsatzpunkte' einträgt.

Voraussetzung dafür, daß diese Prozedur problemlos abläuft, ist eine Gliederungsdatei, die für jeden Teil des Vorlesungsverzeichnisses die Stellen angibt, an denen die Datei aufgetrennt oder an denen ein 'Link' angelegt werden soll. Diese Gliederungsdatei wiederum wird erzeugt, indem aus der Ausgangstextdatei jeweils die Überschriftstypen mit der entsprechenden Gliederungsfunktion herauskopiert und mit zusätzlichen Kennzeichnungen versehen werden, die - je nach Funktion - festlegen, ob die entsprechende Überschrift, und damit auch die Daten, die danach folgen, über die erste oder zweite Gliederungsebene elektronisch präsentiert werden sollen. Auf der ersten Gliederungsebene wird beispielweise das Lehrangebot einer Fakultät für die elektronische Darstellung in Fächer, Studien- oder Prüfungsabschnitte zergliedert, auf der zweiten Gliederungsebene werden die Untergliederungen innerhalb der Fächer, Studien- oder Prüfungsabschnitte erfaßt, über die der Zugriff auf die Veranstaltungsdaten möglich sein soll.

Mit diesem Verfahren kann zeitgleich mit dem konventionellen Satz, aber auch zu beliebigen Aktualisierungsterminen eine elektronische Fassung hergestellt und mit der entsprechenden Webseite der Universität verknüpft werden. Das Resultat kann unter der Adresse http://www.uni-wuerzburg.de mittlerweile für vier Jahrgänge begutachtet werden, das Lehrangebot der Fakultäten beispielweise in der Sektion "Informationen für Studierende".

5. Perspektiven

Die Verfahrensabläufe wurden inzwischen weiter optimiert. Für die Datenerfassung hat z.B. die Zentralverwaltung ein maskenorientiertes Programm entwickelt, das chaogene Datenkodierungen gar nicht erst entstehen läßt, die TUSTEP-Prozeduren sind in komfortablen Makro-Aufrufen versteckt und für TUSTEP-Ignoranten mit ausführlichen Hilfstexten bzw. Bildschirmausgaben über den Stand der Verarbeitung während des Programmablaufs unterlegt. Durch geringe Veränderungen am Durchschuß einzelner Hierarchie-Ebenen konnte ohne Verlust an Übersichtlichkeit auch der Umfang noch weiter reduziert werden. Er pendelt zur Zeit im Wintersemester um die Marke von 360 Seiten, im Sommersemester - ohne den Personalteil der Fakultäten - um die 265 Seiten. Auch der Preis hat sich mehr als halbiert.

Die ansprechenden Erfahrungen mit TUSTEP bei der Erstellung der elektronischen Edition sollten allerdings nicht verdecken, daß es an Erfahrungen in der Handhabung von Texten in dem neuen Medium 'Datennetz' noch mangelt. Dies beginnt schon bei elementaren technischen Fragen, etwa der Bildschirmfüllung, also der Abwägung von Gliederungsabstufungen im Hinblick auf das 'Rollen' einer umfangreicheren Seite oder das 'Blättern' zwischen vielen kleinen Dateien, von Problemen der Typographie, Perzeption, Wahrnehmungssteuerung oder dem Übertragungsaufwand bei der Internet-Nutzung ganz zu schweigen. Durch das Angebot an die Benutzer, per E-mail Kommentare abzugeben, gibt es jedoch schon erste, aufschlußreiche Rückmeldungen.

Auch die den unterschiedlichen Medien 'Druck' und 'Datennetz' innewohnenden Zwänge zeichnen sich deutlicher ab: war das gedruckte Vorlesungsverzeichnis schon immer eine Momentaufnahme von flüchtiger Aktualität in einer permanenten Form, so erscheint ihr gegenüber das elektronische Verzeichnis zumindest potentiell mit dem Anspruch permanenter Aktualität, freilich um den Preis flüchtiger Form. Aus solchen medialen Differenzen resultieren Gültigkeitskonflikte zwischen Netzdaten und gedruckten Daten. Hierzu ein Beispiel aus mehreren: Wenn in einem Hochschulwahljahr das Vorlesungsverzeichnis für das Wintersemester gedruckt wird, sind die neuen Gremienvertreter in den Universitätsorganen noch nicht bekannt, da noch gar nicht gewählt - die Wahlen finden aus vielerlei Gründen stets Anfang Juli statt. Die Netzdaten dürfen für diesen Datentyp daher keinesfalls durch die Druckdaten, in diesem Fall u.a. den Hinweis "bei Redaktionsschluß noch nicht gewählt", aktualisiert werden, denn natürlich üben die im Netz Genannten noch bis zum Ablauf ihrer Wahlperiode im September ihre Funktion aus. Im Oktober sind dann zwar die Netzdaten nicht mehr gültig, aber die Daten für den Druck des nächsten Vorlesungsverzeichnisses werden eigentlich erst zu Beginn des folgenden Jahres wieder aufbereitet. Mit der einmaligen Erzeugung einer elektronischen Textfassung "wie gedruckt" ist es also nicht getan: Trotz verkürzter Vorlaufzeiten durch den Einsatz der Datenverarbeitung veralten die Daten einfach, und das nicht nur ungleichmäßig, sondern teils auch noch mit sprunghaften Verfalldaten. Sie bedürften eigentlich von der ersten Publikation an permanenter Aktualisierung. Die freilich ist zeitaufwendig und fehleranfällig. Wir versuchen zur Zeit, hier einige Erfahrungen zu sammeln mit einem Verfahren, das über das Netz unmittelbar auf die TUSTEP-Daten zugreift und dabei auch die notwendigen Autorisierungsvorgänge an der Universität berücksichtigt. Es könnte sich dazu eignen, die Datenerfassung in Zukunft gleich über das Netz vorzunehmen. Das würde dann die jetzige Ausgangssituation umkehren: die konventionelle Druckfassung würde zum Nebenprodukt der elektronischen Publikation.

Die Erweiterung der Informationsbreite, z.B. durch 'Links', die zusätzliche Informationen über die Lehrenden (Adresse, Sprechstunde, Arbeitsgebiete) und das zu Vermittelnde (Inhaltsangaben, Kursgliederungen, Bibliographien, Übungsaufgaben, Musterlösungen) anbieten, würde dem Informationszweck eines Vorlesungsverzeichnisses ebenfalls noch besser gerecht. Auch von da aus gesehen steht die Nutzung des neuen Mediums erst am Anfang. Freilich ändern sich die Szenarien rasch. Auf die weitere Entwicklung darf man daher gespannt sein.


aus: Protokoll des 68. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 30. November 1996