Protokoll des 36. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 15. Februar 1986

 

Allgemeine Information

Die Ausstattung des Forschungsschwerpunktes "Wissenschaftliche Textdatenverarbeitung" am ZDV Tübingen wurde vervollständigt. Folgende Personal Computer stehen zur Verfügung: 3 Sperry IT (auch als Terminal verwendbar), 1 Commodore PC 20, 1 Olivetti M 24, 1 Apple Macintosh; dazu folgende Software: Wordstar, WORD, Scientex, T3 und EDISS (mit umschaltbarer Tastatur für verschiedene Zeichensätze).
 

Heinrich Hunger (Akademisches Auslandsamt)

Einsatzmöglichkeiten von TUSTEP zur flexiblen Gestaltung von Verwaltungsaufgaben

TUSTEP wurde entwickelt, um die Möglichkeiten der Elektronischen Datenverarbeitung den Geisteswissenschaften zu erschließen. Dieses Instrumentarium für die Lösung von Verwaltungsaufgaben verwenden zu wollen, scheint ein Mißgriff.

An einigen Beispielen soll gezeigt werden, wozu im Akademischen Auslandsamt der Universität Tübingen Datenverarbeitung eingesetzt wird. Das Auslandsamt verwaltet einen Bestand von ca. 16000 Akten ehemaliger ausländischer Studierender unserer Universität. Dieser Bestand wächst derzeit jährlich um etwa 450 Akten. Ursprünglich wurde er alphabetisch geordnet. Bei der Vielfalt möglicher Lesarten ausländischer Namen und der jeweils eigenwilligen Interpretation dessen, was "alphabetisch" ist, durch die Beteiligten geriet das Ganze zum schwerzugänglichen Gesamtkunstwerk.

Das Finden einer lang gesuchten Akte gehörte bald zu den großen persönlichen Erfolgen im Leben der Kollegen.

Zur Bewältigung dieses Problems entschieden wir uns, den Aktenbestand schlicht durchzunumerieren. Jeder Nummer wurden ein oder, wenn nötig, mehrere Namen oder Lesarten desselben zugeordnet. Für jedes Paar "Zahl/Namen" wurde eine Lochkarte gestanzt. Der Rechner erstellte dann eine alphabetische Namensliste.

Das sofortige Finden einer Akte gehörte bald zu den Selbstverständlichkeiten im Leben der Kollegen. Wir verwenden dieses Verfahren der fortlaufend numerierten Ablage und deren Erschließung über alphabetische Listen inzwischen auch in anderen Bereichen mit Erfolg.

Zahlen als Ordnung stiftende Größen und Computer als Mittel ihrer beliebigen Manipulation! Dies führt geradewegs zum EDV-Konzept "erfassen, verschlüsseln, verarbeiten", und dieses prägt den EDV-Einsatz in den Verwaltungen bis heute.

Als aktuelles Beispiel sei das Studenten-Operations-System II (SOS II) der HIS GmbH angeführt, das auch in Tübingen verwendet wird.

Folgende Zeichenfolge im Datensatz eines Studierenden, der zwölf Karten à 80 Spalten umfaßt,

108G11351270 1234502822    020051826   020052   ...
steht für folgenden Sachverhalt:

108  heißt: es handelt sich um die Kartenart '8'
G  steht für 'Hochschulwechsler'
1135  ist eine von der erfassenden Stelle frei zu vergebende Nummer, unter der dieser Erfassungsbeleg im Stapel wieder aufzufinden ist
1270  ist die Nummer der Universität Tübingen im 'Hochschulschlüssel'
 12345  ist die Matrikelnummer des Studierenden nebst Prüfziffer '5'
02  ist der nach 'Schlüssel Nr. 035' verschlüsselte angestrebte Abschluß 'Magisterprüfung'
822  das nach 'Schlüssel Nr. 030' verschlüsselte 1. Studienfach 'Neuere deutsche Literatur'.

Da hierzu keine Vertiefungsrichtung definiert ist, folgen drei Leerstellen.

02  steht nun für '2. Studiengangsemester' und die nachfolgende
0  für den Umstand, daß während dieses Studienabschnittes noch keine Beurlaubung erfolgt ist.
05  steht für das 5. Fachsemester und der
1  entnehmen wir, daß es sich bei dem 1. Studienfach um das Hauptfach handelt usw. usw.

Zweifellos eine Erfassung des Umstandes, daß ' 1234' in Tübingen Germanistik studiert, die an Eindeutigkeit nichts zu wünschen übrig läßt. Die Eindeutigkeit wird dadurch erreicht, daß man eine Ziffernfolge untrennbar mit einer bestimmten Position im Datensatz verbindet. Sie wird zur Zahl.

Verschiebt man im obigen Beispiel die Prüfziffer '5' um eine Position nach rechts, wird aus 'Magisterprüfung' ein 'sonstiger Abschluß in der BRD'; '282' ist nicht als Schlüsselzahl eines Studienfaches definiert und '2   ' keine Zahl.

Um einen solchen Datensatz veränderten Anforderungen anzupassen, die sich meistens in erweiterten (sprich "geplatzten") Schlüsseln niederschlagen, muß er neu erstellt werden. Die Anpassung der Programme ist eine mühselige Arbeit, zumal beim Arbeiten mit Schlüsseln auf umfangreiche Plausibilitätskontrollen nicht verzichtet werden kann.

Wir hatten im Auslandsamt mit einem EDV-gestützten Zulassungsverfahren entsprechendes Lehrgeld zu zahlen. Als 1973 eine Lochkarte pro Fall nicht mehr ausreichte, nahmen wir drei. Damit waren wir zukunftssicher, denn nur eine halbe mehr hätte ausgereicht, bei dreien aber konnte man von bisher zweistelligen zu dreistelligen Schlüsselzahlen übergehen.

Als wir 1977 bei fünf Karten und vierstelligen Schlüsselzahlen mit einer zusätzlichen Prüfziffer angelangt waren, beschlichen uns erste Zweifel an dem Konzept "erfassen, verschlüsseln, verarbeiten". Dabei waren wir auf die aus heutiger Sicht groteske Idee verfallen, alle verwendeten Begriffe in einen Schlüssel zu verpacken und die Karten in gleichlange Felder einzuteilen, um so unsere Freiheit wiederzuerlangen, sprich von der unheiligen Allianz von Bedeutung und Position loszukommen.

Für die Sachakten-Registratur des Amtes waren wir inzwischen zu einem Konzept mit sog. 'sprechenden Schlüsseln' gelangt. Die Ziffernfolge war neunstellig! Die ersten drei standen für Geographisches, die nächsten drei für eine Institution, und die drei letzten wurden aus einer dreidimensionalen Matrix abgeleitet, die sich ergab, wenn man für die betreffenden Personen neun Gruppen und für die Art der Verwaltungstätigkeit neun Kategorien definierte und diesen einen der sechs Problembereiche voranstellte. In der Sachakte Nummer

486 325 123
sollte also künftig alles zu finden sein, was die zahlenmäßige Erfassung (= 3) der Tübinger (= 2) Studierenden (= 1) an der TUFTS University (= 325) in den U.S.A. (= 486) betraf.

Diese Schlüssel haben nie 'gesprochen'. Es blieb uns die Einsicht nicht erspart, daß der ordnenden Kraft von Zahlensystemen aller Art Grenzen gesetzt sind und folglich auch dem Einsatz dieser Art der Datenverarbeitung zur flexiblen Gestaltung unserer Verwaltung.

Im September 1981 lernten wir TUSTEP kennen. Dies führte zur Wiederentdeckung der Sprache als einem Mittel, Sachverhalte zu beschreiben.

Aus den drei Integer-Zahlen, die im Format I2 in die Variablen IDAT1, IDAT2 und IDAT3 eingelesen werden mußten, wurde wieder ein schlichtes Datum, mit dem man zu allem Überfluß doch noch rechnen konnte! Aus '486' wurde wieder amerikanisch, und im Gegensatz zu '468' war bei amerikansich immer noch klar, was gemeint war. Die der Sprache immanenten "Plausibilitätskontrollen" waren überzeugend.

Texte, die anfallen, wenn in einer Verwaltung Sachverhalte beschrieben werden, zeichnen sich durch eine gewisse Monotonie aus; sie sind eher mehr als weniger strukturiert und mit allerlei Abkürzungen durchsetzt.

Solche Texte werden durch TUSTEP ohne Verschlüsselungs-Akrobatik für die Datenverarbeitung zugänglich. Der Baustein KOPIERE erwies sich dabei als eine 'problemorientierte Programmiersprache', die FORTRAN eindeutig überlegen ist. KOPIERE erlaubt Problemlösungen, die an der "relativen" Struktur eines Textes orientiert sind; die absolute Position eines für die Lösung des Problems relevanten Textteiles ist unerheblich.
 

Kurt Kloocke (Romanisches Seminar)

Vorbereitung einer kritischen Gesamtausgabe: OEuvres complètes de Benjamin Constant

1.) Ausgangslage

Es gibt derzeit noch keine kritische Gesamtausgabe der Werke von Benjamin Constant (1767-1830). Der Umfang des erhaltenen Materials einschließlich der Korrespondenz wird auf etwa 65 Bände durchschnittlichen Umfangs (ca. 400 Seiten) geschätzt. Die Planungsarbeiten des Projekts, an dem etwa 25 Mitarbeiter beteiligt sind, sind seit 1980 im Gange; erste konkrete Ergebnisse sind in etwa zwei Jahren zu erwarten.

Auszugehen ist von uneinheitlicher Textüberlieferung. Wir verfügen einerseits über zwei sehr große Handschriftenfonds (Paris, Bibliothèque Nationale; Lausanne, Bibliothèque Cantonale et Universitaire), andererseits über eine nicht unbeträchtliche Menge zerstreuten Materials (einzelne Briefe, aber auch vollständige Handschriften) in vielen Bibliotheken Europas und in Privatbesitz. Die Handschriften reichen vom zerrissenen Notizzettel ohne feste Zuordnung bis zur kalligraphischen Abschrift eines Textes. Ferner gibt es eine umfangreiche Überlieferung von nur gedruckt erhaltenen Texten.

Intendiert ist eine kritische Gesamtausgabe, die von drei Apparaten begleitet werden soll:

Die Ausgabe soll vor jedem Text einführende Vorworte haben, jedoch keinerlei interpretierenden Beitext. Geplant sind ferner erschließende Register für jeden Band und die Ausgabe insgesamt.

2.) Praktische Organisation der Arbeit

Die Aufgaben wurden geteilt, und zwar so, daß die Edition der Korrespondenz in Cambridge mit den dortigen Programmen erstellt werden soll. Zu einem späteren Zeitpunkt sollen die fertig bearbeiteten Daten aus Cambridge nach Tübingen übertragen werden.

Die Bearbeitung der Textbände wird in Tübingen erfolgen. Allerdings ist eine dezentrale Texterfassung vorgesehen.

Aus dieser Arbeitsteilung ergeben sich praktische Probleme, die aber, wie erste Versuche zeigten, lösbar sind.

3.) Probelauf

Bei einem Unternehmen dieses Umfangs ist ein Probelauf anhand einer beschränkten, aber aussagefähigen Textmenge angezeigt. Ausgewählt wurde ein Text, der die gesamte Überlieferung (Handschriften, Drucke) möglichst vollständig repräsentiert. Das war bei den Mémoires sur les Cent-Jours gegeben.

Wir besitzen insgesamt fünf Drucke, die zwischen 1819 und 1829 liegen und vom Vorabdruck in einer Zeitung bis zur Ausgabe letzter Hand reichen.

Constant hat diesen Text laufend verbessert, erweitert, verändert. Es gibt allerdings auch wahrscheinlich eine Titelauflage oder einen Nachdruck vom erhalten gebliebenen Satz.

Die handschriftlichen Materialien reichen von ersten Notizen bis zu ausgearbeiteten Fassungen (Vorstufen) des Werkes, die mit der Endfassung zwar streckenweise identischen Text haben, streckenweise aber erheblich davon abweichen.

Das Ziel ist es, das gesamte Material zunächst auf Datenträger zu nehmen und in einer späteren Phase in geeigneter Form und möglichst vollständig in einem Band zu publizieren.

Daraus ergab sich folgender Arbeitsplan:

Die Texterfassung wurde von drei verschiedenen Personen durchgeführt. Sie ist nach etwa 1500 Arbeitsstunden abgeschlossen, einschließlich der Korrektur der eingegebenen Texte anhand der Listen nach erster Kollation mit den Vorlagen.

In einer zweiten Phase wurden durch systematischen Vergleich der parallel überlieferten Texte mithilfe des TUSTEP-Programms VERGLEICHE die zwischen den Dateien bestehenden Unterschiede festgehalten. Daraus ergab sich einerseits die Möglichkeit, die im Laufe der Arbeit mehrmals veränderten Kodierungen zuverlässig in allen Dateien zu vereinheitlichen. Andererseits wurden die festgestellten Differenzen benutzt, die Daten mit den jeweiligen Textzeugnissen gezielt zu konfrontieren, um solchermaßen übersehene Schreibfehler zu entfernen.

Ein weiterer Korrekturgang durch einen "fremden" Revisor ist vorgesehen.

Durch den automatischen Textvergleich hat sich der Verdacht bestätigt, daß einer der Drucke entweder eine Titelauflage oder ein Neudruck von den erhaltenen Druckstöcken sein dürfte. Es liegt keine Varianz vor. Diese Frage ist durch Autopsie der Exemplare zu entscheiden.

Die Varianz der Drucke ist auf der derzeitigen Grundlage des Arbeitsstandes (also noch vor der endgültigen Revision) vollständig ermitttelt (Programm VERGLEICHE) und in einer Datei zusammengefaßt. Die weitere Bearbeitung steht bevor.

Die Dateien mit den korrigierten Daten können nach Erfassung der Varianz vorläufig auf Bänder abgespeichert werden. Der Text, der als Grundlage für den kritischen Text dienen soll, ist die zukünftige Arbeitsdatei.

Die handschriftliche Überlieferung ist vollständig erfaßt und wird nach der ebenfalls abgeschlossenen ersten Kollationierung mit den Handschriften korrigiert. Eine zweite Kollation durch einen Revisor wird unmittelbar darauf folgen.

Die Bearbeitung dieser Materialien ist wegen des fragmentarischen Zustands vieler Teile der Überlieferung besonders schwierig. Eines der heikelsten Probleme ist die korrekte Zuordnung der Fragmente zu ihrem Kontext. Diese Schwierigkeit dürfte mithilfe von KWIC-Indices weitgehend zu lösen sein. Erste Versuche sind ermutigend.

Die Vorarbeiten für die Register sind teilweise jetzt schon Bestand der Daten. Erfaßt sind alle Eigennamen und alle Titel der zeitgenössischen Literatur. Die Erstellung des Sachindexes hingegen ist in einem eigenen Arbeitsgang nach Abschluß des kritischen Textes einschließlich der kritischen Apparate vorgesehen.

Die Publikation des Bandes soll erst erfolgen, wenn wenigstens ein weiterer Textband zum Vergleich vorliegt, um eventuell unbemerkt gebliebene strategische Irrtümer revidieren zu können.

 
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 9. Mai 2003