Protokoll des 25. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 19. Juni 1982

 

Allgemeine Information

Die im Kolloquium angekündigte EDV-Fibel ist inzwischen erschienen:
Wilhelm Ott, Hans Walter Gabler, Paul Sappler
(im Auftrag und in Zusammenarbeit mit der Arbeitsgemeinschaft Philosophischer Editionen der Allgemeinen Gesellschaft für Philosophie in Deutschland):
EDV-Fibel für Editoren. Stuttgart: frommann-holzboog; Tübingen: Niemeyer 1982.

 

Wolfgang Schenkel (Ägyptologisches Institut)

Göttinger und Tübinger Konkordanz zu den altägyptischen Sargtexten

Ziel des Projektes ist die Erstellung einer Wortkonkordanz und einer größeren Anzahl von Indizes zu dem bislang linguistisch und religionshistorisch ungenügend erschlossenen Korpus der altägyptischen Sargtexte.

Es handelt sich bei diesem Korpus um Texte, die zum Gebrauch des Verstorbenen vorzugsweise auf Särgen zur Zeit des ägyptischen Mittleren Reiches (um und nach 2.000 v. Chr.) angebracht wurden und die zwischen den besser bekannten und länger erforschten Textkorpora der Pyramidentexte und des Totenbuches zeitlich und textgeschichtlich in der Mitte stehen.

Die Teiltexte ("Sprüche") sind bis zu mehreren Dutzend Malen belegt, durchschnittlich etwa dreimal. Der Gesamtumfang des Textkorpus, einschließlich der (oft beträchtlich voneinander abweichenden) Mehrfachbezeugungen, liegt bei ca. 600.000 laufenden Wörtern. Zum Vergleich: Das Große Wörterbuch, in internationaler Zusammenarbeit unter der Ägide der deutschen Akademien erstellt, erfaßte im ersten Anlauf Texte im Umfang von ca. 1,5 Millionen laufenden Wörtern, im Endausbau ca. 2,5 Millionen.

Vorarbeiten zum Projekt gehen bis in das Jahr 1963 zurück. Erste Versuche wurden ab 1966 im ehemaligen Deutschen Rechenzentrum durchgeführt. Das derzeitige Projekt wurde im Sonderforschungsbereich 13 in Göttingen im Jahre 1972 begonnen. Der Abschluß des Unternehmens wird noch einige Jahre auf sich warten lassen.

Die Grundprobleme der Erstellung einer Konkordanz mit Hilfe der EDV sind zwei:

Das Problem der Transkription resultiert daraus, daß man bislang in Transkriptionen im großen und ganzen lediglich die in der Hieroglyphenschrift abgebildete Konsonantenfolge festzuhalten pflegt (NB: Vokale werden nicht geschrieben), andere Komponenten der Schrift, die wesentlich zu ihrer Lesbarkeit beitragen, dagegen beiseite läßt, vor allem die semantische Komponente der Schrift, die inhaltliche Merkmale der linguistischen Einheiten notiert.

Das Problem der Mehrdeutigkeit ergibt sich daraus, daß nur konsonantische Phoneme geschrieben werden, die zur Vereindeutigung der Formen in der Praxis sehr hilfreichen semantischen Elemente jedoch in orthographischer Hinsicht noch nicht in hinreichendem Ausmaß untersucht worden sind.

Zur Lösung des Transkriptionsproblems wurde im vorliegenden Projekt etappenweise ein neues und einigermaßen vollständiges Transkriptionssystem entwickelt. Das Problem der Mehrdeutigkeit wird mit präeditorischen Zusätzen bei der Textaufnahme behoben.

Die gewählte Lösung ist ein Kompromiß. Andere Ägyptologen haben Maximal- bzw. Minimallösungen vorgezogen:

Einige Details zu diesem Projekt:


 

Diskussion

Geplant ist die Veröffentlichung der Konkordanz samt den zugehörigen Registern in Buchform (etwa 4-5 Lexikonbände). Trotz der Menge des zu publizierenden Materials ist der Druck auf Dauer sicherlich preisgünstiger als etwa der Zugriff auf die Konkordanz über ein automatisches Abfragesystem; außerdem enfällt für den Benutzer die Abhängigkeit vom Vorhandensein eines Computersystems mit dazugehörigem Datenbanksystem.

Es gibt die Möglichkeit, die Konkordanz in Hieroglyphen zu drucken. Dagegen spricht erstens, daß der Platzbedarf hierfür größer ist als für die transkribierte Form. Zweitens hat die analytische, transkribierte Form einen höheren Informationsgehalt, den die Hieroglyphen nicht wiedergeben. Fraglich ist jedoch, ob die Benutzer der Konkordanz bereit sein werden, sich in das Transkriptionssystem einzuarbeiten.

Die EDV-Entwicklung ist schneller als der Fortschritt des Projektes. Die Einführung neuer Computersysteme erfordert jeweils einen großen Umstellungsaufwand für die Programme. Dennoch ist zu hoffen, daß die Investition für die Erstellung der Computerprogramme und für deren Umstellungen durch das Ergebnis der Konkordanz gerechtfertigt werden, wenn sie einmal fertiggestellt sein wird.
 

Gerhard Fichtner (Institut für Geschichte der Medizin)

Konkordanz der Korrespondenz von Sigmund Freud.
Zu den Vor- und Nachteilen von Standard- und Spezialprogrammen

I. Das Projekt Freud-Briefe

Briefe stellen für den Historiker eine der reizvollsten Quellen dar, da sie im Gegensatz zu anderen historischen Quellen nicht nur Begebenheiten berichten, sondern in weitem Umfang auch Motivationen des Handelns enthüllen und Einblicke in die Gedankenwelt des Briefschreibers geben. Eine Darstellung der Entwicklung der Psychoanalyse ist ohne Berücksichtigung des umfangreichen Briefwechsels ihres Begründers, Sigmund Freud, undenkbar. Freud war zeit seines Lebens ein glänzender und eifriger Briefschreiber. Allein aus der Verlobungszeit sind über 2000 Briefe erhalten geblieben, die ein farbiges und anschauliches Bild der beruflichen Anfänge Freuds vermitteln. Insgesamt dürften schätzungsweise 12.000-15.000 Briefe erhalten geblieben sein, von denen freilich erst ein kleiner Teil veröffentlicht worden ist.

Um dieses umfangreiche Briefcorpus wenigstens in seinem - an den verschiedensten und teils entlegenen Stellen - veröffentlichten Teil der historischen Forschung bequem zugänglich zu machen, wurde im Jahre 1976 damit begonnen, eine Konkordanz der Korrespondenz von Sigmund Freud und seinen Briefpartnern mit Hilfe der EDV zu erstellen. Solche Briefe sind teilweise als geschlossene Briefwechsel veröffentlicht worden (auch in verschiedensten fremdsprachigen Übersetzungen), teilweise in Zeitschriftenartikeln, teilweise in biographischen Arbeiten über Freud.

Ziel des Unternehmens war es, Briefe, die mehrfach und an verschiedenen Stellen (evtl. auch als Übersetzungen) publiziert wurden, maschinell identifizieren zu können und auf dieser Grundlage chronologisch oder nach Partnern geordnete Verzeichnisse herzustellen. Später sollten diese Verzeichnisse vielleicht noch durch Sachindices und/oder Regesten ergänzt werden. Bisher wurden etwa 4500 Briefe mit ca. 7500 Einträgen erfaßt und verarbeitet.

II. Aufbereitung der Daten

Folgende Punkte werden, soweit eruierbar, aufgenommen:

  1. Ort

  2. Datum
    (Reihenfolge: Jahr, Monat, Tag. Das Jahr wird in arabischen Zahlen ausgeschrieben, der Monat in üblicher Weise abgekürzt: Jan., Febr., März, Apr., Mai, Juni, Juli, Aug., Sept., Okt., Nov., Dez. Der Tag wird in arabischen Zahlen ohne Punkt geschrieben.)
    Das Datum kann unvollständig sein. Es kann ganz oder teilweise in eckigen Klammern stehen. Fehlt die Tagesangabe, so wird wie der nullte eines Monats eingeordnet. Fehlt die Monatsangabe, so wird wie der nullte Monat eines Jahres eingeordnet.
    Ein Datum kann auch lauten: 1915 Jan. Mitte. Dann wird eingeordnet, als lautete das Datum: 1915 Jan. 15.
    Ein Datum kann auch lauten: vor 1915 Jan. Mitte. Dann wird zwischen 14. und 15. Januar eingeordnet.
    Ein Datum kann auch lauten: nach 1915 Jan. Mitte. Dann wird zwischen 15. und 16. Januar eingeordnet.
    Lautet ein Datum: 1915 Jan. Anfang, so wird vor dem 1. Januar eingeordnet.
    Lautet ein Datum: 1915 Jan. Ende, so wird nach dem Monatsletzten (also wie 32.) eingeordnet.
    Lautet ein Datum: nach 1915 Jan. 6, so wird zwischen 6. und 7. Januar eingeordnet.
    Lautet ein Datum: vor 1915 Jan. 6, so wird zwischen 5. und 6. Januar eingeordnet.
    Lautet ein Datum: etwa 1915 Jan. 3, so wird unmittelbar vor dem 3. Januar eingeordnet.

  3. Empfänger des Briefes
    (Reihenfolge: Familienname, Vorname(n), z.B. Jones, Ernest oder: Eeden, Henrik van)

  4. Quellenangabe (z.B. Fliess (1950), 59)

  5. Absender des Briefes (Reihenfolge: Familienname, Vorname(n))

  6. Angaben über die Art des veröffentlichten Schriftstückes in Siglen oder in ausgeschriebenen Wörtern sowie die Angabe, ob lediglich eine Inhaltsangabe vorliegt.

    Beispiele:
    K= Karte
    AK= Ansichtskarte
    T= Telegramm
    Gedicht
    Faksimile
    Inhaltsangabe
    Werden mehrere Bezeichnungen angeführt, so sind sie durch Komma getrennt, z.B.:

    K, Inhaltsangabe

  7. Angabe über die Sprache des veröffentlichten Briefes, z.B. französisch, englisch usw. Deutsch veröffentlichte Briefe werden nicht eigens gekennzeichnet, wenn auch das Original deutsch geschrieben war. Übersetzungen werden mit einem (Ü) gekennzeichnet, z.B.: englisch (Ü). Das geschieht auch bei originalfremdsprachigen Briefen, die ins Deutsche übersetzt wurden: deutsch (Ü).
Jeder veröffentlichte Brief wird als eine Einheit behandelt, die mit dem Steuerzeichen § beginnt.

Die einzelnen Punkte haben die Steuerzeichen:

&1 Absenderort
&2 Datum (Jahr, Monat, Tag)
&3 Empfänger
&4 Quelle (Verfasser (Jahr), Seitenzahl)
&5 Absender
&6 Art des Schriftstücks
&7 Sprache

Beispiel eines Briefeintrags:
§ &1 [Wien] &2 1882 Juli 4 (II) &3 Bernays, Martha &4 Freud (1968), 46 &5 Freud, Sigmund &6 K

Für häufig vorkommende Namen sind bei der Dateineingabe eine Reihe von Kürzeln verwendet worden. Diese Kürzel werden bereits für den ersten Ausdruck aufgelöst.

III. Einsatz der Programme

1. Chronologische Liste der Korrespondenz

Die Briefe werden nach dem Datum geordnet und durchnumeriert. Die gleichen Briefe sind aber an verschiedenen Orten veröffentlicht oder auch in Übersetzungen. In diesem Fall erscheint die Angabe der Nummer als 1a, 1b, 1c usw.

Gleiche Briefe können immer dann vorliegen, wenn &2 (Datum), &3 (Empfänger) und &5 (Absender) übereinstimmen. Die anderen Punkte brauchen nicht übereinzustimmen.

Damit Schreibfehler leichter erkannt werden, wird automatisch ein Merkzeichen gesetzt, wenn &3 (Empfänger) und &5 (Absender) übereinstimmen, weil das nicht richtig sein kann. Für die Einordnung unter dem Datum gilt das oben Gesagte.

Sind am gleichen Tage Briefe an verschiedene Empfänger geschrieben worden, so wird alphabetisch nach den Namen des Empfängers geordnet. Sind am gleichen Tage Briefe an denselben Empfänger geschrieben worden, so müssen diese Briefe nach der Datumsangabe ein Unterscheidungszeichen (z.B. I, II usw.) haben.

Für die Einordnung gleicher Briefe, die an verschiedenen Orten veröffentlicht wurden, ist maßgebend das Jahr der Veröffentlichung unter Punkt 4, wo es in runden Klammern steht, z.B. Fliess (1950), 56. Hier wird chronologisch geordnet.

Für die Einordnung gleicher Briefe in verschiedenen Sprachen gilt: Zuerst kommt die Veröffentlichung des Briefes in der Originalsprache (&7), dann folgen die Übersetzungen in der alphabetischen Reihenfolge der Sprachen.

Bevor das Programm durchgeführt werden kann, müssen nicht nur die Kürzel aufgelöst sein (da teilweise Kürzel verwendet wurden, teilweise nicht), sondern auch, wenn Punkt &5 nicht auftaucht, dieser eingefügt werden. In diesen Fällen ist der Absender immer: Freud, Sigmund.

2. Liste nach Briefwechseln

Die Briefe werden nach Briefwechseln geordnet, z.B. Briefwechsel Sigmund Freud - Karl Abraham. Hierbei werden nur die Punkte &2, &3 und &5 ausgedruckt, davor aber die Nummer, die in Programm 1 vergeben wurde. Der Ausdruck erfolgt in zwei Spalten, wobei die Briefe von Freud jeweils links erscheinen, die Briefe an Freud jeweils rechts.

Die verschiedenen Briefwechsel folgen alphabetisch aufeinander; innerhalb der Briefwechsel wird chronologisch geordnet.

IV. Vor- und Nachteile von Standard- und Spezialprogrammen

Ein erfahrener Programmierer der Abteilung für literarische und dokumentarische Datenverarbeitung am Zentrum für Datenverarbeitung der Universität Tübingen (Kuno Schälkle) erstellte die für die Herstellung der Konkordanz erforderlichen Spezialprogramme. Das Schreiben und Austesten der Programme erforderte etwa 2-3 Wochen Arbeitszeit.

Nach der Entwicklung des Tübinger Standard-Programmpakets für Textverarbeitung (TUSTEP) konnten alle Aufgabenstellungen des Projekts auch mit Hilfe dieser Standard-Programmbausteine gelöst werden. Das Schreiben und Austesten der dafür notwendigen Parameterkarten benötigte 2-3 Stunden Arbeitszeit.

Es bot sich damit die konkrete Möglichkeit eines Vergleichs zwischen Spezialprogrammen und Standardprogrammen bzw. -programmpaketen.

Besondere Vorteile von Standardprogrammpaketen sind:

  1. Die Abhängigkeit des Benutzers vom Programmierer entfällt oder wird auf ein Minimum eingegrenzt. Damit entfällt auch die Schwierigkeit, dem Programmierer spezifische Sachverhalte eines Projekts vermitteln zu müssen.
  2. Der Benutzer kann die Form der Ein- und Ausgabe von Daten jederzeit ändern, also flexibel gestalten.
  3. Der Aufwand an Programmierzeit (und damit an Kosten) für ein einzelnes Projekt verringert sich drastisch, allerdings steigt der Aufwand für die Standardprogramme, die nun freilich vielen Benutzern zugutekommen.
  4. Optimierung der Programme wird eher bei Standardprogrammen als bei Spezialprogrammen angestrebt.
  5. Die Programmpflege, die bei Standardprogrammen unbedingt notwendig ist, erleichtert den Wechsel auf neue Rechenanlagen. (So konnte das Spezialprogramm in Tübingen nicht auf die neue UNIVAC 1100/80 übernommen werden, da größere Umstellungen erforderlich gewesen wären, dagegen war die Umstellung mit den Standardprogrammen problemlos.)

Vorteile von Spezialprogrammen:

Spezialprogramme werden infolge ihrer spezifischen Natur in der Regel mit geringerer Rechenzeit auskommen als Standardprogramme. Doch zeigte der Vergleich, daß die hier zu erzielende Ersparnis gegenüber den erheblichen Einsparungen in der Programmierzeit nicht zu Buche schlägt und die höhere Optimierung der Standardprogramme zusätzlich ausgleichend wirkt.
 

Diskussion

Eine charakteristische Eigenschaft von Standard-Programmen ist ihre Eignung zur Lösung von verschiedenen Aufgaben, die strukturell ähnlich sind. Das Programmsystem TUSTEP unterscheidet sich von ähnlicher Software vor allem dadurch, daß es sich nicht um ein in sich abgeschlossenes einzelnes Programm, sondern um ein Paket von aufeinander abgestimmten Programmen (Bausteinen) handelt.

An Standardprogramme ist außer der Forderung nach vielseitiger Einsetzbarkeit auch die Forderung nach Kompatibilität zu stellen, d.h. nach Übertragbarkeit an andere Orte oder auf andere Maschinen mit vertretbarem Aufwand an Zeit und Personal. Zur Kompatibilität gehört auch die Möglichkeit der Anschlüsse (Interfaces) für die Daten-Ein- und Ausgabe, z.B. zu anderen Programmpaketen.

 
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 9. Juli 2002