Protokoll des 26. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 20. November 1982

 

Allgemeine Information

Mit den Tübinger Satzprogrammen sind bisher rund 250 Bücher mit zusammen etwa 80.000 Seiten produziert worden, davon etwa 20 kritische Editionen.
 

Norbert Hofmann, Paul Sappler (Deutsches Seminar)

Erschließung und Katalogisierung von Lehr- und Anschauungsmaterial am Beispiel des Verzeichnisses der Video-Bänder der Neuphilologischen Fakultät

Seit mehr als einem Jahrzehnt ist zu beobachten, wie sich die traditionelle Literaturwissenschaft nicht-kanonisierter Literatur öffnet und neben der Trivialliteratur auch die vielfältigen Produkte der elektronischen Medien zum Untersuchungsgegenstand macht. Der Alltag des überwiegenden Teils der Bevölkerung ist heute durch eine weitgehende Kongruenz der Phänomene Kultur und Medienkultur gekennzeichnet. Dies hat soziale, politische und wirtschaftliche Konsequenzen. Ziel einer modernen Kulturwissenschaft muß es daher sein, Wirkungen und Einflüsse der elektronisch, vor allem durch das Fernsehen transportierten Inhalte auf die Einstellungen und das Verhalten der Zuschauer erklären und gegebenenfalls negative Auswirkungen durch medienpädagogische Bemühungen vermeiden zu helfen.

Die Medienabteilung der Neuphilologischen Fakultät der Universität Tübingen trägt dieser erziehungspolitischen Herausforderung unserer Zeit dadurch Rechnung, daß sie für die verschiedensten Bereiche, von den Nachrichten bis zum Kinderfernsehen, von der Werbung bis zur Literaturverfilmung, den Forschern Serviceleistungen anbietet: Neben der Koordinierung von Forschungsstrategien, der Vermittlung ausländischer Forscherkontakte und dem Nachweis einschlägiger Literatur werden vor allem Videoaufzeichnungen aus dem öffentlichen Fernsehen gemacht, entweder auf direkten Wunsch oder vorsorglich für bestimmte Sammelgebiete. Der Forschungsbedarf ist steigend; zu den über 2000 archivierten Videobändern und -kassetten kommen jährlich mehr als 400 hinzu.

Erschlossen wird dieses Bandarchiv durch zweierlei Hilfsmittel:

Die Daten, die im Katalog erscheinen sollen, werden gleichzeitig mit der Aufzeichnung einer Sendung für den sofortigen Zugriff auf Karteikärtchen festgehalten und später auf deren Grundlage maschinenlesbar gemacht. Von den Überlegungen, die die folgende maschinelle Verarbeitung bestimmen, sei nur weniges herausgehoben: Weil die Daten recht verschiedenartig sind und es keine Arbeitsnormen gibt, wie sie etwa die Arbeit des Bibliographen erleichtern, muß das Aufnahmeformat sehr flexibel sein. Damit nun aber bei der Vielzahl der möglichen Rubriken für den Bearbeiter der Zusammenhang mit den Registern durchsichtig bleibt und trotzdem nichts mehrfach aufgenommen werden muß, sind die Textteile, die in ein Register kommen sollen, mit Klammer-Codes markiert. Der Gefahr, die Aufnahme durch die Menge der Codes zu überlasten, wird durch folgendes Vorgehen begegnet: Die Registerklammern werden zunächst nicht mitgeschrieben, sondern bei der Umformung der Aufnahmefassung zur Arbeitsfassung ergänzt in den Rubriken, in denen sie zu erwarten sind; im Korrekturgang kann sich dann der Bearbeiter auf besondere Fälle und entstandene sinnlose Markierungen konzentrieren.

Fast die gesamte Datenverarbeitungsseite der vorgestellten Erschließung von Videobändern stützt sich auf TUSTEP.
 

Diskussion

Die Datenerfassung und die Korrektur der erfaßten Daten erfolgt durch Hilfskräfte. Aus arbeitstechnischen Gründen werden die Daten zuerst manuell auf Karteikarten erfaßt, die dann als Vorlage für die Erfassung am Sichtgerät dienen.

 

Friedrich Seck (Universitätsbibliothek)

Erstellung von Bibliographien auf der Basis eines universell verwendbaren Datenformats

I. Warum EDV?

Unter den Anwendungsmöglichkeiten der EDV für im weiteren Sinn literarische Zwecke gehört die Herstellung von Bibliographien zu den dankbarsten. Die wichtigsten Vorteile sind:

  1. Die Daten können zwischen Erfassung und Lichtsatz, soweit sie unvollständig oder fehlerhaft sind, kontinuierlich verbessert werden; Fehlerquellen wie die Abschrift bei der Manuskriptherstellung und der manuelle Satz entfallen.
  2. Register können automatisch und ohne Übertragungsfehler hergestellt werden.
  3. Durch während der Bearbeitungszeit hergestellte Interimsregister und Wortindices können Inkonsequenzen und Schreibfehler leichter erkannt werden; sie können leicht korrigiert und durch automatischen Vergleich der korrigierten und der unkorrigierten Fassung leicht kontrolliert werden.
  4. Durch die Automatisierung der Satzherstellung läßt sich der Zeitraum zwischen Redaktionsschluß und Erscheinen der Bibliographie auf 1-2 Monate verkürzen; dadurch ist eine größere Aktualität erreichbar.
Voraussetzung ist, daß geeignete Programme zur Verfügung stehen.

II. Welches Verfahren?

Mit der Programmierung steht die Codierung der Daten in engem Zusammenhang. Hierfür sind zwei grundsätzlich verschiedene Verfahren üblich:

  1. Die Eintragungen werden im wesentlichen als Freitext erfaßt; nur die für Sortierung, Satzauszeichnung und Registereinträge benötigten Elemente erhalten besondere Codes.
  2. Jedes begrifflich unterschiedene Element einer Eintragung, das bei der Verarbeitung möglicherweise gesondert angesprochen werden kann, erhält ein eigenes durch einen Code bezeichnetes Datenfeld (analytische Codierung).

Die minimale Codierung bei der Freitexterfassung mag in einfachen Fällen eine geringfügige Arbeitsersparnis bringen, doch müssen die Eintragungen im endgültigen Wortlaut und mit allen Interpunktionen erfaßt werden. Bei anspruchsvolleren Projekten wird die Codierung, besonders durch nachträgliche Erweiterungen, leicht kompliziert und unübersichtlich. Bei analytischer Codierung können dagegen die Elemente einer Eintragung in beliebiger Reihenfolge erfaßt und die Interpunktionen und Deskriptionszeichen zwischen den Feldern vom Programm gesetzt werden; man kann auch nach Elementen auswählen (sortieren, recherchieren usw.), die dafür ursprünglich nicht vorgesehen waren.

III. Das Datenformat

Für die EDV-gestützte Katalogisierung in Bibliotheken sind analytische Datenformate erarbeitet worden. Für das hier vorgestellte Projekt bot es sich an, das Datenformat des künftigen Katalogverbundes Südwest zu nutzen und für bibliographische Zwecke abzuändern.

Das Datenformat benutzt einen dreistellig-numerischen Code, z.B. 200 bis 209 für beteiligte Personen, 410 für den Verlagsort usw. Neben den bibliographischen Eintragungen im eigentlichen Sinn sind sechs weitere Eintragungsarten vorgesehen, darunter Überschriften und Registerverweisungen.

IV. Die Herstellung einer Bibliographie

Die Einträge können in beliebiger Reihenfolge erfaßt und später nach einem mitgegebenen Sortierkriterium (Systemstelle, Kapitelnummer) sortiert werden. Erfaßt wird entweder am Sichtgerät oder mit einer Schreibmaschine mit OCR-A-Kugelkopf. Auch die einzelnen Felder einer Eintragung können in beliebiger Reihenfolge erfaßt werden. Für die Erfassung gelten vereinfachte Konventionen (Abkürzen häufiger Wörter, gemeinsame Erfassung gewisser meist gemeinsam vorkommender Felder, z.B. im Erscheinungsvermerk; Übernehmen des Zeitschriftentitels und anderer identischer Angaben aus dem vorangehenden Eintrag bei der Aufsatzerfassung). Querverweisungen innerhalb der Bibliographie können bereits bei der Erfassung vorbereitet werden; sie werden nach der Sortierung automatisch auf die geltenden laufenden Nummern umgestellt.

Die Datenverarbeitung mit TUSTEP läuft in mehreren Schritten ab:

  1. Aufbereitung der erfaßten Daten: Die einzelnen Felder werden auf Fehler geprüft, nach vereinfachtem Modus erfaßte Daten werden aufgelöst, die Felder der Eintragungen werden numerisch sortiert.
  2. Syntaxprüfung: Die Einträge als ganze werden auf inhaltliche Plausibilität geprüft (Vorhandensein oder Fehlen bestimmter Felder in Abhängigkeit von der Art der Eintragung).
  3. Sortierung: Die Eintragungen werden kapitelweise und innerhalb der Kapitel wahlweise alphabetisch oder chronologisch sortiert.
  4. Montage der Einträge für den Druck: Die für die Druckeinträge erforderlichen Felder werden ausgewählt, in die geforderte Reihenfolge gebracht und mit Deskriptionszeichen (Interpunktionen) sowie Satzsteuerzeichen (Makros) versehen. Die montierten Einträge entsprechen den Vorschriften der "Regeln für die alphabetische Katalogisierung" (RAK). Die so erstellten Daten können unmittelbar als Quelldatei des Satzprogramms verwendet werden.
  5. Korrekturausdruck: Aus den nach Ziffer 4 montierten Daten kann ein gut lesbarer Korrekturausdruck auf dem Schnelldrucker oder dem Typenraddrucker hergestellt werden.
  6. Registerherstellung: Vorgesehen sind:
    1. Personenregister,
    2. Urheber-, Sachtitel- und Schlagwortregister,
    3. Textstellen- und
    4. Bibelstellenregister.
    Die in den entsprechenden Feldern angegebenen Verfasser usw., Körperschaften und (soweit gekennzeichnet) Sachtitel kommen automatisch in die Register; Schlagwörter dann, wenn sie in besonderen Feldern eigens angegeben werden. Die Register können auf Bildschirm bzw. Schnelldrucker oder für den Lichtsatz ausgegeben werden.
  7. Lichtsatz: Die Bibliographie kann ein- oder mehrspaltig mit beliebigem Satzspiegel gesetzt werden. Schriftart, Schriftgrad, Auszeichnungen und Zeileneinteilung können in gewissen Grenzen frei gewählt werden.
  8. Hilfsroutinen: Herstellung einer systematischen Übersicht aus den Überschrifteintragungen; übersichtliche Ausgabe aller Eintragungen in codierter Form; Ausgabe einer Signaturenliste.

Der Referent hat als Test eine subjektive und objektive Bibliographie Wilhelm Schickards hergestellt, aus der er einige Seiten von Probebelichtungen in ein- und zweispaltigem Satz vorlegte.
 

Diskussion

Bei der Entscheidung zwischen numerischem und mnemonischem Code zur Kennzeichnung der Felder haben folgende Gründe den Ausschlag für den numerischen Code gegeben: Es sind einerseits immer dieselben wenigen Felder, die häufig vorkommen und sich deshalb leicht einprägen. Andererseits ist die Zahl der möglichen Felder so groß, daß sich für die z.T. sehr ähnlichen Feldbezeichnungen nicht genügend einprägsame Abkürzungen finden ließen. Für die Verarbeitung müßten die mnemonischen Codes außerdem u.U. maschinell in numerische verwandelt werden, was die Verwendung zweier verschiedener Codes in verschiedenen Bearbeitungsstufen zur Folge hätte.

 
(Die Kurzfassungen der Referate wurden von den Referenten zur Verfügung gestellt.)


Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 23. August 2002