Textdatenverarbeitung mit TUSTEP


Arbeitsweise, Einsatzzweck

Grundoperationen von TUSTEP

Organisatorische Leistungen in TUSTEP

Hinweise


Arbeitsweise, Einsatzzweck

Das "Tübinger System von Textverarbeitungsprogrammen" TUSTEP wurde am Zentrum für Datenverarbeitung der Universität Tübingen entwickelt mit dem Ziel, ein leistungsfähiges Werkzeug zum wissenschaftlichen Umgang mit Textdaten zur Verfügung zu stellen.

Die Anfänge dieser Arbeiten gehen auf das Jahr 1966 und die folgenden Jahre zurück, als nach dem Vorbild des nichtnumerischen Unterprogrammpakets des Deutschen Rechenzentrums Darmstadt ein System von Unterprogrammen zur Zeichen- und Zeichenketten-Verarbeitung in FORTRAN entworfen und auf der Tübinger Anlage implementiert wurde. Dies erleichterte die Programmierung für damals betreute Projekte wie die metrische Analyse lateinischer Hexameter, die Konkordanz zur Vulgata oder die Edition und die Register zu den Werken Heinrich Kaufringers.

Aufgrund der Erfahrung mit solchen Projekten konnte der nächste Schritt getan werden, der die Programmierung in FORTRAN oder einer anderen "höheren" Programmiersprache für diese Art von Aufgaben überflüssig machte: Für die wichtigsten Grundoperationen der Textdaten-Verarbeitung wurden Programme bereitgestellt, deren Leistung vom Benutzer über Parameter spezifiziert werden kann und die in vielfältiger Weise für die Lösung verschiedenster Aufgabenstellungen zu kombinieren sind. Den Namen TUSTEP tragen diese Programme seit 1978.

Der Begriff Textdaten-Verarbeitung soll TUSTEP von dem, was heute üblicherweise unter Textverarbeitung verstanden wird, abgrenzen. Selbstverständlich gehören auch die für die Dokumenten-Erstellung notwendigen Funktionen wie Eingabe, Korrektur, Formatieren und Drucken von Texten (auch von fremdsprachlichen Texten in nicht-lateinischen Alphabeten) zum Leistungsangebot von TUSTEP, da diese in allen Wissenschaftsbereichen zum Zweck der Dokumentation und der Vorbereitung von Publikationen benötigt werden. TUSTEP wurde aber als Werkzeug vor allem für diejenigen Wissenschaften entwickelt, in denen Texte Objekte der Forschung sind: Philologien, Sprachwissenschaften, Literaturwissenschaften, historische Wissenschaften, Bibliothekswesen; Wissenschaften also, in denen nicht nur neue Texte als Produkt der eigenen wissenschaftlichen Arbeit erstellt und publiziert werden, sondern in denen schon existierende, überlieferte, schriftlich fixierte oder zu fixierende Texte (einschließlich literarischer Texte und historischer Quellen) durch kritische Neuedition gesichert, sprachlich und stilistisch analysiert, inhaltlich erschlossen, bibliographisch erfasst werden.

Dem tragen Grundoperationen der Textdaten-Verarbeitung (und entsprechende TUSTEP-Programme) Rechnung, die mit folgenden Schlagwörtern grob charakterisiert werden können:

Aufgaben, die mit TUSTEP bearbeitet werden, reichen vom Schreiben einer Seminararbeit bis hin zum Erstellen von umfangreichen Bibliographien, Lexika, Indizes, Konkordanzen, Wörterbüchern, Editionen und natürlich auch von Monographien, jeweils einschließlich der automatischen Herstellung der Druckvorlagen für diese Werke in der vom Buchdruck gewohnten Qualität bzw. einschließlich der Bereitstellung der Daten in der Form (z. B. HTML, XML) und Codierung (z. B. Unicode), die für die elektronische Publikation erforderlich ist.

Neben den Programmen für die Grundoperationen der Textdaten-Verarbeitung enthält TUSTEP auch eine Reihe organisatorischer Leistungen, wie sie üblicherweise vom Betriebssystem eines Rechners bereitgestellt werden. Dies ermöglicht es, alle für die Textdaten-Verarbeitung notwendigen Funktionen, einschließlich der Datenhaltung und Datensicherung, auf Rechnern mit unterschiedlichen Betriebssystemen in gleicher Weise aufzurufen, und erspart damit dem Benutzer beim Wechsel auf einen Rechner mit einem anderen Betriebssystem nicht nur ein Umlernen, sondern erlaubt auch, bereits erstellte TUSTEP-Kommandofolgen unverändert zu übernehmen.

Eine für alle Rechner identische Benutzer-Oberfläche konnte nur dadurch erreicht werden, dass auf die Ausnutzung spezieller Eigenschaften einzelner Rechner und Betriebssysteme verzichtet wurde. Aus diesem Grund konnten insbesondere die graphischen Möglichkeiten der PC-Bildschirme nicht voll ausgenutzt werden.

Die Leistungen von TUSTEP werden ständig verbessert und erweitert, damit auch für neue Aufgabenstellungen der wissenschaftlichen Textdaten-Verarbeitung Lösungsmöglichkeiten bereitstehen; dabei werden auch neue Hardware und neue Betriebssystem-Entwicklungen berücksichtigt. Zu den Neuerungen der letzten Jahre zählen ein CGI-Interface, Erweiterungen zur einfacheren Bearbeitung von Texten, die nach SGML / XML / TEI codiert sind, sowie für PDF-Dateien die automatische Generierung von internen und externen Links, von Notizen und von Lesezeichen (bookmarks).

Die folgende Aufstellung gibt einen Überblick über die wichtigsten TUSTEP-Programme für Grundoperationen der Textdaten-Verarbeitung und für organisatorische Leistungen (die Angaben in eckigen Klammern sind die jeweiligen Kommandonamen).

1. Grundoperationen der Textdaten-Verarbeitung in TUSTEP

2. Organisatorische Leistungen in TUSTEP

3. Hinweise

Ein Handbuch, das den Leistungsumfang von TUSTEP beschreibt, wird als PDF-Datei mit TUSTEP ausgeliefert; es ist in der jeweils aktuellen Fasssung auch im Internet unter http://www.tustep.uni-tuebingen.de/pdf/handbuch.pdf zugänglich. Eine gedruckte Fassung des Handbuchs ist im Zentrum für Datenverarbeitung erhältlich (Version 2008, 1216 S., 59,-- EUR). - Das Handbuch ist als Nachschlagewerk konzipiert und zum Selbststudium kaum geeignet.

Die Einführungstexte "Lernbuch TUSTEP", bearbeitet von Winfried Bader (Tübingen: Niemeyer 1995, XII+384 S., ISBN 3-484-73019-6) und "Tustep für Einsteiger" von Peter Stahl (Würzburg: Königshausen & Neumann 1996, 308 S., ISBN 3-8260-1254-2) führen didaktisch in das Arbeiten mit TUSTEP ein. Da TUSTEP schon immer großen Wert auf Aufwärtskompatibilität gelegt hat, sind diese Einführungen für den ersten Einstieg in TUSTEP weiterhin geeignet, obwohl die Neuerungen der letzten Jahre dort fehlen.

An der Universität Zürich ist ein TUSTEP-Online-Tutorial im Entstehen begriffen. Für den Zugang klicken Sie bitte hier; weiter kommen Sie dort über den Link "Gastzugang".

Fortgeschrittene TUSTEP-Nutzer treffen sich jeweils Anfang Januar im Forschungszentrum "Heinrich-Fabri-Institut" der Universität Tübingen in Blaubeuren zu einem Workshop. Von Donnerstag Nachmittag bis Sonntag Vormittag werden dabei einzelne Anwendungsbereiche ausführlich vorgestellt und die zugehörigen Techniken eingeübt.

Im Oktober 1993 wurde in Würzburg die International TUSTEP User Group (ITUG) als Informations- und Kommunikationsforum für TUSTEP-Anwender gegründet. Sie bietet unter http://www.itug.de u. a. Informationen über Neuerungen in TUSTEP, über Kurse und andere Veranstaltungen, macht Musterlösungen und nützliche Prozeduren zugänglich; außerdem kann man dort eine mailing list zu TUSTEP subskribieren.

Information über mit TUSTEP durchgeführte Projekte findet sich auf der ITUG-homepage und (für die Zeit bis 2003) in den Protokollen der insgesamt 90 Kolloquien über die Anwendung der Elektronischen Datenverarbeitung in den Geisteswissenschaften an der Universität Tübingen, die zwischen November 1973 und Februar 2005 stattfanden. Die Protokolle dieser Kolloquien sind (bis einschließlich 83. Kolloquium vom 17.11.2003) in der Zeitschrift Literary and Linguistic Computing (bis 1985: ALLC-Bulletin) veröffentlicht; sie sind vollständig unter http://www.tustep.uni-tuebingen.de/kolloq.html im WWW zugänglich.


Stand: Juni 2011

TUSTEP ist eine Entwicklung des Zentrums für Datenverarbeitung der Universität Tübingen (seit 1966; von 1970 bis 2003 in der Abteilung Literarische und Dokumentarische Datenverabeitung unter der Leitung von Prof. Dr. Wilhelm Ott; seit 2003 mit finanzieller Unterstützung durch akademische Partnerinstitutionen). Seit Juni 2011 ist TUSTEP open source software unter der revised BSD Lizenz. Weitere Informationen unter http://www.tustep.uni-tuebingen.de


... zur TUSTEP-Homepage
tustep@zdv.uni-tuebingen.de - Stand: 1. Juni 2011