12/03/2024

Als der italienische Jesuitenpater Roberto Busa (1913 - 2011) im Herbst 1949 den Sohn einer wohlhabenden Familie zum Besuch einer Privatschule in die USA begleitete, arbeitete er bereits seit gut zehn Jahren an seinem Megaprojekt, mit dem er zu einem der maßgeblichen Begründer der Computerlinguistik respektive der Digitalen Geisteswissenschaften (Digital Humanities) werden sollte.

12/03/2024
©: Zita Oberwalder

Roberto Busa 2006 in Gallarate, im Hintergrund Index Thomisticus, © Antonio C. Colombo, Wikimedia Commons

1913 in Asiago geboren, trat Roberto Busa 1933 in den Jesuitenorden ein. Den Ordensregeln entsprechend studierte er Theologie und Philosophie, lernte Latein, Griechisch, Französisch und Deutsch und begann zu Ende der 1930er Jahre mit einer Dissertation über die Schriften des Scholastikers Thomas von Aquin (13. Jh.). Ein Teil dieser Arbeit war das Erstellen einer sogenannten Konkordanz aller Texte des mittelalterlichen Philosophen, die nach verschiedenen Berechnungen auf einen Umfang zwischen neun und elf Millionen Wörter geschätzt werden.

Für die 1949 publizierte Doktorarbeit La Terminologia Tomistica dell'lnteriorita: Saggi di metodo per una interpretazione della metafisica della presenza, hatte Busa von Hand 10.000 Dateikarten mit jeweils einem Wort und den Verweisen an jeweilige Textstellen angelegt. Ganz im Sinn Ludwig Wittgensteins, beschreibt Busa seine Motivation aus der Sicht des Sprachwissenschafters in einer 1980 erschienen Darstellung damit, dass die Bedeutung von Begriffen schon im sprachlichen System eines Schriftstellers entsprechend der Kontexte differieren und abermals gegenüber der Interpretation eines Lesers. Nach diesen Vorarbeiten der Indexierung und der Verweise auf den Gebrauch derselben Wörter in verschiedenen Zusammenhängen der Schriften des Aquiners, so Busa: „begann ich ab 1946 an einen Index Thomisticus zu denken, d. h. eine Konkordanz aller Wörter von Thomas von Aquin, einschließlich Konjunktionen, Präpositionen und Pronomen, um anderen Gelehrten für analoge Studien zu dienen. Aber mir war klar, dass ich für die Bearbeitung von Texten mit mehr als zehn Millionen Wörtern nach einer Art Maschine suchen musste“.

Zwar konnte Busa auf Assistenz zurückgreifen, aber zusehends erwies sich das Anlegen von Dateikarten als aussichtslos. Der Biograf Steven Jones (bis 2021 Professor für Englisch und Digitale Geisteswissenschaften, University of South Florida) vermutet, Busa habe an die in Mailand zu dieser Zeit auch schon verwendeten Buchhaltungsmaschinen gedacht, als er 1949 in die USA reiste. Die folgende Episode wird von mehreren Autoren unterschiedlich wiedergegeben, Busa selbst beschreibt die Ereignisse 1980 so:

„Von Küste zu Küste“ besuchte er 25 Universitäten und „fragte nach jedem Gerät, das dienlich sein könnte“, um die ihm vorschwebende Konkordanz ausführen zu können. Schließlich stellte ein Mitarbeiter des MIT den Kontakt zu IBM in New York City her.

Dort traf er den IBM-Gründer Thomas J. Watson, dem er detailliert erklärte, dass er „Lochkartenmaschinen“ benötigte, um damit mittelalterliche lateinische Texte zu analysieren. Watson, skeptisch, bat um Verschriftlichung des Anliegens, um seine Ingenieure zu informieren. Beim nächsten Treffen, zwei Wochen darauf, teilte Watson dem Pater mit, „dass IBM-Maschinen niemals tun können“, was Busas Vorhaben entsprach. Die Techniker hätten gesagt, Busa sei „amerikanischer als die Amerikaner“ – noch verrückter nämlich. 

Aus dem Vorzimmer hatte der aber einen Werbe-Flyer mit dem Slogan „Das Schwierige machen wir sofort, das Unmögliche dauert etwas länger“ mitgenommen. „Das gebe ich Ihnen zurück“, hielt Busa Watson vor, „denn das stimmt ja offensichtlich nicht.“  Und Watson stimmte daraufhin doch zu, stellte allerdings die Bedingung, es müsse immer klar bleiben, wofür das Kürzel IBM stehe. Für „International Business Machines“ nämlich und nicht für „International Busa Machines“. Watson beauftragte nun seinen Mitarbeiter Paul Tasman mit der Unterstützung des Projekts. Der wiederum erzählte später, dass er eigentlich angehalten war, den lästigen Jesuitenpater loszuwerden.

Aus persönlichem Interesse aber glaubte Tasman an den Erfolg der Indexierung und IBM Italy stellte Busa Geräte und Knowhow in Gallarate zur Verfügung. In den folgenden Jahren, während Busa zwischen Italien und den USA pendelte, umfasste die Arbeit an den Schriften des Thomas von Aquin die Indexierung von gut 12 Millionen Wörtern. Tasman nennt 10.000 Computerstunden und eine Million Arbeitsstunden, die für das Herstellen von 13 Millionen Lochkarten aufgebracht wurden. 

Eine erste öffentliche Präsentation der Zusammenarbeit des Jesuitenpaters und IBM fand 1952 am Firmensitz in Armonk NY statt und Busa veröffentlichte erste Artikel, in denen er sein Projekt vorstellte. Auf der Weltausstellung in Brüssel präsentierte IBM die Arbeiten Busas und damit eine neue Technik, mit deren Hilfe das Wissen der Menschheit bewahrt und erforscht werden könnte. In Brüssel zeigte IBM aber nicht nur das von Busa angeregte Lochkartenverfahren, sondern auch den aus dieser Entwicklung hervorgegangenen RAMAC-Computer (random-access method of accounting and control), den ersten kommerziell erfolgreichen Rechner mit integrierter Festplatte. Für Besucher der Weltausstellung beantwortete die Riesenmaschine Fragen zur Weltgeschichte in mehreren Sprachen, um zu demonstrieren, wie Computer mit Sprache umgehen könnten. Mithin sollte es etwa 30 Jahre dauern, bis Busas Index Thomisticus: Sancti Thomae Aquinatis operum omnium indices et concordantiae in 56 Bänden zwischen 1974 und 1980 erschien. Seit 2005 ist der Index Thomisticus auch online abzurufen.

Ab den 1960er Jahren initiierte Busa aber auch noch andere Projekte. Es handelte sich um das Übersetzen von Sprachen mithilfe von Computern. IBM arbeitete mit Sprachwissenschaftern der Georgetown University in Washington an Übersetzungsprogrammen. Busa blieb in engem Austausch und darum bemüht, eine Version am europäischen Atomforschungszentrum in Ispra am Lago Maggiore zu installieren. Die Finanzierung dafür stammte zu einem großen Teil vom US-Verteidigungsministerium. Das Übersetzen von Text hatte im Kalten Krieg hohe Priorität. Es ging vor allem um russische Texte und ein Teil der Arbeit wurde in Busas Institut in Gallarate geleistet. Russische Texte wurden dort auf Lochkarten übertragen und am Ispra-Zentrum analysiert.

Wieder Busas eigener Dokumentation (1980) folgend, verlegte er nach Abschluss der Lochkartenerstellung für den Index Thomisticus 1967 sein Institut zunächst von Gallarate nach Pisa, zwei Jahre später dann nach Bolder, Colorado, und schließlich nach Venedig – weiterhin in Zusammenarbeit mit IBM.

Inzwischen wurden die Lochkarten von Magnetbändern abgelöst. Die verwendeten Computerprogramme verstanden nun „Italienisch, Englisch, Deutsch, Russisch, Altgriechisch und Hebräisch, Aramäisch und Nabatäisch“. Busas Institute lieferten Indexierungen und Übersetzungen zu Themen von „Kernphysik und Mathematik bis zu den Schriftrollen von Qumran und Werken von Dante, Kant und Goethe“.

Die Ergebnisse der Arbeiten an den Qumran-Schriften allerdings wurden nie publiziert. Auf der Autobahn bei Mailand verunglückte im August 1969 ein LKW. Dabei verbrannte das gesamte Material, das bis dahin auf 307 Magnetbändern und zwei Millionen Karteikarten gespeichert war und nach Boulder, Colorado, gebracht werden sollte.

Mit seinen Arbeiten legte Roberto Busa ein Fundament für heute gebräuchliche Suchmaschinen. Andere haben das Web erfunden und entwickelt, aber er hat die Forschung über die Art von Daten initiiert, die Maschinen verarbeiten können, und Möglichkeiten eröffnet, Texte mit maschinenlesbaren Querverweisen zu versehen. Roberto Busa SJ starb 2011 im Alter von 97 Jahren in Gallarate.

 

_________Quellen:

Ö1 Dimensionen, Hypertext und Soutane, 7.3.2018
Steven E. Jones: Roberto Busa, S. J., and the Emergence of Humanities Computing. The Priest and the Punched Cards. London 2016.

Netzwerktreffen
16. + 17.11.2023
 
GAT+