Bibliotheca Eugeniana Digital

Das Projekt „Bibliotheca Eugeniana Digital“ (BED) ist ein von der Österreichischen Akademie der Wissenschaften im Rahmen des „go!digital 3.0“-Programms gefördertes Kooperationsprojekt zwischen der Österreichischen Nationalbibliothek und der Universität für Weiterbildung Krems. Die Laufzeit des Projekts beträgt zwei Jahre, von November 2022 bis November 2024.

Projektbeschreibung

Ziel des Projekts Bibliotheca Eugeniana Digital ist die digitale Rekonstruktion und visuelle Darstellung von Prinz Eugens Büchersammlung (UNESCO „Memory of Austria“), eine der berühmtesten Sammlungen der Barockzeit. Seit 1738 war die Sammlung Teil der habsburgischen Hofbibliothek, heute der Österreichischen Nationalbibliothek (ÖNB). Bis heute konnten weder die exakte Zusammensetzung, noch ihr Umfang, noch die Standorte der gedruckten Bücher in den Sammlungen der ÖNB analysiert werden, da dieses Unterfangen zu umfangreich und komplex für traditionelle Herangehensweisen war. Die Digitalisierung von Quellen in Kombination mit neuen digitalen Methoden ermöglicht neue Zugänge für die Erschließung großer Kultursammlungen wie der Bibliotheca Eugeniana.

Das Projekt wird Werkzeuge und Methoden aus den Digitalen Geisteswissenschaften und den Data Sciences für eine systematische digitale Rekonstruktion und visuelle Exploration dieser Bibliothek nutzen, um ihre Zusammensetzung und Geschichte anhand unterschiedlicher Quellen zu untersuchen.

Digitale Rekonstruktion

Die meisten Bücher der Bibliotheca Eugeniana wurden im Rahmen des Projekts „Austrian Books Online“ (ABO) digitalisiert. Der Großteil der gebundenen Bücher der Bibliotheca Eugeniana wurde in einheitlicher Manier auf Vorder- und Rückdendeckel mit dem Wappen von Prinz Eugen (s. Abbildung 1 weiter unten) versehen. Auf diesen (hier als Supralibros-Einbände bezeichneten) Einbänden werden im Projekt mittels Maschinellem Lernen (ML) visuelle Merkmale erkannt. Zusätzlich werden der historische handschriftliche Katalog der Eugeniana sowie Archivalien zur Transformation dieser Bibliothek im 19. Jahrhundert mittels ML für Handwritten Text Recognition (HTR) digital erschlossen und in der Infrastruktur für Digitale Editionen der ÖNB publiziert.

Sämtliche Daten werden mit den Metadaten aus dem öffentlichen Katalog der ÖNB zusammengeführt. Titel aus der Digitalen Edition und Volltexte aus ABO werden abermals mittels ML und Natural Language Processing (NLP) Algorithmen in Sachgruppen klassifiziert. Die Zuschreibung zu Sachgruppen wird neue Einsichten in die interne Struktur der Bibliothek und deren Korrelation mit dem Farbsystem der Supralibros-Einbände ermöglichen.

Visuelle Exploration

Die Universität für Weiterbildung Krems (UWK) wird aus den vielschichtigen historischen Bestandsdaten multiple koordinierte Visualisierungen entwickeln, mit denen die Struktur, Transformation und Verortung der Bibliotheca Eugeniana-Sammlung analysiert und erforscht werden kann. Zur öffentlichen Kommunikation der Projektergebnisse werden komplementäre narrative Visualisierungen entwickelt. BED wird die Ergebnisse in unterschiedlichen Formaten für Expert*innen und eine allgemeine Öffentlichkeit veröffentlichen. Alle im Rahmen des Projekts erstellten Daten werden über die ÖNB Labs zugänglich gemacht und gemäß FAIR-Prinzipien mit europäischen Forschungsinfrastrukturen geteilt. Als Kooperation einer Kulturerbe Einrichtung mit einer Forschungseinrichtung trägt BED zur Strategie DH Austria 2021 bei, indem es den Wissenstransfer zwischen beiden Sektoren fördert.

Methoden

Um so viele Informationen wie möglich für die Rekonstruktion der Büchersammlung zu erhalten, werden verschiedene Ansätze kombiniert:

Bild-Klassifizierung

In diesem Schritt werden ML-Klassifikationsmodelle von Bildmerkmalen für die Identifizierung von Provenienzmarkern verwendet. In einer Pilotstudie der ÖNB wurde diese Methode unter Verwendung von CNN-Modellen zur binären Klassifizierung von Eugeniana Supralibros aus dem ABO-Korpus der ÖNB erfolgreich eingesetzt. Im BED-Projekt wird diese Methode überarbeitet und erweitert, indem verschiedene Arten von CNN-Modellen und Netzwerkkonfigurationen (z.B. Netzwerktiefen etc.) verglichen werden. Es wird ein zweistufiges Modell verfolgt, bei dem im ersten Schritt erkannt wird, ob der Provenienzmarker, das Supralibros, vorhanden ist, und ein Bildausschnitt dieses als Rückgabewert zurückgegeben wird.

Band mit Wappensupralibros — Abbildung 1: Prachtexemplar eines Bandes mit Wappensupralibros aus der Bibliotheca Eugeniana.

In einem zweiten Schritt wird der Inhalt dieses Ausschnitts in einen binären Klassifikator eingespeist, der die optischen Informationen bewahrt, die sonst durch die Skalierung des Bildes verloren gehen. Darüber hinaus wird besonderes Augenmerk darauf gelegt, das Trainingskorpus für diese Modelle in (sowohl in Bezug auf die Größe als auch die Qualität) angemessener Weise aufzubauen, sodass die verschiedenen Arten von Supralibros strukturell sichtbar gemacht werden. Auf diese Weise wird es möglich sein, ein Multi-Klassifikator-Modell zu erstellen. Für richtig positive Zuschreibungen werden die Beschreibungen in den frei zugänglichen Katalog der ÖNB integriert. Dieser Ansatz ist auf die im ABO-Korpus digital verfügbaren Supralibros beschränkt und wird daher mit einem zweiten Ansatz kombiniert:

Die Kataloge

Mithilfe eines HTR-Modells zur Texterkennung mit Transkribus sollen die Informationen des an der ÖNB digitalisierten fünfbändigen handschriftlichen historischen Sammlungskatalogs extrahiert werden. Für die (halb-)automatische Verschlagwortung von Autoren und Publikationsorten werden im Anschluss NLP-Methoden (z.B. Named-Entity-Recognition) eingesetzt. Die Einträge werden auf Basis eines bereits für die digitale Edition eines anderen historischen Bibliothekskatalogs entwickelten Schemas der ÖNB auf TEI-XML-Elemente abgebildet. Die XML-Dateien und Seitenabbildungen werden in Form einer digitalen Edition in der nachhaltigen Infrastruktur der ÖNB für digitale Editionen (edition.onb.ac.at) veröffentlicht. Die digitale Edition wird Indizes mit bibliographischen Angaben zu allen Titeln, Personen und Publikationsorten enthalten.

Handschriftlicher Katalog — Abbildung 2: Ausschnitt einer Seite aus dem handschriftlichen Katalog.

Um diejenigen Bücher zu identifizieren, die sich noch heute in der ÖNB befinden, wird die Such-API des digitalen Katalogs der ÖNB genutzt, mit der, unter Zuhilfenahme von Fuzzy-String-Matching, die Titel, Orte und Erscheinungsjahre des historischen Katalogs mit dem des modernen Katalogs verglichen werden. Darüber hinaus werden Titel und verfügbare Volltexte mit Hilfe des ANNIF-Algorithmus für die Fachklassifikation in Fachkategorien geclustert, um tiefere Einblicke in die Klassifikation und die Fachgebiete der Bibliothek zu erhalten. Die Ergebnisse der Fachklassifikation werden den Fachgebieten im modernen Bibliothekskatalog zugeordnet und später in die digitale Ausgabe des historischen Katalogs integriert, um einen zusätzlichen Fachindex zu erstellen. Die Beschreibungen der identifizierten Exemplare mit Supralibros-Einbänden werden automatisch auf der Grundlage der Ergebnisse der Bildklassifikation erstellt und bei Bedarf manuell ergänzt. Die digitale Edition wird mit Beschreibungen der identifizierten Objekte, Verlinkungen von benannten Entitäten sowie Verweisen auf den Open-Access-Katalog der ÖNB angereichert. Dieser Ansatz wurde bereits getestet.

Die Metadaten zu den bibliografischen Einträgen werden als LOD-Set veröffentlicht, das dem DINI-Schema für RDF-Darstellungen bibliografischer Ressourcen entspricht und mit dem DARIAH-Sammlungsbeschreibungsschema abgestimmt ist.

Visualisierung und Kommunikation

Datenvisualisierungen sollen die Exploration, Repräsentation und öffentliche Kommunikation der Sammlung ermöglichen. Mit ihrer Hilfe können die Eugeniana-Sammlung, ihre Metadaten und deren Qualitätsbewertung aus verschiedenen analytischen Perspektiven dargestellt werden. Auf diese Weise sollen sie das Lesen und Erkunden der Sammlung aus der Ferne visuell unterstützen, und so erleichtern, Fragen der Sammlungszusammensetzung und Provenienz zu analysieren und relevante Muster und Informationen für weitere Analysen und Close Reading zu identifizieren. Die Entwicklung der Visualisierung folgt einem nutzerzentrierten, iterativen Daten-Nutzer-Aufgaben-Ansatz, innerhalb dessen kollaborativ und iterativ die relevantesten Optionen der visuellen Analyse und Exploration in Sitzungen mit den Zielnutzern definieren und die verfügbaren Daten untersuchen werden. Diese Analyse wird die Grundlage für die Definition von Nutzeranforderungen für die anschließende Gestaltung und Implementierung relevanter visueller Perspektiven und möglicher Interaktionen sein. Um sicherzustellen, dass die Visualisierungen die beabsichtigten Aufgaben ausreichend unterstützen, wird in einer kleinen Nutzerstudie die Interaktion mit den neuartigen Visualisierungen beobachtet, und die Gestaltung auf der Grundlage der Evaluierungsergebnisse angepasst.

Darüber hinaus wird ein visueller Storytelling-Ansatz angewandt, um die Geschichte und Herkunft der Eugeniana auf ansprechende Weise der Öffentlichkeit zu vermitteln. Das Storyboard wird mit (interaktiven) Visualisierungen angereichert und vom UWK-Team in Form einer webbasierten Geschichte umgesetzt. Die Schnittstelle wird mit Zielnutzern aus der breiten Öffentlichkeit getestet und auf der Grundlage dieser Bewertungsergebnisse angepasst. Die visualisierte Geschichte über die Provenienz der Bibliotheca Eugeniana wird ein wichtiges Ergebnis sein, um die öffentliche Kommunikation der Projektergebnisse zu unterstützen.

Disseminationen

Organisierte Workshops

30.04.2024: „Co-Design Workshop Bibliotheca Eugeniana Digital“ an der Österreichischen Nationalbibliothek
29.02.2024: Podiumsdiskussion bei der DHd 2024 mit dem Titel „DH – Cui bono? Zielgruppenerschließung für Digital Humanities und Cultural Heritage“

Wissenschaftliche Vorträge

15.05.2023: Dissertantenseminar „Quelle im Fokus: Aktuelle Fragestellungen und Methoden der Kodikologie und der Material Studies“ der Philologisch-Kulturwissenschaftlichen Fakultät, Universität Wien
13.06.2023: Übung „Editionstechnik/Digitale Edition“ auf dem Institut für Geschichte der Universität Wien
10.11.2023: „Erzeugung von Sichtbarkeit im Angesicht von Unsicherheit: Visualisierungsstrategien für die Bibliotheca Eugeniana Digital“ im Rahmen des Workshops „Vom Erkunden zur Erkenntnis? Ansätze und Perspektiven digitaler Sammlungsvisualisierungen“, Forschungsbibliothek Gotha der Universität Erfurt
22.11.2023: „#digiRoundtable V – Projektreigen, Status und Zukunft“, Museum für angewandte Kunst
28.11.2023: „43. Treffen der Systembibliothekarinnen und Systembibliothekare“, Österreichische Nationalbibliothek
28.02.2024: „Über die Ordnung von materiellen und digitalen Dingen: Zur multi-klassifikatorischen Visualisierung der Bibliotheca Eugeniana“ im Rahmen der DHd 2024 in Passau
17.04.2024: Vorstellung der DH-Methoden im BED-Projekt innerhalb des MA-Studiengangs „Museum und Collection Studies“ der Universität für Weiterbildung Krems
10.06.2024: Vortrag bei der Kommissionssitzung der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare, Universalbibliothek Wien
12.09.2024: Hybrider Vortrag bei der Konferenz „Für ein digitales historisches Museum der Euregio“ mit dem Titel „Digitales Vermitteln mit Sammlungsvisualisierungen“
25.09.2024: „Bibliotheca Eugeniana Digital — Unveiling and Visualizing the Treasures of Prince Eugene of Savoy's Library“ im Rahmen der 28. International Conference on Theory and Practice of Digital Libraries (TPDL) 2024, Ljubljana
25.10.2024: „Bibliotheca Eugeniana Digital. Eine sammlungswissenschaftliche Aufarbeitung der Bibliothek des Prinz Eugen von Savoyen“ im Rahmen des 4th Heritage Science Austria Meetings, Universität für Weiterbildung Krems
07.11.2024: European Cultural Memory in its Digitalization - Inventing Cultural Memory in the 21^st Century? Universität Graz
20.11.2024: #digiRoundtable, Museum für angewandte Kunst, Wien
26.11.2024: ÖNB Labs Symposium, „Bibliotheca Eugeniana: Using Machine Learning in DH Research“
29.11.2024: 10. Tagung Digitale Bibliothek: „Zurück (und) in die Zukunft“, Universität Graz

Veröffentlichungen

Simon Mayer, Olja Janjuš, Matej Ďurčo, Sophie Hammer, und Florian Windhager (Feb. 2024). „DH – Cui bono? Zielgruppenerschließung für Digital Humanities und Cultural Heritage“. In: DHd 2024 #Quo Vadis DH? Passau, Germany. doi: 10.5281/zenodo.10698214
Florian Windhager, Annerose Tartler, Simon Mayer, Johannes Liem, und Eva Mayr (Feb. 2024). „Über die Ordnung von materiellen und digitalen Dingen: Zur multi- klassifikatorischen Visualisierung der Bibliotheca Eugeniana“. In: DHd 2024 #Quo Vadis DH? Passau, Germany. doi: 10.5281/zenodo.10698329
Eva Mayr, Annerose Tartler, Florian Windhager, Johannes Liem, Michael Smuc, Max Kaiser, Monika Kiegler-Griensteidl, und Simon Mayer (Sept. 2024). „Bibliotheca Eugeniana Digital—Unveiling and Visualizing the Treasures of Prince Eugene of Savoy’s Library“. In: Linking Theory and Practice of Digital Libraries. 28th International Conference on Theory and Practice of Digital Libraries, TPDL 2024, Ljubljana, Slovenia, September 24–27, 2024, Proceedings, Part I. ed. by Apostolos Antonacopoulos et al. Vol. 15177. Lecture Notes in Computer Science. preprint available under 10.5281/zenodo.13847701, pp. 62–75. doi: 10.1007/978-3-031-72437-4_4
Simon Mayer, Christoph Steindl, und Annerose Tartler, eds. (Nov. 11, 2024). Eugeniana Digital. Digitale Edition des handschriftlichen Katalogs der Bibliothek Prinz Eugens. Wien: Österreichische Nationalbibliothek. url: edition.onb.ac.at/context:eugeniana
Annerose Tartler, Eva Mayr, Florian Windhager, und Simon Mayer (2024). „Digitale Erschließung historischer Bibliotheken: Erkenntnisse und Perspektiven aus dem Projekt Bibliotheca Eugeniana Digital“. In: Bibliothek – Forschung und Praxis, vol. 49, no. 2, 2025, pp. 193-200. doi: 10.1515/bfp-2024-0074
Eva Mayr, Annerose Tartler, Florian Windhager, und Simon Mayer (2024). „Sammlungen als Daten – Das Projekt Bibliotheca Eugeniana Digital als Use Case aus der Österreichischen Nationalbibliothek“. In: Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare, 78(1). doi: 10.31263/voebm.v78i1.9165.
Florian Windhager, Michael Smuc, Simon Mayer, Annerose Tartler, und Eva Mayr (2025). „To BE or not to BE: Visualizing Conceptual and Material Knowledge Spaces of the Bibliotheca Eugeniana“. In: Digital Scholarship in the Humanities, in Vorbereitung
Simon Mayer, Eva Mayr, und Florian Windhager (2025). „Bridging Past and Present: Reconstructing Prince Eugene’s Library through Fuzzy String Matching“. In: Journal of Digital History, in Vorbereitung
Simon Mayer, Florian Windhager, und Eva Mayr (2025). Die Wissensklassen der Universalbibliothek des Prinz Eugen von Savoyen. Forschungsblog der Österreichischen Nationalbibliothek, in Vorbereitung
Eva Mayr, Florian Windhager, Annerose Tartler, und Simon Mayer (2025). „Bibliotheca Eugeniana Digital—eine sammlungswissenschaftliche Aufarbeitung der Bibliothek des Prinz Eugen von Savoyen“. In: Das Erbe der Adels- und Klosterkultur. Heritage Science aus sammlungswissenschaftlicher Perspektive. Universität für Weiterbildung Krems, in Vorbereitung

Rezeption

11.05.2024: „Auf der Suche nach Prinz Eugens verlorener Privatbibliothek“. Artikel in „Der Standard“ von Paul M. Horntrich

Ergebnisse

Ein Prototyp erlaubt bereits eine erste Exploration der historischen Bestände Prinz Eugens durch eine Visualisierung des Prunksaals.

Visualisierungs-Prototyp — Abbildung 3: Erster Prototyp der Visualisierung der im Mitteloval des Prunksaals befindlichen Bestände der Bibliotheca Eugeniana.

Die Veröffentlichung der digitalen Edition des handschriftlichen Katalogs der Bibliotheca Eugeniana ist über die Editionsplattform der Österreichischen Nationalbibliothek verfügbar.

Vorschau digitale Edition — Abbildung 4: Vorschau auf die digitale Edition des handschriftlichen Katalogs der Bibliotheca Eugeniana.

Der Code und die Daten des Projekts sind über das offene GitLab Repository des Projekts einsehbar.

Projektteam

Projektmitarbeiter*innen:

Simon Mayer (simon.mayer@onb.ac.at)
Eva Mayr (eva.mayr@donau-uni.ac.at)
Michael Smuc (office@mindfactor.at)
Annerose Tartler (annerose.tartler@onb.ac.at)
Florian Windhager (florian.windhager@donau-uni.ac.at)

Beraterinnen und Sammlungsexpertinnen:

Max Kaiser
Katharina Kaska
Monika Kiegler-Griensteidl
Martin Krickl
Christoph Steindl

Ehemalige Projektmitarbeiter*innen:

Johannes Liem (johannes.liem@donau-uni.ac.at)

Praktikant*innen:

Pol Edinger (03.-14.07.2023)
Gabriel Fritzsche (12.-16.06.2023)
Lena Fuchs (08.-25.04.2024)
Tobias Goldberg (03.-21.07.2023)
Philipp Grabowski (21.05.-06.06.2024)
Angelika Rayer (03.10.-28.11.2023)

Kontakt

Bei Fragen oder Anregungen bitten wir Sie um eine Kontaktaufnahme unter bed-project@onb.ac.at.

Datenmanagement

Auf Anfrage können Informationen zu den im Projekt erzeugten Daten im Datenmanagementplan eingesehen werden.

Bibliotheca Eugeniana Digital – BED