... | ... | @@ -69,15 +69,15 @@ Der Bibliothek verfügt über folgende Überschriften: |
|
|
|
|
|
"Ab S." bezieht sich auf die erste Seite, auf der auch tatsächlich ein Eintrag kommt, und nicht auf die Seiten, auf denen der jeweilige Titel steht (der ist idR. zwei Seiten weiter vorne)
|
|
|
|
|
|
Das gesamte Inhaltsverzeichnis inklusive aller Unterüberschriften befindet sich [hier](/Quellen-und-Inhalt/Inhaltsverzeichnis-des-hs.-Katalogs.md).
|
|
|
Das gesamte Inhaltsverzeichnis inklusive aller Unterüberschriften befindet sich [hier](/Quellen-und-Inhalt/Inhaltsverzeichnis-des-hs.-Katalogs).
|
|
|
|
|
|
# Handschriftenerkennung mit Transkribus #
|
|
|
|
|
|
Wie auf der Seite [HTR-Entscheidungsprozess](/Handschrifterkennung/HTR-Entscheidungsprozess.md) beschrieben, haben wir uns dazu entschieden, das Modell "Transkribus German handwriting M1" (Modell-Id 35909) mit unserem manuell erstellten Groundtruth-Set zu trainieren. Das resultierende Modell ("BED_TestModel3", Id 49656) liefert recht gute Ergebnisse, mit einer Fehlerrate pro Wort (WER) von 3,7 % auf den regelmäßigen Seiten des Validierungs-Sets. Siehe die Seite [Training und Anwendung mit Transkribus](/Handschrifterkennung/Training-und-Anwendung-mit-Transkribus.md) für eine ausführliche Darstellung des gesamten Prozesses, von der Erstellung des Groundtruth-Datensets bis zur Durchführung der Trainings und Evaluation der trainierten Modelle.
|
|
|
Wie auf der Seite [HTR-Entscheidungsprozess](/Handschrifterkennung/HTR-Entscheidungsprozess) beschrieben, haben wir uns dazu entschieden, das Modell "Transkribus German handwriting M1" (Modell-Id 35909) mit unserem manuell erstellten Groundtruth-Set zu trainieren. Das resultierende Modell ("BED_TestModel3", Id 49656) liefert recht gute Ergebnisse, mit einer Fehlerrate pro Wort (WER) von 3,7 % auf den regelmäßigen Seiten des Validierungs-Sets. Siehe die Seite [Training und Anwendung mit Transkribus](/Handschrifterkennung/Training-und-Anwendung-mit-Transkribus) für eine ausführliche Darstellung des gesamten Prozesses, von der Erstellung des Groundtruth-Datensets bis zur Durchführung der Trainings und Evaluation der trainierten Modelle.
|
|
|
|
|
|
Das Modell BED_TestModel3 wurde auf die Bände 1 bis 3 des handschriftlichen Katalogs angewendet. Von der Anwendung auf die Bände 4 und 5 erwarten wir weniger brauchbare Ergebnisse, da zum einen das Schriftbild in diesen Bänden eher unregelmäßig ist und zum anderen die Einträge deutlich komplizierter (automatisiert) zu verstehen sind, da sie als alphabetischer Index mit vielen Abkürzungen notiert sind. Genauere Informationen zum Arbeitsprozess finden sich wiederum auf der entsprechenden [Unterseite](/Handschrifterkennung/Training-und-Anwendung-mit-Transkribus.md). Informationen zur Versehung mit Tags finden sich unter [Tagvergabe](/Handschrifterkennung/Tagvergabe-Transkribus.md).
|
|
|
Das Modell BED_TestModel3 wurde auf die Bände 1 bis 3 des handschriftlichen Katalogs angewendet. Von der Anwendung auf die Bände 4 und 5 erwarten wir weniger brauchbare Ergebnisse, da zum einen das Schriftbild in diesen Bänden eher unregelmäßig ist und zum anderen die Einträge deutlich komplizierter (automatisiert) zu verstehen sind, da sie als alphabetischer Index mit vielen Abkürzungen notiert sind. Genauere Informationen zum Arbeitsprozess finden sich wiederum auf der entsprechenden [Unterseite](/Handschrifterkennung/Training-und-Anwendung-mit-Transkribus). Informationen zur Versehung mit Tags finden sich unter [Tagvergabe](/Handschrifterkennung/Tagvergabe-Transkribus).
|
|
|
|
|
|
Die mit Text versehenen Seiten wurden im Anschluss als [TEI-XML aus Transkribus exportiert](/Digitale-Edition/Aufbereitung-des-TEI-XML-Exports.md) und angepasst, sodass sie kompatibel mit der Infrastruktur der [digitalen Edition](https://edition.onb.ac.at/) an der ÖNB sind.
|
|
|
Die mit Text versehenen Seiten wurden im Anschluss als [TEI-XML aus Transkribus exportiert](/Digitale-Edition/Aufbereitung-des-TEI-XML-Exports) und angepasst, sodass sie kompatibel mit der Infrastruktur der [digitalen Edition](https://edition.onb.ac.at/) an der ÖNB sind.
|
|
|
|
|
|
# Andere Quellen #
|
|
|
|
... | ... | |