@@ -73,11 +73,11 @@ Das gesamte Inhaltsverzeichnis inklusive aller Unterüberschriften befindet sich
# Handschriftenerkennung mit Transkribus #
Wie auf der Seite [HTR-Entscheidungsprozess](Digitale-Edition-und-HTR/HTR-Entscheidungsprozess) beschrieben, haben wir uns dazu entschieden, das Modell "Transkribus German handwriting M1" (Modell-Id 35909) mit unserem manuell erstellten Groundtruth-Set zu trainieren. Das resultierende Modell ("BED_TestModel3", Id 49656) liefert recht gute Ergebnisse, mit einer Fehlerrate pro Wort (WER) von 3,7 % auf den regelmäßigen Seiten des Validierungs-Sets. Siehe die Seite [Transkribus](Digitale-Edition-und-HTR/Transkribus) für eine ausführliche Darstellung des gesamten Prozesses, von der Erstellung des Groundtruth-Datensets bis zur Durchführung der Trainings und Evaluation der trainierten Modelle.
Wie auf der Seite [HTR-Entscheidungsprozess](Handschriftenerkennung-mit-Transkribus/HTR-Entscheidungsprozess) beschrieben, haben wir uns dazu entschieden, das Modell "Transkribus German handwriting M1" (Modell-Id 35909) mit unserem manuell erstellten Groundtruth-Set zu trainieren. Das resultierende Modell ("BED_TestModel3", Id 49656) liefert recht gute Ergebnisse, mit einer Fehlerrate pro Wort (WER) von 3,7 % auf den regelmäßigen Seiten des Validierungs-Sets. Siehe die Seite [Transkribus](Digitale-Edition-und-HTR/Training-und-Anwendung-mit-Transkribus) für eine ausführliche Darstellung des gesamten Prozesses, von der Erstellung des Groundtruth-Datensets bis zur Durchführung der Trainings und Evaluation der trainierten Modelle.
Daher ist als nächster Schritt geplant, das Modell BED_TestModel3 auf die Bände 1 bis 3 des handschriftlichen Katalogs anzuwenden. Von der Anwendung auf die Bände 4 und 5 erwarten wir weniger brauchbare Ergebnisse, da zum einen das Schriftbild in diesen Bänden eher unregelmäßig ist und zum anderen die Einträge deutlich komplizierter (automatisiert) zu verstehen sind, da sie als alphabetischer Index mit vielen Abkürzungen notiert sind. Genauere Informationen zum Arbeitsprozess finden sich auf der entsprechenden [Unterseite](Digitale-Edition-und-HTR/Digitale-Edition.md).
Daher ist als nächster Schritt geplant, das Modell BED_TestModel3 auf die Bände 1 bis 3 des handschriftlichen Katalogs anzuwenden. Von der Anwendung auf die Bände 4 und 5 erwarten wir weniger brauchbare Ergebnisse, da zum einen das Schriftbild in diesen Bänden eher unregelmäßig ist und zum anderen die Einträge deutlich komplizierter (automatisiert) zu verstehen sind, da sie als alphabetischer Index mit vielen Abkürzungen notiert sind. Genauere Informationen zum Arbeitsprozess finden sich auf der entsprechenden [Unterseite](Digitale-Edition-und-HTR/Training-und-Anwendung-mit-Transkribus).
Die mit Text versehenen Seiten sollen im Anschluss als TEI-XML aus Transkribus exportiert werden und danach angepasst werden, sodass sie kompatibel mit der Infrastruktur der digitalen Edition(https://edition.onb.ac.at/) an der ÖNB sind.
Die mit Text versehenen Seiten sollen im Anschluss als TEI-XML aus Transkribus exportiert werden und danach angepasst werden, sodass sie kompatibel mit der Infrastruktur der [digitalen Edition](https://edition.onb.ac.at/) an der ÖNB sind.