From 8beb908c9e2c1d46bc4260dfd21f994a72a5f7b8 Mon Sep 17 00:00:00 2001 From: Christoph Steindl Date: Thu, 19 Oct 2023 09:40:51 +0200 Subject: [PATCH] Add printouts description to readme --- README.md | 6 ++++-- 1 file changed, 4 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index 78ac1cc..413e126 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # Anno Event 2023 -In diesem Repo sammeln wir Ressourcen für den Programmpunkt „Vom Bild zum Text – automatische Texterkennung mit Hilfe von OCR“ beim Event **20 Jahre ANNO – Österreichs größtes Webportal von historischen Zeitungen** am 19. Oktober 2023. +In diesem Repo sammeln wir Ressourcen für den Programmpunkt „Vom Bild zum Text – automatische Texterkennung mit Hilfe von OCR“ beim Event [**20 Jahre ANNO – Österreichs größtes Webportal von historischen Zeitungen**](https://www.eventbrite.at/e/20-jahre-anno-tickets-717638194157) am 19. Oktober 2023. ## Inhalt @@ -12,7 +12,9 @@ In diesem Repo sammeln wir Ressourcen für den Programmpunkt „Vom Bild zum Tex ## Arbeitsschritte der OCR -... +Der Ordner [_print_materials_](./print_materials/) enthält Printouts zu den Arbeitsschritten einer OCR pipeline. Dazu gibt es eine generelle Übersicht ("Flowchart.pdf") und exemplarisch ein einige ausgearbeitete Arbeitsschritte visualisiert. Die Zusammensetzung der Arbeitsschritte sind vereinfacht dargestellt. Je nach Datenmaterial und Anforderungen sind noch zusätzliche Arbeitsschritte erforderlich. Siehe beispielsweise auch: + * https://www.researchgate.net/figure/A-block-diagram-of-a-typical-OCR-system-main-stages-The-diagram-shows-intermediate-steps_fig1_346164817 aus _Qaroush, Aziz & Awad, Abdalkarim & Modallal, Mohammad & Ziq, Malik. (2020). Segmentation-based, omnifont printed Arabic character recognition without font identification. Journal of King Saud University - Computer and Information Sciences. 34. [10.1016/j.jksuci.2020.10.001](https://doi.org/10.1016/j.jksuci.2020.10.001)._ + * https://www.researchgate.net/figure/Figure-7-Common-steps-of-an-OCR-system_fig4_268460140 aus _Ahmed, Fakruddin. (2013). Segmentation of Characters Without Modifiers from a Printed Bangla Text. Computer Science & Information Technology. 3. 11-24. [10.5121/csit.2013.3202](https://doi.org/10.5121/csit.2013.3202)._ ## Annolyzer -- GitLab