Basierend auf der Übersicht (siehe [Übersicht der Wappentypen](Wappensupralibros-und-Machine-Learning/%C3%9Cbersicht-der-Wappentypen)) wurden iterativ Datensets für Training und Validierung zusammengestellt: Zuerst [BE_GT.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT.csv), dann [BE_GT_v2.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT_v2.csv) und schließlich [BE_GT_v3.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT_v3.csv). Das letzte ist das aktuellste und umfangreichste Datenset. Es enthält Barcodes und den Wappentyp (falls vorhanden) auf den ersten fünf Seiten eines Digitalisats. Dabei werden die 4 folgenden Kategorien unterschieden, die Zahl in Klammern bezeichnet die Anzahl der Bilder in der jeweiligen Kategorie:
Basierend auf der Übersicht (siehe [Übersicht der Wappentypen](Bilderkennung-mit-Machine-Learning/%C3%9Cbersicht-der-Wappentypen)) wurden iterativ Datensets für Training und Validierung zusammengestellt: Zuerst [BE_GT.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT.csv), dann [BE_GT_v2.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT_v2.csv) und schließlich [BE_GT_v3.csv](https://labs.onb.ac.at/gitlab/bed/bed-general/-/blob/main/Groundtruth/BE_GT_v3.csv). Das letzte ist das aktuellste und umfangreichste Datenset. Es enthält Barcodes und den Wappentyp (falls vorhanden) auf den ersten fünf Seiten eines Digitalisats. Dabei werden die 4 folgenden Kategorien unterschieden, die Zahl in Klammern bezeichnet die Anzahl der Bilder in der jeweiligen Kategorie: