@@ -53,11 +53,12 @@ Basierend auf einer Liste von Martin Krickl für Bücher aus dem ABO-Korpus mit
| A | 2098 | 2081 | 17 | 0,992 |
| B | 3741 | 3736 | 5 | 0,999 |
| C | 381 | 344 | 37 | 0,903 |
| A ∨ B ∨ C | 6220 | 6161 | 59 | 0,991 |
| N | 550864 | - | - | - |
Insgesamt ergibt sich für die Kombination aller Wappentypen eine Fehlerstatistik von 59 falsch Positiven zu 6161 richtig Positiven, was bei einer Gesamtzahl von 6220 Positiven insgesamt damit einer Präzision von 0,991 entspricht. Die Analyse der N-Vorhersagen ist noch ausständig.
Tatsächlich wird vom Classifier ein Wahrscheinlichkeitswert für jede Klasse (A, B, C oder N) ausgegeben und für unsere Auswertung wird zunächst nur der höchste Wert beachtet. Die Histogramme der Wahrscheinlichkeitswerte (siehe Abbildung 4) lassen auch Rückschlüsse auf die Qualität des Trainings zu:
Tatsächlich wird vom Classifier ein Wahrscheinlichkeitswert für jede Klasse (A, B, C oder N) ausgegeben und für unsere Auswertung wird zunächst nur der höchste Wert beachtet. Die Histogramme der Wahrscheinlichkeitswerte (siehe Abbildung 4) lassen auch Rückschlüsse auf die Qualität des Trainings zu: Die Wappentypen A und B wurden sehr gut erlernt und die entsprechenden Wahrscheinlichkeiten sind nahe bei 1. Der Typ C hingegen kann mit unseren Trainingsdaten nicht ähnlich genau von Bildern ohne Wappen unterschieden werden, vermutlich aufgrund der stärkeren Ähnlichkeiten von vielen weiteren Wappen mit der Variante C des Wappens von Prinz Eugen.