|
|
Die für den Gebrauch grundsätzlich aufbereiteten Transkribus-Exporte werden vollständig in den TEI-Namespace überführt. Hierfür werden einserseits fürs TEI-XML obligatorische Elemente ergänzt, andererseits einige Tags (sowohl strukturelle als auch inhaltliche) umbenannt oder umstrukturiert.
|
|
|
|
|
|
Die Tagvergabe erfolgt hierbei soweit sinnvoll möglich in Anlehnung an die Blotius-Edition, die sich bereits in der ÖNB Infrastruktur für Digitale Editionen befindet. Grund für diese Annäherung ist die strukturelle Ähnlichkeit der Quellen.
|
|
|
|
|
|
[TOC]
|
|
|
|
|
|
# [teiHeader](https://www.tei-c.org/release/doc/tei-p5-doc/en/html/HD.html#HD3)
|
|
|
Die Datei verfügte bereits über einen teiHeader. Während die Elemente <fileDesc/> und <revisionDesc/> bereits enthalten waren, mussten die fehlenden drei Elemente ergänzt werden:
|
|
|
- <encodingDesc> (encoding description) documents the relationship between an electronic text and the source or sources from which it was derived.
|
|
|
- <profileDesc> (text-profile description) provides a detailed description of non-bibliographic aspects of a text, specifically the languages and sublanguages used, the situation in which it was produced, the participants and their setting.
|
|
|
- <xenoData> (non-TEI metadata) provides a container element into which metadata in non-TEI formats may be placed.
|
|
|
|
|
|
Die Inhalte aller Teile des Headers müssen noch ergänzt werden, zB. wäre auch eine <sourceDesc/> inkl. [<msDesc/>](https://www.tei-c.org/release/doc/tei-p5-doc/en/html/MS.html#msdesc) in der <fileDesc/> möglich (=> Soll aber auch in einem Redaktionellen Text sein; Doppeln oder hier weglassen?)
|
|
|
|
|
|
# Strukturelle TEI-Tags
|
|
|
Um die Struktur der Quelle möglichst gut darzustellen, werden in TEI Strukturelle Tags vergeben.
|
|
|
|
|
|
## Eine Quelle überspannende Tags
|
|
|
- <text> umschließt den gesamten Text-Teil des Dokuments (= Alles außer Header)
|
|
|
- Einband erhält keine Extra-Tags
|
|
|
- <front> (front matter) beginnt im Einband innen und enthält alle einleitenden Elemente (Überschriften, Zusammenfassungen, Titelseiten, Vorworte, Widmungen usw.), die am Anfang eines Dokuments vor dem Hauptteil stehen. Innerhalb dieses Elements
|
|
|
- [<titlePage>](https://www.tei-c.org/release/doc/tei-p5-doc/en/html/DS.html#DSTITL): Titelseite in entsprechendem Element mit den verlinkten Unterelementen, vgl. Link.
|
|
|
- Ansonsten Unterteilung nur mit <div>-Elementen mit verschiedenen @type-Values. Für uns relevant:
|
|
|
- <preface>: Ein an den Leser gerichtetes Vorwort, in dem der Autor oder Herausgeber den Inhalt, den Zweck oder den Ursprung des Textes erläutert
|
|
|
- <contents>: Ein Inhaltsverzeichnis, das die Struktur eines Werkes angibt und seine Bestandteile auflistet. Innerhalb verwendung des Listenelements (<list>/<item>)
|
|
|
- <body> (text body) für den Haupttext
|
|
|
- <back> (back matter) enthält alle Anhänge usw., die dem Hauptteil eines Textes folgen. Für uns dementsprechend nicht wirklich relevant (=> Trotzdem die leeren Seiten am Ende der Struktur und Einheitlichkeit halber damit markieren?)
|
|
|
In Blotius hier außerdem: <xi:include> für die Namespaces der Register, Personen und Orte (=> hier müssen wir uns überlegen, was wir leisten können)
|
|
|
- Hinzufügungen (s. offene Fragen)
|
|
|
|
|
|
## Sich (pro Seite) wiederholende Tags
|
|
|
- Neues Bild im Facsimile (Keine Unterscheidung Einband oder Textseite): Markierung durch Tag <pb n="1" facs="Z134364208/00000023.jpg"/> mit:
|
|
|
- n durchgehend nummeriert von 1 bis Anzahl der Bilder
|
|
|
- facs Barcode + / + Nummer + Dateiformat-Endung des Bildes mit führenden Nullen (Im Fall von Blotius; Jede Nummerierungsstruktur möglich)
|
|
|
- Kopfteil: Markierungen der einzelnen Teile mit entweder:
|
|
|
1. [<fw>](https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-fw.html), mit jeweils unterschiedlichem @type:
|
|
|
- Seitenzahl: pageNum
|
|
|
- Formatsangabe: =>noch schauen <!---->
|
|
|
- Wissensklasse: header
|
|
|
- Unterkategorie der Wissensklasse: =>noch schauen <!---->
|
|
|
2. Bei Blotius: <fw> nur für die Seitenzahl verwendet; Sonst gibt es nur die Überschrift, die ist in geschachtelten <div>s mit type-Attributen
|
|
|
- <fw> idR mit [@place](https://tei-c.org/release/doc/tei-p5-doc/en/html/ref-att.placement.html) (Recommended) angegeben, unsere Koordinaten dafür in diese Info (zB. "top-right") umwandeln?
|
|
|
|
|
|
|
|
|
- Ganzer Inhaltsteil:
|
|
|
- Einzelne Einträge: =>noch schauen <!---->
|
|
|
- Text-Teil: =>noch schauen <!---->
|
|
|
- Autorennamen: =>noch schauen <!---->
|
|
|
- Ort: =>noch schauen <!---->
|
|
|
- Datum: =>noch schauen <!---->
|
|
|
- Nummerierungen (zB. n.xxx): =>noch schauen <!---->
|
|
|
- Einzelne Hinzufügungen (zu Eintrag zugehörig oder nicht): =>noch schauen <!---->
|
|
|
|
|
|
## Spezielle Tags
|
|
|
- [<stamp>](https://www.tei-c.org/release/doc/tei-p5-doc/de/html/ref-stamp.html) Zum Erfassen der verschiedenen Stempel
|
|
|
- Unleserlich (unclear): =>noch schauen <!---->
|
|
|
- Abkürzung (abbrev): =>noch schauen <!---->
|
|
|
- Hinzufügung (add): =>noch schauen <!---->
|
|
|
- Korrektur (corr): =>noch schauen <!---->
|
|
|
- TextStyle 'strikethrough': =>noch schauen <!---->
|
|
|
- Rötelstift (roetel): =>noch schauen <!---->
|
|
|
- Bleistift (bleistift): =>noch schauen <!---->
|
|
|
|
|
|
# Offene Fragen
|
|
|
- Wie wollen wir die zwei Arten von Trennstrichen tatsächlich in der Edition darstellen? Derzeit vlt. nicht ganz Handlich mit ¬ und = ?
|
|
|
- Wie werden lose Zettel als solche angegeben? Nach/in body? @type als so etwas wie "flyleaf"? In <msDesc> unter [<accMat>](https://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-accMat.html) erwähnt? |
|
|
\ No newline at end of file |