Glossar
Diese Tabelle bietet eine umfassende Übersicht der im Bereich Datensets verwendeten Fachbegriffe und Abkürzungen. Hier finden Sie sowohl die deutschen als auch die englischen Bezeichnungen und Definitionen, um eine klare und konsistente Nutzung der Begrifflichkeiten sicherzustellen.
Begriff | Definition |
---|---|
🔗
ABO |
Austrian Books Online (Österreichische Bücher Online). Projekt (und damit assoziierter Bestand) der → ÖNB, in dem sie ihren historischen Buchbestand in einer Public Private Partnership mit Google digitalisiert. Siehe https://www.onb.ac.at/digitale-angebote/austrian-books-online |
🔗
AC-Nummer |
Austrian Central Catalog-Nummer. → OBV-weiter Identifier des bibliografischen Metadatensatzes nach der Formalerschließung; entspricht einer abstrakten Beschreibung aller Exemplare, also kann eine AC-Nummer mehreren Exemplaren bzw. Barcodes entsprechen |
🔗
AI/KI |
Artificial Intelligence (AI) oder Künstliche Intelligenz (KI) ist ein Teilgebiet der Informatik, das sich darauf konzentriert, Systeme und Maschinen zu entwickeln, die menschliche Intelligenz simulieren und Aufgaben ausführen können, die typischerweise menschliche kognitive Fähigkeiten erfordern, wie z. B. Sprachverständnis, Mustererkennung, Problemlösung und Entscheidungsfindung. KI umfasst verschiedene Technologien, darunter maschinelles Lernen, neuronale Netzwerke und die Verarbeitung natürlicher Sprache, um Anwendungen von virtuellen Assistenten bis hin zu autonomen Robotern zu schaffen |
🔗
AKON |
Ansichtskarten Online. Ansichtskartenportal (und zugehöriger Bestand) der → ÖNB; enthält 75.000 digitalisierte Postkarten aus allen Teilen der Welt. Siehe https://akon.onb.ac.at/ |
🔗
Alma |
Name der Bibliothekssoftware der ExLibris Group. Die → ÖNB verwendet die Software für ihren zentralen Bibliothekskatalog. Siehe https://exlibrisgroup.com/products/alma-library-services-platform/ |
🔗
ALTO (XML) |
Analysed Layout and Text Object (Analysiertes Layout- und Textobjekt). → XML-Standard für die standgenaue Beschreibung von Textträgern. Siehe https://www.loc.gov/standards/alto/ |
🔗
ANNO |
Austrian Newspapers Online (Österreichische Zeitungen Online). Virtueller Zeitungslesesaal der → ÖNB und zugehöriger Bestand, der alle digitalisierten Zeitungen und Zeitschriften umfasst. Siehe https://anno.onb.ac.at/ |
🔗
API |
Application Programming Interface (Programmierschnittstelle für Applikationen). Teil eines Programmes, der von einem Softwaresystem anderen Programmen zur Verfügung gestellt wird, um sie an das System anbinden zu können; sie erlauben Entwickler*innen und Benutzer*innen unterschiedliche komplexe Funktionalitäten leichter zu erstellen und ermöglichen den Austausch von Daten zwischen verschiedenen Systemen; sie sind teilweise zugangsbeschränkt, besonders wenn sie von For-Profit-Unternehmen angeboten werden |
🔗
Bibframe |
Datenmodell für die bibliografische Beschreibung; es soll die Bedürfnisse derjenigen, die detaillierte bibliografische Beschreibungen aufnehmen, die Anforderungen derjenigen, die andere kulturelle Materialien beschreiben, und derjenigen, die keine so detaillierte Beschreibung benötigen, in Einklang bringen. Siehe auch https://www.loc.gov/bibframe/ |
🔗
Blazegraph |
Hochskalierbare Graph-Datenbank, die speziell für die Verarbeitung und Abfrage von → RDF-Daten entwickelt wurde. Sie unterstützt → SPARQL-Abfragen und bietet leistungsstarke Funktionen für die Handhabung großer Datenmengen in verteilten Umgebungen. Siehe https://blazegraph.com/ |
🔗
|
Freies und quelloffenes Datenkomprimierungsprogramm und zugehöriges Dateiformat; komprimiert nur einzelne Dateien und ist kein Dateiarchivierer; für Aufgaben wie das Verarbeiten mehrerer Dateien, Verschlüsselung und das Aufteilen von Archiven ist es auf separate externe Dienstprogramme angewiesen; besonders in Unix- und Linux-Umgebungen verbreitet |
🔗
Capture |
(Erfassung). Bezeichnet den Prozess des Erfassens von Daten oder Informationen aus verschiedenen Quellen, wie Bildern, Texten oder Videos; diese Daten werden dann digitalisiert, gespeichert und weiterverarbeitet, um sie nutzbar zu machen |
🔗
CLARIAH-AT |
Konsortium österreichischer Universitäten und Forschungseinrichtungen, das die österreichischen Aktivitäten in den europäischen → ESFRI-Forschungsinfrastrukturen → CLARIN und → DARIAH koordiniert und vorantreibt. Siehe auch https://www.clariah.at |
🔗
CLARIN |
Common Language Resources and Technology Infrastructure (Gemeinsame Sprachressourcen und Technologieinfrastruktur). Europäische Forschungsinfrastruktur, die darauf abzielt, die Geistes- und Sozialwissenschaften durch den Zugang zu Sprachressourcen und Werkzeugen zu unterstützen; erleichtert die kollaborative Forschung, indem sie standardisierte Daten, Werkzeuge und Dienstleistungen für linguistische und sprachbezogene Studien bereitstellt. Siehe auch https://www.clarin.eu/ |
🔗
CQL |
Contextual Query Language (Kontextuelle Abfragesprache). Abfragesprache, die für den Zugriff auf bibliografische und textbasierte Datenbanken entwickelt wurde; sie kombiniert menschlich lesbare Syntax mit leistungsfähigen Suchfunktionen, um präzise und relevante Suchergebnisse zu liefern; wird von der Library of Congress entwickelt. Siehe https://www.loc.gov/standards/sru/cql/ sowie → SRU |
🔗
Crawl |
(‚Kriechen‘, ‚krabbeln‘). Ausdruck, der den automatisierten Prozess des systematischen Durchsuchens und Herunterladens von Website-Inhalten beschreibt, dient normalerweise der Indizierung und Analyse |
🔗
CSV |
Comma Separated Values (durch Komma getrennte Werte). Dateiformat, das den Aufbau einer Textdatei beschreibt, mit der einfach strukturierte Daten gespeichert oder ausgetauscht werden können; Dateien dieses Formats verwenden die Endung |
🔗
CV |
Computer Vision (computerbasiertes Sehen) ist ein Bereich der Künstlichen Intelligenz (KI), der darauf abzielt, Computern das Interpretieren und Verstehen von visuellen Informationen aus der Welt, wie Bilder oder Videos, zu ermöglichen. Durch die Analyse und Verarbeitung visueller Daten können Computer-Vision-Systeme Aufgaben wie Objekterkennung, Bildklassifikation, Gesichtserkennung und Szenenrekonstruktion durchführen. Es kombiniert Elemente des maschinellen Lernens, der Mustererkennung und der Bildverarbeitung, um Maschinen die Fähigkeit zu geben, „zu sehen“ und auf Grundlage visueller Eingaben Entscheidungen zu treffen |
🔗
DARIAH |
Digital Research Infrastructure for the Arts and Humanities (Digitale Forschungsinfrastruktur für die Künste und Geisteswissenschaften). Europäische Forschungsinfrastruktur, die digitale Wissenschaft in den Geistes- und Kulturwissenschaften unterstützt; sie stellt Werkzeuge, Dienste und Ressourcen bereit, um Forschung zu verbessern, Zusammenarbeit zu fördern und die langfristige Sicherung sowie Zugänglichkeit von Forschungsdaten zu gewährleisten. Siehe auch https://www.dariah.eu/ |
🔗
Docker |
Open-Source-Plattform, die es ermöglicht, Softwareanwendungen in isolierten Containern zu verpacken, zu verteilen und auszuführen; diese Container sind eigenständige, portable Softwarepakete und enthalten alle notwendigen Komponenten, um die Anwendung konsistent auf verschiedenen Umgebungen auszuführen. Siehe https://www.docker.com/ |
🔗
EDM |
Europeana Data Model (Datenmodell der Europeana). Standardisiertes Datenmodell für Kulturgüter verschiedener Domänen; soll über bereichsspezifische Metadatenstandards hinausgehen und dabei die Vielseitigkeit etablierter Gemeinschaftsstandards (wie etwa → METS) berücksichtigen. Siehe https://pro.europeana.eu/page/edm-documentation |
🔗
ESFRI |
European Strategy Forum on Research Infrastructures (Europäisches Strategieforum für Forschungsinfrastrukturen). Strategisches Gremium der Europäischen Union, das Forschungseinrichtungen von europäischer Bedeutung koordiniert mit dem Ziel unterstützt, die Entwicklung und den Zugang zu wissenschaftlicher Infrastruktur zu fördern, um die europäische Forschung und Innovation nachhaltig zu stärken |
🔗
GeoNames |
Frei nutzbare geographische Datenbank. Siehe https://www.geonames.org/ |
🔗
HTR |
Handschrifterkennung (Handwritten Text Recognition – HTR) bezieht sich auf die Technologie und den Prozess der automatischen Erkennung und Umwandlung handgeschriebener Texte in ein digitales Format. Sie verwendet Künstliche Intelligenz und maschinelle Lernmodelle, um einzelne Zeichen, Wörter oder Sätze in verschiedenen Handschriftstilen zu erkennen. HTR wird häufig bei der Digitalisierung von Dokumenten, der Bewahrung historischer Dokumente und der Automatisierung von Dateneingaben eingesetzt, um handgeschriebene Notizen, Formulare und Archive in durchsuchbaren, bearbeitbaren Text umzuwandeln |
🔗
HTTP |
Hypertext Transfer Protocol (Protokoll für die Übertragung von Hypertext). Allgemein gültiger technischer Standard, der regelt, wie eine Webseite von einem Server in den Browser des oder der Abfragenden übertragen wird |
🔗
IIIF |
International Image Interoperability Framework (Rahmen für die internationale Interoperabilität von Bildern). Standardisiert die Bereitstellung von Bildern und audiovisuellen Daten von Servern in unterschiedlichen Webumgebungen. Siehe https://iiif.io/ |
🔗
JPEG |
Joint Photographic Experts Group (Gemeinsame Expertengruppe für Fotografie). Häufig verwendete Methode der verlustbehafteten Komprimierung für digitale Bilder, insbesondere für Bilder, die durch digitale Fotografie erzeugt wurden sowie zugehöriges Dateiformat; Dateien dieses Formats tragen die Endungen |
🔗
JPEG2000 |
Joint Photographic Experts Group 2000 (Gemeinsame Expertengruppe für Fotografie 2000). Fortschrittlicher Bildkomprimierungsstandard, der eine höhere Bildqualität und mehr Flexibilität als das herkömmliche → JPEG bietet, indem er eine Wavelet-basierte Komprimierung verwendet; unterstützt Funktionen wie verlustfreie Komprimierung und progressives Rendering, wodurch er sich für die Archivierung und professionelle Bildbearbeitung eignet |
🔗
JSON |
JavaScript Object Notation (Objektnotation in JavaScript). Textbasiertes Dateiformat mit der Endung |
🔗
JSON-LD |
JavaScript Object Notation for Linked Data (Objektnotation in JavaScript für Linked Data). Format zur Darstellung strukturierter Daten im Web, das → JSON verwendet, um Linked Data zu ermöglichen; Dateien dieses Formats haben die Dateiendung |
🔗
Jupyter Notebooks |
Virtuelle Notizbücher, die dem Verfassen, Demonstrieren und Ausführen von → Python-Codebeispielen dienen; liegen im Dateiformat |
🔗
LOD |
Linked Open Data (verbundene offene Daten). Bezeichnet im Internet frei verfügbare Daten, die identifiziert sind und sich dadurch direkt mittels → HTTP abrufen lassen; sie sind unter offenen Lizenzen verfügbar, was die Wiederverwendung und Verknüpfung von Informationen über verschiedene Datenquellen hinweg fördert, etwa die Einbindung von → RDF |
🔗
MEI |
Music Encoding Initiative (Musikkodierungsinitiative). Open-Source-Framework für die Kodierung und den Austausch von Musiknotation, Metadaten und zugehörigen Informationen in digitaler Form; ausgedrückt als → XML-Schema; ermöglicht Forschern, Musikern und Archivaren komplexe musikalische Werke präzise darzustellen und so Analyse, Bewahrung und Interoperabilität zu unterstützen |
🔗
METS |
Metadata Encoding and Transmission Standard (Standard für die Kodierung und Übertragung von Metadaten). → XML-Standard zur strukturierten Speicherung und Übertragung digitaler Objekte und deren Metadaten, der vor allem in Bibliotheken, Archiven und Museen genutzt, um digitale Sammlungen langfristig zu verwalten und zugänglich zu machen |
🔗
ML |
Maschinelles Lernen (ML) ist ein Teilgebiet der Künstlichen Intelligenz (→ KI), das sich auf die Entwicklung von Algorithmen und statistischen Modellen konzentriert, die es Computern ermöglichen, aus Daten zu lernen und Entscheidungen zu treffen, ohne explizit für jede spezifische Aufgabe programmiert zu sein. ML wird in einer Vielzahl von Anwendungen eingesetzt, darunter Empfehlungssysteme, prädiktive Analysen, Spracherkennung und autonomes Fahren, wobei sich die Systeme im Laufe der Zeit basierend auf den verarbeiteten Daten anpassen und verbessern. |
🔗
MMS-ID |
Metadata Management System Identifier. Ein interner Identifier des → OBV bzw. der → ÖNB |
🔗
OAI-PMH |
Open Archives Initiative Protocol for Metadata Harvesting (Protokoll der Open Archives Initiative für das Abfragen von Metadaten). Ein in → XML verfasstes Protokoll, das mit → HTTP-Anfragen gesteuert wird und spezifiziert, wie Metadaten strukturiert und präsentiert werden |
🔗
OBV |
Österreichischer Bibliotheksverbund (Austrian Library Union). Verbund wissenschaftlicher und administrativer Bibliotheken in Österreich mit 70 Teilnehmern und über 90 Institutionen, siehe https://www.obvsg.at/bibliothekenverbund/grundlagen/ |
🔗
OCR |
Optical Character Recognition (optische Zeichenerkennung). Elektronische Umwandlung von Bildern mit maschinengeschriebenem, handgeschriebenem oder gedrucktem Text in maschinell kodierten Text, etwa aus einem gescannten Dokument, einem Foto eines Dokuments o.Ä.; Forschungsthema der Felder → AI/KI und → CV |
🔗
ÖNB |
Österreichische Nationalbibliothek. Die größte Bibliothek Österreichs und eine kulturelle sowie wissenschaftliche Institution in Wien; gegründet im 14. Jahrhundert, beherbergt sie Millionen von Büchern, Manuskripten, Karten, Fotografien und anderen historischen Dokumenten und zählt zu den ältesten und umfangreichsten Bibliotheken Europas; widmet sich der Bewahrung des kulturellen Erbes Österreichs und bietet Zugang zu einer Vielzahl historischer und zeitgenössischer Ressourcen für Forschung, Bildung und das öffentliche Interesse |
🔗
ppi |
pixels per inch (Pixel pro Zoll). Maßeinheit für die Punktdichte von Bildern, bezieht sich auf die Detailgenauigkeit des Bildes |
🔗
Python |
Name einer universellen Programmiersprache, die sich durch gute Lesbarkeit auszeichnet; ein geläufiges Dateiformat für Skripte in dieser Sprache hat die Endung |
🔗
RDA |
Resource Description and Access (Beschreibung von und Zugang zu Ressourcen). Internationaler Katalogisierungsstandard; bietet Richtlinien und Best Practices zur Erstellung konsistenter und präziser Metadaten, die den Zugang und die Auffindbarkeit von Metadaten zu Bibliotheks- und Kulturerbe-Ressourcen erleichtern |
🔗
RDF |
Resource Description Framework (Ressourcenbeschreibungssystem). Herangehensweise im Internet zur Formulierung logischer Aussagen über beliebige Dinge; jede Aussage folgt dem ‚Tripel‘-Muster: Subjekt, Prädikat, Objekt; ebenso ein Datenmodell, das auf einem theoretischen Niveau beschreibt, wie Daten strukturiert sind; ermöglicht Linked Open Data (→ LOD) |
🔗
Readme |
Textdokument, das grundlegende Informationen über ein Projekt, einschließlich dessen Zweck, Nutzungshinweise und Installationsanweisungen, bereitstellt; dient als Einführung, um den Nutzern zu helfen, die Software oder das Code-Repository zu verstehen und effektiv zu verwenden |
🔗
Repo(sitorium) |
Zentraler Speicherort, in dem digitale Objekte wie Dokumente, Daten oder Softwareversionen gespeichert, verwaltet und zugänglich gemacht werden; dient häufig der Archivierung, dem Teilen und der langfristigen Erhaltung dieser Objekte |
🔗
RESTful |
Bezieht sich auf Systeme oder eine → API, die den Prinzipien von REST (Representational State Transfer) folgen, einem Software-Architekturstil zur Gestaltung skalierbarer Webdienste; eine RESTful-API verwendet → HTTP-Methoden wie GET, POST, PUT und DELETE, um Operationen an Ressourcen durchzuführen, die durch URLs identifiziert werden, wodurch sie einfach, zustandslos und interoperabel sind |
🔗
SACHA |
Simple Access to Cultural Heritage Assets (Einfacher Zugang zu Kulturerberessourcen). Früherer Name der → IIIF-Schnittstelle der → ÖNB. Siehe: https://iiif.onb.ac.at/ |
🔗
Seed |
Metaphorischer Begriff des Österreichischen Webarchivs. Was mit einem → Crawl geerntet wird, muss vorher gesät werden („Seed“). Ausgangsadresse für den Crawler, um mit einem Crawl beginnen zu können (bspw. beim Domaincrawl die Startseiten aller Domains) |
🔗
Semantic Web |
(Semantisches Web). Erweiterung des World Wide Web, die es Computern ermöglicht, Daten anhand ihrer Bedeutung zu verstehen und zu verarbeiten; es nutzt standardisierte Formate und Ontologien, um Informationen zu verknüpfen und so eine intelligentere, kontextbasierte Informationsverarbeitung zu ermöglichen |
🔗
Sickle |
Open-Source-Werkzeug für die kontinuierliche Integration und Bereitstellung von Software, das speziell für die Automatisierung von Deployment-(= Softwareverteilungs-)Prozessen entwickelt wurde; es ermöglicht die schnelle und konsistente Bereitstellung von Anwendungen durch Definition und Verwaltung von Pipelines für Builds und Releases. Siehe https://pypi.org/project/Sickle/ |
🔗
SPARQL |
SPARQL Protocol and → RDF Query Language (SPARQL-Protokoll und RDF-Abfragesprache). Abfragesprache für das → Semantic Web, mit der sich RDF-Daten durchsuchen lassen |
🔗
SRU |
Search and Retrieve via → URL (Suchen und Abrufen per URL). Standardisiertes Webservice-Protokoll, mit dem man Datenbanken im Internet abfragen kann. Die Ergebnisse können in → XML bereitgestellt werden. Siehe https://www.loc.gov/standards/sru/index.html |
🔗
Swagger |
Framework für die Beschreibung, Erstellung und Dokumentation einer → RESTful → API; ermöglicht Entwicklern, API-Spezifikationen in einem standardisierten Format zu definieren, das sowohl maschinen- als auch menschenlesbar ist. Siehe https://swagger.io/ |
🔗
TEI |
Text Encoding Initiative (Textkodierungsinitiative). Rahmen für die Kodierung von Textdaten in digitaler Form unter Verwendung von → XML-basierten Richtlinien, die auf die geisteswissenschaftliche Forschung zugeschnitten sind; ermöglicht die detaillierte Darstellung von Texten, z. B. für digitale Editionen, einschließlich Struktur, Anmerkungen und Metadaten, etwa zur Bewahrung, Analyse und gemeinsamen Nutzung |
🔗
TIFF |
Tag(ged) Image File Format (Dateiformat etikettierter Bilder). Geläufiges Dateiformat mit der Dateiendung |
🔗
TXT |
Textdokument mit der Dateiendung |
🔗
URI |
Uniform Resource Identifier (einheitlicher Ressourcenidentifier). Zeichenkette, die zur eindeutigen Identifizierung einer Ressource im Internet dient, entweder durch einen Standort (→ URL) oder durch einen Namen (URN, Uniform Resource Name). Sie besteht aus einem Schema, wie |
🔗
URL |
Uniform Resource Locator (einheitlicher Ressourcenverorter). Eindeutige Kennung, die zum Auffinden einer Ressource im Internet verwendet wird; auch als Webadresse bezeichnet; beginnt meist mit |
🔗
XML |
eXtensible Markup Language (erweiterbare Auszeichnungssprache). Textbasiertes Format, das zur Speicherung und Übertragung von strukturierten Daten verwendet wird und sowohl für Menschen als auch Maschinen lesbar ist; ermöglicht Benutzern, eigene Tags zur Beschreibung der Daten zu definieren, was es äußerst flexibel für verschiedenste Anwendungen wie Webdienste, Dokumentenspeicherung und Datenaustausch macht |
🔗
Zip |
Archivdateiformat mit der Dateiendung |