Cuneiform Annotator und Keilschriftzeichenklassifikation

Aktiv
Cuneiform Annotator und Keilschriftzeichenklassifikation Shirley Sidharta, CC BY SA 4.0

Die Performance von Machine Learning Anwendungen basiert maßgeblich auf der Qualität der Trainingsdaten, die der Machine Learning Algorithmus verarbeitet. Im Bereich der Zeichenerkennung auf Keilschrifttafeln ist die Klassifikation von Trainingsdaten abhängig, die üblicherweise von Fachwissenschaftlern erstellt werden.

Das Projekt zielt darauf ab, Tools für die Erstellung und Transformation von Annotationen auf 2D und 3D Medien bereitzustellen, Annotationsstandards für die Repräsentierung von noch nicht bestehenden Annotationstypen zu entwickeln, für den Anwendungsfall Keilschrift ein Trainingsdatenset zu erstellen und anschließend dieses für Klassifikationen zu nutzen.

Motivation

Ursprünglich als Prototyp im Jahr 2021 auf Basis des Annotationstools Annotorious entwickelt, wurde das bisher nur intern im Haft Tappeh-Projekt verwendete Tool Cuneur: Cuneiform Annotator in verschiedenen Anwendungskontexten weiterentwickelt. In einer Kooperation mit Wissenschaftler:innen des belgischen Cune-IIIF-orm Projekts wurde das Werkzeug getestet und an die Bedarfe der Keilschriftforschung angepasst. Die hieraus gewonnenen Erkenntnisse sind im itit Journal publiziert.

Ein bereits 2022 mit dem Cuneur annotiertes Keilschriftbildkorpus (Hilprechtsammlung, HeiCuBeDa) wurde 2023 als eigenes Machine Learning Datenset unter dem Namen MaiCuBeDa veröffentlicht. Aufbauend auf diesem Datensatz wurden 2023 zwei unterschiedliche Klassifikationen erstellt, welche beide auf Konferenzen präsentiert wurden. Eine davon wurde mit dem Best Paper Award der GCH2023-Konferenz ausgezeichnet.

Ein in diesem Kontext entwickeltes Tool ermöglicht die Übertragung von Annotationen, die auf 2D Renderings erstellt wurden, auf Fotos der gleichen Seite der Keilschrifttafel. Im Verlauf des Jahres wurden Bestrebungen zur Standardisierung von 3D Annotationen und Implementierungen von Prototypen für 3D Annotationen begonnen, die im neuen Jahr im Kontext von NFDI4Objects diskutiert werden sollen.