Home » Weiße magie » Geheimnisse von 160.000 alten Texten, die in der Stiftsbibliothek St. Gallen aufbewahrt werden, könnten bald von KI entschlüsselt werden

Geheimnisse von 160.000 alten Texten, die in der Stiftsbibliothek St. Gallen aufbewahrt werden, könnten bald von KI entschlüsselt werden

Jan Bartek – AncientPages.com – Die Stiftsbibliothek St. Gallen in der Schweiz beherbergt rund 160.000 Bände literarischer und historischer Manuskripte aus dem 8. Jahrhundert, die alle von Hand auf Pergament in in der heutigen Zeit selten gesprochenen Sprachen geschrieben sind.

Um diese historischen Berichte über die Menschheit zu bewahren, wurden Millionen solcher Texte in Bibliotheken und Klöstern auf der ganzen Welt sicher aufbewahrt. Ein erheblicher Teil dieser Sammlungen ist der breiten Öffentlichkeit durch digitale Bilder zugänglich, aber Experten sagen, dass es eine außergewöhnliche Menge an Material gibt, das noch nie gelesen wurde, eine Fundgrube an Einblicken in die Weltgeschichte, die darin verborgen ist.

Stiftsbibliothek St. Gallen. Quelle: Stiftsbibliothek St. Gallen – Public Domain

Jetzt entwickeln Forscher an der University of Notre Dame ein künstliches neuronales Netzwerk, um komplexe alte Handschriften auf der Grundlage menschlicher Wahrnehmung zu lesen, um die Fähigkeiten der Deep-Learning-Transkription zu verbessern.

„Wir haben es mit historischen Dokumenten zu tun, die in längst aus der Mode gekommenen Stilen geschrieben sind, die viele Jahrhunderte zurückreichen, und in Sprachen wie Latein, die kaum noch verwendet werden“, sagte Walter Scheirer, außerordentlicher Professor am Dennis O. Doughty Collegiate in der Fakultät für Informatik und Ingenieurwesen an der Notre Dame. „Sie können schöne Fotos dieser Materialien erhalten, aber wir haben uns vorgenommen, die Transkription so zu automatisieren, dass die Wahrnehmung der Seite durch die Augen des erfahrenen Lesers nachgeahmt wird und ein schnelles, durchsuchbares Lesen des Textes ermöglicht wird. “

Lesen Sie auch:  ENGEL NUMMER 1110 (Symbolik & Bedeutung) – SEHEN 1110

In Forschungsergebnissen, die in der Zeitschrift Institute of Electrical and Electronics Engineers veröffentlicht wurden Transaktionen zu Musteranalyse und maschineller Intelligenzskizziert Scheirer, wie sein Team traditionelle Methoden des maschinellen Lernens mit visueller Psychophysik kombinierte – eine Methode zur Messung der Zusammenhänge zwischen physischen Reizen und mentalen Phänomenen, wie z. B. die Zeit, die ein fachkundiger Leser benötigt, um eine bestimmte Figur zu erkennen Qualität der Handschrift oder die Verwendung bestimmter Abkürzungen erkennen.

Scheirers Team untersuchte digitalisierte lateinische Handschriften, die im 9. Jahrhundert von Schreibern im Kloster St. Gallen geschrieben wurden. Die Leser gaben ihre manuellen Transkriptionen in eine speziell entwickelte Softwareschnittstelle ein. Das Team maß dann die Reaktionszeiten während der Transkription, um zu verstehen, welche Wörter, Zeichen und Passagen einfach oder schwierig waren. Scheirer erklärte, dass die Einbeziehung dieser Art von Daten ein Netzwerk schuf, das dem menschlichen Verhalten besser entspricht, Fehler reduziert und ein genaueres, realistischeres Lesen des Textes ermöglicht.

„Es ist eine Strategie, die normalerweise nicht beim maschinellen Lernen verwendet wird“, sagte Scheirer. „Wir kennzeichnen die Daten durch diese psychophysischen Messungen, die direkt aus psychologischen Wahrnehmungsstudien stammen – indem wir Verhaltensmessungen durchführen. Wir informieren dann das Netzwerk über allgemeine Schwierigkeiten bei der Wahrnehmung dieser Charaktere und können auf der Grundlage dieser Messungen Korrekturen vornehmen. “

Die Nutzung von Deep Learning zur Transkription antiker Texte ist für Geisteswissenschaftler von großem Interesse.

„Es gibt einen Unterschied zwischen dem bloßen Aufnehmen und Lesen der Fotos und einem Programm, das eine durchsuchbare Lesung bereitstellt“, sagte Hildegund Müller, außerordentliche Professorin am Institut für Klassische Philologie an der Notre Dame. „Wenn Sie die in dieser Studie verwendeten Texte betrachten – Manuskripte aus dem 9. Jahrhundert –, dann ist das eine frühe Phase des Mittelalters. Es ist eine lange Zeit vor der Druckerpresse. Das ist eine Zeit, in der eine enorme Menge an Manuskripten produziert wurde alle Arten von Informationen, die in diesen Manuskripten versteckt sind – unbekannte Texte, die niemand zuvor gesehen hat.“

Lesen Sie auch:  25 Dos and Don'ts, wenn Sie Ihren Ehepartner während der Trennung ignorieren

Seite 3 der „Institutio de arte grammatica“ in der Handschrift St. Gallen, Stiftsbibliothek. Kredit: Public Domain

Scheirer sagte, Herausforderungen bleiben. Sein Team arbeitet daran, die Genauigkeit von Transkriptionen zu verbessern, insbesondere im Fall beschädigter oder unvollständiger Dokumente, sowie daran, Abbildungen oder andere Aspekte einer Seite zu berücksichtigen, die für das Netzwerk verwirrend sein könnten.

Das Team war jedoch in der Lage, das Programm an die Transkription äthiopischer Texte anzupassen und es an eine Sprache mit einem völlig anderen Zeichensatz anzupassen – ein erster Schritt zur Entwicklung eines Programms mit der Fähigkeit, Informationen für Benutzer zu transkribieren und zu übersetzen.

“Im literarischen Bereich könnte es sehr hilfreich sein. Jedes gute literarische Werk ist von einer Unmenge historischer Dokumente umgeben, aber wo es wirklich nützlich sein wird, ist die historische Archivrecherche”, sagte Müller. „Es besteht ein großer Bedarf, die Digital Humanities voranzubringen. Wenn man über Mittelalter und Frühe Neuzeit spricht, wenn man die Details und Folgen historischer Ereignisse verstehen will, muss man das schriftliche Material durchsehen, und diese Texte sind es.“ das einzige was wir haben.

Siehe auch: Weitere Neuigkeiten zur Archäologie

Außerhalb der westlichen Welt könnte das Problem sogar noch größer sein. Denken Sie an Sprachen, die in bedrohten Kulturen verschwinden. Wir müssen diese Werke erst einmal bewahren, zugänglich machen und irgendwann durch Übersetzungen in kulturelle Prozesse einfließen lassen, die noch im Gange sind – und wir laufen gegen die Zeit.”

Geschrieben von Jan Bartek – AncientPages.com Angestellter Autor