Newsroom

ABBYY mit Weltpremiere: Erste Omnifont OCR-Software zur Erkennung von Frakturschrift

24. März 2003

Neues Erkennungsmodul ermöglicht Digitalisierung wichtiger historischer Dokumente

Abbyy stellt eine neue Technologie vor, welche die Archivierung alter Dokumente und Bücher wesentlich erleichtert. Der führende Anbieter linguistischer und Optical Character Recognition (OCR)-Software präsentiert die erste Omnifont OCR-Software zur Erkennung von Frakturschrift. Nach mehr als zwei Jahren Entwicklungszeit erkennt das FineReader Modul für Frakturschrift historische Texte in Deutsch, Niederländisch und den skandinavischen Sprachen. Zusätzlich zu den kunstvollen und kalligrafischen Frakturschriften liest das neue Modul von ABBYY auch alte romanische Zeichen wie das verlängerte „s“ in frühen englischen und französischen Texten.

Bisher war die Digitalisierung historischer Dokumenten eine teure und aufwändige Angelegenheit. Die Grenzen der Technologie und die Einzigartigkeit der Dokumente, die in vielen verschiedenen historischen Schriften erstellt wurden, haben den Prozess der Texterkennung erschwert. Zwar konnten auch auf diesem Sektor OCR-Technologien in den letzten Jahren bessere Erkennungsraten erzielen und auch die Computer selbst wurden „intelligenter“ und konnten so trainiert werden, dass sie kursive Schriften erkennen. Dennoch benötigten die meisten Systeme immer noch viele Stunden Training mit dem Wörterbuch, um ein einzelnes Dokument mit alten Schriftarten zu erkennen.

Erkennung alter Texte ohne langes Training

Das ABBYY FineReader Modul für Frakturschrift ist das erste Omnifont OCR-System zur Erkennung von Frakturschrift. Anwender können jetzt Dokumente mit Frakturschrift einfach scannen und erkennen lassen. Die Texte können mit nur geringem Training und minimaler Arbeit mit dem Wörterbuch digitalisiert werden. Das ermöglicht Abbyy durch den Einsatz eines speziellen Klassifizierers für Frakturschrift. Um eine hohe Genauigkeit zu erreichen, wurde das Frakturmodul mit Hunderten von Beispieldokumenten aus dem 19. und vom Beginn des 20. Jahrhunderts trainiert. Spezielle Wörterbücher wurden auf der Grundlage von Originalwörterbüchern mit der Orthographie des 19. und 20. Jahrhunderts für Deutsch, Englisch, Französisch, Italienisch und Spanisch entwickelt.

Erste Implementierung im METAe Projekt

Im Laufe dieses Jahres wird die erste Implementierung eines Archivierungssystems mit Abbyys Omnifont OCR für Fraktur im METAe Projekt durchgeführt werden. METAe ist ein Konsortium von Bibliotheken und Digitalisierungsunternehmen aus ganz Europa, die eine Software-Lösung zur Archivierung und Umwandlung historischer Dokumente wie Bücher, Zeitschriften, Magazine und Zeitungen erstellen. Das FineReader Modul wird dabei die Hauptkomponente für die Archivierung der kostbarsten historischen Dokumente Europas darstellen. Partner im METAe Projekt sind unter anderen: Die Universität von Innsbruck, die Universität von Florenz, die Nationalbibliothek von Frankreich, die Nationalbibliothek von Norwegen, die Friedrich-Ebert-Stiftung, CCS Compact Computer Systeme (Deutschland) und die Cornell Library Universität (USA).

Hintergrund: Frakturschrift

Frakturschrift ist eine alte kalligrafische/kursive Schrift und eine deutsche Ableitung der gotischen Schrift, die Künstler der Renaissance gebraucht hatten und die auch für die Bibliothek des Kaisers Maximilian I. und verschiedene religiöse Publikationen verwendet wurde. Sie war zwischen der Mitte des 15. Jahrhunderts und dem Beginn des 20. Jahrhunderts gebräuchlich. Der Ausdruck „Frakturschrift“ leitet sich aus dem Lateinischen ab und bedeutet gebrochene Schrift, weil die Verziehrungen der Buchstaben den Wortfluss unterbrechen. Außer in Deutschland wurde Frakturschrift auch in anderen Ländern Mittel- und Nordeuropas verwendet: Dänemark, Schweden, Slowakei, Tschechien und Lettland. Andere Sprachen wie etwa Italienisch, Französisch und Spanisch verwendeten ebenfalls Fraktur-verwandte Ableitungen der gotischen Schrift.

Beispielsatz für Frakturschrift:

Preise und Verfügbarkeit
Das FineReader Modul für Fraktur wird als Add-On Modul für FineReader Corporate Edition, FineReader Scripting Edition oder FineReader Engine angeboten. Das Modul kann nach Terminabsprache in der α-Version vorgeführt werden und wird in der zweiten Jahreshälfte 2003 zum Kauf angeboten. Der Preis ist Projekt-abhängig.


ABBYY Europe GmbH

ABBYY Europe ist ein Mitglied der ABBYY Gruppe und veröffentlicht und vertreibt ABBYY-Produkte in Westeuropa. ABBYY Software House ist ein führender Entwickler von Technologien für Dokumenterkennung und Linguistik. Das Unternehmen ist auf die Entwicklung von Software für die optische Zeichenerkennung (OCR), Handschrifterkennung (ICR), Linguistik, Semantik und elektronische Lexikografie spezialisiert. Führende Produkte von ABBYY sind die OCR-, ICR- und OMR-Programme der FineReader-Produktlinie sowie die FineReader-Entwicklungstools. Zu den Lizenznehmern der OCR/ICR-Technologien von ABBYY zählen Siemens Nixdorf, Samsung Electronics, C-Technologies, Sumitomo Electric Systems, Arkenstone, Banctec, Acer, Hewlett-Packard, Microtek, Legato Systems, Grantsmart, Lexmark, Mustek, UMAX, NewSoft, Primax and Cardiff.

Weitere Informationen über ABBYY finden sich im Web unter www.abbyy.com.

 

Weitere Informationen

ABBYY Europe GmbH
Paula Fujimoto
Anglerstraße 6
D - 80339 München
Tel.: 089/511 159-55
Fax: 089/511 159-59
Web: www.abbyy.com

Pressekontakt
AxiCom GmbH
Detlev Henning
Junkersstraße 1
D - 82178 Puchheim
Tel.: 089/800908-14
Fax: 089/800908-10
E-Mail: detlev.henning@axicom.de 

Connect with us