ABBYY bringt OCR-SDK für Linux auf den Markt

16. September 2003

Entwickler, VARs und Integratoren haben jetzt Zugriff auf die verbreitete OCR-Engine für Programmierungen im Betriebssystem Linux

ABBYY Europe, ein Mitglied der ABBYY Gruppe und führender Hersteller von Dokumenten-Erkennung und linguistischen Technologien, hat heute bekannt gegeben, dass ihre Plattform zur optischen Zeichenerkennung (OCR) für die Linux-Gemeinde verfügbar ist. ABBYY FineReader Engine 6.0 for Linux liegt jetzt in der Beta-Version vor und ist ein vollständiges Software Development Kit (SDK) zur Integration der ABBYY OCR-Technologien in Linux-Anwendungen.

Mit FineReader Engine 6.0 for Linux hat ABBYY erstmals ein Produkt speziell für die Linux-Gemeinde entwickelt. Diese Version wurde unter Berücksichtigung der speziellen Funktionalität und einzigartigen Charakteristik der Linux-Plattform erarbeitet und bietet den Zugriff auf eine fortschrittliche OCR-Technologie, die für überragende Genauigkeit und Layout-Übernahme auf dem Markt bekannt ist. VARs, Systemintegratoren und Entwickler, die verschiedenste Applikationen für das Dokumenten-Management in der Linux-basierten Entwicklungsumgebung erstellen wollen, können jetzt einfach die Vorteile einer Technologie nutzen, die bereits von zahlreichen Firmen wie Cardiff, Kofax, Panasonic, Saperion und ZyLab eingesetzt wird.

FineReader Engine 6.0 for Linux bietet jetzt auf der Linux-Plattform höhere Genauigkeit und umfassendere OCR-Funktionalität als je zuvor (bestätigt durch interne Tests). Hardware- und Software-Entwickler, VARs und Systemintegratoren können damit die fortschrittlichen Erkennungstechnologien von ABBYY in Lösungen für Content-Management, Datenerfassung und Archivierung, die für Linux programmiert wurden, integrieren.

Die FineReader Engine eignet sich für Anwendungen zur Bild- oder Dokumentenverarbeitung, für die eine genaue und flexible OCR-Funktionalität erforderlich ist. Für folgende Applikationen ist FineReader Engine ideal geeignet:

Archivierungs- und Dokumentenverarbeitungslösungen, die einen schnellen und flexiblen Zugriff auf OCR-Funktionen benötigen
Kontrollsysteme für die Prüfung von Bank-Schecks, Ausweisen, Tickets, Kreditkarten, Führerscheinen, registrierten Fahrzeugnummern etc.
Applikationen zur Umwandlung von Dokumenten in die Ausgabeformate PDF, HTML und RTF, bei denen das Seiten-Layout vollständig übernommen wird
Faxverarbeitungs-Anwendungen, die OCR für die Umwandlung von Faxen in editierbaren Text nutzen
Applikationen für die Erstellung und das Management von Inhalten, wie Web-Publishing-Systeme, Applikationen für Intranet-Archivierung sowie Lösungen für Media-Clippings

Technologische Vorteile

Durch ABBYYs IPA-Technologie und die Multilevel Dokument Analyse ( www.abbyy.com/ipa ) liefert FineReader eine unübertroffene Erfassungsgenauigkeit. FineReader liefert zudem eine höhere Genauigkeit bei mehrsprachigen Dokumenten als jede andere OCR-Software*.

ABBYY FineReader ist eine innovative Technologie, die sich wesentlich von ihren Vorgängern unterscheidet. Im Unterschied zu diesen erkennt die neue FineReader-Technologie nicht nur den Text sondern erfasst die Dokumente als Ganzes. Ziel ist es, Dokumente zu liefern, die das Papier-Original widerspiegeln – und analysiert dazu nicht nur Text, sondern auch Formatierungen wie Bildposition, Schriftgröße und –abstand, Spaltenposition und Text-Ausrichtung.

Funktionalität der ABBYY FineReader Engine 6.0

ABBYY FineReader Engine for Linux bietet die gleiche Erkennungsgenauigkeit und Dokumentenanalyse und das gleiche Leistungsspektrum an OCR-Funktionen wie die Windows-Version der ABBYY FineReader Engine.

Anwender der FineReader Engine for Linux profitieren von den folgenden Funktionen, die Bestandteil der OCR-Kern-Technologie von ABBYY sind:

1. Erkennung:

Unübertroffene Erkennungsqualität:
Aufgrund der IPA-Technologie und der Multilevel Dokument Analyse (MDA) erhielt die FineReader seit 1998 mehr als 100 Auszeichnungen in unabhängigen Vergleichstests bedeutender, international einflussreicher IT-Zeitschriften.
Erweiterte Sprachunterstützung mehrsprachiger Dokumente:
Die FineReader-Technologie erkennt Dokumente in 177 Sprachen und bietet fast die gleiche Qualität der Erkennung mehrsprachiger wie einsprachiger Dokumente*. Dies ist ein erheblicher Leistungsvorteil für Entwickler von Produkten für globale Märkte. FineReader erkennt mehr Sprachen als jedes andere OCR-System. Für 34 Sprachen werden Wörterbücher mit morphologischer Unterstützung geboten.
Die Technologien der Intelligenten Hintergrundfilterung und Adaptiven Binarisierung/ Intelligent Thresholding für OCR (Maschinenschrift-Erkennung):
Verwendung von individuellen Erkennungsparametern für jeden Bildteil, was die Genauigkeit in schwer lesbaren Dokumenten wie Zeitungen, farbigen Dokumenten, Faxen und Kopien erhöht. Sie enthalten Filter für das Ausblenden von Hintergrund-Rauschen.
Module für Punkt-Matrix-Erkennung
Das Modul erkennt Punktmatrix-Text aller Art. Es wurde anhand mehrerer Tausend Beispiele getestet, die aus verschiedensten Druckern wie Punktmatrix-, Typenrad-, Ketten- und Banddruckern in Entwurfs- und Near- Letter-Quality (NLQ) stammten.
OCR-A, OCR-B und MICR (E13B)-Schriftunterstützung
Diese Funktion erkennt Zeichen, die häufig von Banken, Kreditkarten-Unternehmen und anderen Finanzinstitutionen verwendet werden.
Erkennung im „Schnell-Modus“
Dieser Modus wurde für Applikationen entwickelt, die mit großen Dokumentmengen arbeiten, bei denen Geschwindigkeit wichtiger ist als Genauigkeit. Er steigert die Verarbeitungsgeschwindigkeit drastisch und eignet sich deshalb besonders für Dokumenten-Management- und Archivierungssysteme.
Erkennung von vertikalem Text in Tabellen
Erkennung von Schreibmaschinen-Dokumenten

2. Dokumentenanalyse:

Genaue Analyse von Dokumenten und vollständiger Layout-Übernahme
Die MDA und IPA-Technologie ermöglichen FineReader, das Erscheinungsbild gedruckter Dokumente präzise wieder zu geben. Das beinhaltet Dokumente mit Fließtext, Spalten, Tabellen, nicht rechteckige Bilder, wechselnde Schriften oder wechselnde Zeichenabstände.
Automatisches Erkennen der Seitenausrichtung (90, 180, 270 Grad)
Automatisches Erkennen von Textblöcken, Tabellen, Barcodes und Bildern. Manuelles Markieren von Blöcken wird ebenfalls unterstützt (Hinzufügen, Entfernen, Editieren von Blöcken)
Automatisches Erfassen von vertikalem Text in Tabellenzellen

3. Export und Synthese:

Exakter Erhalt der Layouts im RTF- und PDF-Format
Auf Basis der Multilevel Dokument Analyse und der IPA-Technologie bietet FineReader eine hervorragende Analyse der Dokumente, auf deren Grundlage die Formatierungen von Text im PDF- und RTF-Format vollständig erhalten bleiben. Die exportierten Dateien sehen wie die gedruckten originalen Dokumente aus, selbst Formatierungselemente von RTF, die nur bei der Linux Plattform vorkommen, werden beibehalten.
Verschiedene Ebenen der Textformat-Erhaltung (von einfachem Text ohne Formatierungen bis zum vollständigen Erhalt des Seiten-Layouts inklusive Spalten, Tabellen, Rahmen, Schriften, Schriftgrößen, Absatzformaten, Rändern etc.)
Vollständige Übernahme der Bild- und Textfarben
Speichern nicht rechteckiger Abbildungen
Übernahme von Aufzählungszeichen und Nummerierungen
Export in PDF-Format
Die Funktion beinhaltet „Text und Bild“, „Text über dem Bild“, „Text unter dem Bild“ und „Nur Bild“ beim Speichern von PDF-Dateien.
Unterstützung von mehrsprachigen PDF-Dateien, wodurch die Notwendigkeit entfällt, zusätzliche Schriften zu installieren
Nicht eindeutig erkannte Zeichen können beim Speichern als PDF durch ein Bild von dem Zeichen ersetzt werden

4. Fortschrittliche Funktionalität:

Öffnen von Bildern aus Dateien und Arbeitsspeicher
Eine Reihe von Funktionen für die Bild-Vorverarbeitung
- Schief eingelegte Bilder automatisch ausrichten
- Korrektur der Schräglage aufgrund von Referenzblöcken
- Rotation (90, 180, 270 Grad) und Spiegelung von Bildern
- Invertierung von Bildern
- Säubern von Bildern
- Berechnen und Ausschneiden von Bildern
- Teilung von Doppelseiten
- Ändern der Textfarbe oder des Hintergrunds in Rechtecken
Vollständiger Zugriff auf erkannten Text mit der detaillierten Information über Formatierung und Positionierung der Zeichen
Ein Funktionsset für die Nachbearbeitung und das Nach-Formatieren von erkanntem Text vor dem Export

Die FineReader OCR-Funktionen sind über ein Application Programming Interface (API) verfügbar. Zusätzlich hat ABBYY auch ein Command Line Interface entwickelt, mit dem Programmierer eine Vielzahl von Funktionen der FineReader Engine steuern können, was ja in der Linux-Gemeinde eine bevorzugte Programmiermethode ist. Das API für FineReader Engine 6.0 for Linux ist identisch mit der API von FineReader Engine 6.0 für Windows. Das erleichtert Entwicklern, die mit Anwendungen für mehrere Plattformen arbeiten, das Programmieren, weil sie das gleiche API auf verschiedenen Plattformen benutzten können.

Demoversion

ABBYY bietet ihren Kunden eine kostenlose, zeitlich begrenzte aber voll funktionsfähige Demoversion von ABBYY FineReader Engine 6.0 for Linux an, so dass sie die Software unter echten Bedingungen testen können. Um eine Testversion zu bekommen, wenden Sie sich bitte an die zuständige Niederlassung von ABBYY.

Preise und Verfügbarkeit

ABBYY FineReader Engine 6.0 for Linux ist ab sofort in der Beta-Version für Tests verfügbar. ABBYY bietet flexible Preisoptionen, die Entwicklern ermöglichen, die für ihre Produkt- und Vertriebsstrategie geeignetste Lizenzierungsart zu wählen. Weitere Informationen finden sich auf der Internet-Seite von ABBYY unter http://www.abbyy.com .

ABBYY Europe GmbH

ABBYY Europe ist ein Mitglied der ABBYY Gruppe und veröffentlicht und vertreibt ABBYY-Produkte in Westeuropa. ABBYY Software House ist ein führender Entwickler von Technologien für Dokumenterkennung und Linguistik. Das Unternehmen ist auf die Entwicklung von Software für die optische Zeichenerkennung (OCR), Handschrifterkennung (ICR), Linguistik, Semantik und elektronische Lexikografie spezialisiert. Führende Produkte von ABBYY sind die OCR-, ICR- und OMR-Programme der FineReader-Produktlinie sowie die FineReader-Entwicklungstools. Zu den Lizenznehmern der OCR/ICR-Technologien von ABBYY zählen Siemens Nixdorf, Samsung Electronics, C-Technologies, Sumitomo Electric Systems, Arkenstone, Banctec, Acer, Hewlett-Packard, Microtek, Legato Systems, Grantsmart, Lexmark, Mustek, UMAX, NewSoft, Primax and Cardiff.

Weitere Informationen über ABBYY finden sich im Web unter www.abbyy.com.

Weitere Informationen

ABBYY Europe GmbH
Paula Fujimoto
Anglerstraße 6
D - 80339 München
Tel.: 089/511 159-55
Fax: 089/511 159-59
Web: www.abbyy.com

Pressekontakt
AxiCom GmbH
Detlev Henning
Junkersstraße 1
D - 82178 Puchheim
Tel.: 089/800908-14
Fax: 089/800908-10
E-Mail: detlev.henning@axicom.de

Vernetzen Sie sich mit uns