ABBYY FineReader Engine
Das umfassendste OCR SDK für Softwareentwickler
Integrieren Sie KI-basierte OCR-Funktionen in Ihre Applikationen.
Automatische Dokumentanalyse
Der automatisierte Schritt der Dokumentenanalyse ist ein entscheidender Teil des gesamten Erkennungsprozesses. Um diesen Schritt mit möglichst hoher Präzision durchzuführen, arbeitet ABBYY FineReader Engine mit einer Vielzahl ausgereifter Algorithmen auf der Grundlage von KI-Methoden. Während der Dokumentenanalyse wird die logische Struktur des Dokuments analysiert – die erste und letzte Dokumentenseite werden identifiziert, Formatierungselemente wie Fußnoten, Kopfzeilen, Fußzeilen und Inhaltsverzeichnis werden erkannt. Gleichzeitig wird das Layout jeder einzelnen Seite analysiert und jede Seite wird in einzelne Objekte wie Textblöcke, Bilder, Tabellen und Tabellenzellen, Barcodes und Trennelemente unterteilt. Zusätzlich erkennen die Analysealgorithmen die Seitenausrichtung, identifizieren Doppelseiten und vertikalen Text und definieren Seitenbereiche, die für den OCR-Prozess nicht relevant sind. Auf diese Weise kann ABBYY FineReader Engine Textbereiche und Felder definieren, die erkannt werden sollten, und Seitenbereiche wie Bilder oder Diagramme, die in ihrer ursprünglichen Form beibehalten werden. Gleichzeitig gehen Informationen über die logische Struktur des Dokuments ein, einschließlich der Formatierung. Diese werden am Ende des OCR-Prozesses verwendet, wenn das Dokument exakt rekonstruiert wird.
Manuelle Blockdefinition für Field Level Erkennung
Die Texterkennungsbereiche können manuell festgelegt werden. In diesem Fall wird das relevante Erkennungsfeld direkt definiert und die automatisierte Dokumentenanalyse ist überflüssig. Im späteren Erkennungsschritt erhält der Erkennungsalgorithmus Informationen über die Koordinaten und Eigenschaften der gewünschten Felder und wendet den OCR-Prozess nur auf den festgelegten Bereich an.