ABBYY FineReader Engine

Wie Bilder und Dokumente mit ABBYY FineReader Engine automatisch importiert und gescannt werden

Integrieren Sie KI-basierte OCR-Funktionen in Ihre Applikationen.

Bildimport und Scannen von Dokumenten

Für eine möglichst große Flexibilität beim Input kann ABBYY FineReader Engine Bilder aus vielen verschiedenen Quellen verwenden.

Das Scannen per TWAIN- oder WIA-Schnittstelle ist ein üblicher Weg, um Papierdokumente direkt zu konvertieren – immer häufiger werden Dokumente aber auch einfach mit dem Smartphone oder Tablet abfotografiert, vor allem in Unternehmen, deren Mitarbeiter häufig außer Haus im Einsatz sind.

Bereits gespeicherte Bilder wie digitale Archive im TIFF- oder JPEG-Format können sehr einfach importiert werden. Selbst Fotos von Industriekameras, wie sie bei Machine-Vision-Projekten zur Testautomatisierung verwendet werden, können importiert und anschließend verarbeitet werden. In Branchen mit hohen Sicherheitsstandards können Dateien direkt aus dem Speicher geladen werden, ohne dass sie vorher auf einer Festplatte gespeichert werden müssen. Neben Dokumentbildern wie Scans, Fotos oder Screenshots kann ABBYY FineReader Engine auch in Office-Formaten vorliegende Dokumente empfangen und verarbeiten, beispielsweise Word, Excel oder PowerPoint sowie verschiedene PDF-Arten.

Document Scanning APIs

Mit seinen leistungsstarken Scan-Optionen ermöglicht ABBYY FineReader Engine ein flexibles Management des Scan-Prozesses und bietet Zugriff auf individuelle Scan-Parameter wie Helligkeit, Farbeinstellungen, Auflösung, Bildgröße, Duplex-Scan, Pause zwischen den Seiten und vieles mehr.

Funktionen der Scan-API:

Erweiterter Zugang zu den Scanner-Einstellungen, einschließlich Zugang zu den Quelloptionen
Filtern von Quellen durch die verfügbaren Benutzerschnittstellen oder Scan-API-Typen (TWAIN, WIA)
Festlegung von Komprimierungsarten für gescannte Bilder möglich
Asynchrone Scan-Funktionen ermöglichen die Erkennung bereits gescannter Seiten, bevor der Scanprozess des gesamten Dokuments abgeschlossen ist

Bildimport

Das OCR SDK unterstützt die meisten gängigen Bildformate, darunter Multipage TIFF und JPEG 2000 (Part1), und arbeitet mit Bildern in Schwarz-Weiß, Graustufen und Farbe. Es öffnet digital erstellte PDF-Dateien mit Hilfe der Adobe® PDF Library und verarbeitet verschiedene Arten von PDF-Dokumenten, selbst wenn sie nicht den PDF-Standards entsprechen.

Formate der Bilddateien

BMP, DCX, DjVu, JBIG2, JPEG, JPEG 2000, PNG, PDF, TIFF, PCX, GIF, multi-page TIFF

Formate der Bilddateien aus dem Speicher

Raw
Bitmap (HBITMAP)
DIB

Zusätzliche Funktionen für PDF-Import

Extrahieren der Textebene aus PDFs
Eingabe von Nur-Bild-PDFs und vektorisierten PDFs
Passwort geschützte PDF
Extraktion von Daten wie XML aus PDF/A-3-Dateien möglich
Möglichkeit, die ursprünglichen PDF-Eigenschaften wie Lesezeichen zu erhalten

Loading component...