ABBYY FineReader Engine
Das umfassendste OCR SDK für Softwareentwickler
Bildimport und Scannen von Dokumenten
Das Scannen per TWAIN- oder WIA-Schnittstelle ist ein üblicher Weg, um Papierdokumente direkt zu konvertieren – immer häufiger werden Dokumente aber auch einfach mit dem Smartphone oder Tablet abfotografiert, vor allem in Unternehmen, deren Mitarbeiter häufig außer Haus im Einsatz sind.
Bereits gespeicherte Bilder wie digitale Archive im TIFF- oder JPEG-Format können sehr einfach importiert werden. Selbst Fotos von Industriekameras, wie sie bei Machine-Vision-Projekten zur Testautomatisierung verwendet werden, können importiert und anschließend verarbeitet werden. In Branchen mit hohen Sicherheitsstandards können Dateien direkt aus dem Speicher geladen werden, ohne dass sie vorher auf einer Festplatte gespeichert werden müssen. Neben Dokumentbildern wie Scans, Fotos oder Screenshots kann ABBYY FineReader Engine auch in Office-Formaten vorliegende Dokumente empfangen und verarbeiten, beispielsweise Word, Excel oder PowerPoint sowie verschiedene PDF-Arten.
Document Scanning APIs
Mit seinen leistungsstarken Scan-Optionen ermöglicht ABBYY FineReader Engine ein flexibles Management des Scan-Prozesses und bietet Zugriff auf individuelle Scan-Parameter wie Helligkeit, Farbeinstellungen, Auflösung, Bildgröße, Duplex-Scan, Pause zwischen den Seiten und vieles mehr.
Funktionen der Scan-API:
- Erweiterter Zugang zu den Scanner-Einstellungen, einschließlich Zugang zu den Quelloptionen
- Filtern von Quellen durch die verfügbaren Benutzerschnittstellen oder Scan-API-Typen (TWAIN, WIA)
- Festlegung von Komprimierungsarten für gescannte Bilder möglich
- Asynchrone Scan-Funktionen ermöglichen die Erkennung bereits gescannter Seiten, bevor der Scanprozess des gesamten Dokuments abgeschlossen ist
Bildimport
Formate der Bilddateien aus dem Speicher
- Raw
- Bitmap (HBITMAP)
- DIB
Zusätzliche Funktionen für PDF-Import
- Extrahieren der Textebene aus PDFs
- Eingabe von Nur-Bild-PDFs und vektorisierten PDFs
- Passwort geschützte PDF
- Extraktion von Daten wie XML aus PDF/A-3-Dateien möglich
- Möglichkeit, die ursprünglichen PDF-Eigenschaften wie Lesezeichen zu erhalten