ABBYY FineReader Engine

Das umfassendste OCR SDK für Softwareentwickler

Integrieren Sie KI-basierte OCR-Funktionen in Ihre Applikationen.

Bildimport und Scannen von Dokumenten

Für eine möglichst große Flexibilität beim Input kann ABBYY FineReader Engine Bilder aus vielen verschiedenen Quellen verwenden.

Das Scannen per TWAIN- oder WIA-Schnittstelle ist ein üblicher Weg, um Papierdokumente direkt zu konvertieren – immer häufiger werden Dokumente aber auch einfach mit dem Smartphone oder Tablet abfotografiert, vor allem in Unternehmen, deren Mitarbeiter häufig außer Haus im Einsatz sind.

Bereits gespeicherte Bilder wie digitale Archive im TIFF- oder JPEG-Format können sehr einfach importiert werden. Selbst Fotos von Industriekameras, wie sie bei Machine-Vision-Projekten zur Testautomatisierung verwendet werden, können importiert und anschließend verarbeitet werden. In Branchen mit hohen Sicherheitsstandards können Dateien direkt aus dem Speicher geladen werden, ohne dass sie vorher auf einer Festplatte gespeichert werden müssen. Neben Dokumentbildern wie Scans, Fotos oder Screenshots kann ABBYY FineReader Engine auch in Office-Formaten vorliegende Dokumente empfangen und verarbeiten, beispielsweise Word, Excel oder PowerPoint sowie verschiedene PDF-Arten.


Document Scanning APIs

Mit seinen leistungsstarken Scan-Optionen ermöglicht ABBYY FineReader Engine ein flexibles Management des Scan-Prozesses und bietet Zugriff auf individuelle Scan-Parameter wie Helligkeit, Farbeinstellungen, Auflösung, Bildgröße, Duplex-Scan, Pause zwischen den Seiten und vieles mehr.

Funktionen der Scan-API:

  • Erweiterter Zugang zu den Scanner-Einstellungen, einschließlich Zugang zu den Quelloptionen
  • Filtern von Quellen durch die verfügbaren Benutzerschnittstellen oder Scan-API-Typen (TWAIN, WIA)
  • Festlegung von Komprimierungsarten für gescannte Bilder möglich
  • Asynchrone Scan-Funktionen ermöglichen die Erkennung bereits gescannter Seiten, bevor der Scanprozess des gesamten Dokuments abgeschlossen ist

Bildimport

Das OCR SDK unterstützt die meisten gängigen Bildformate, darunter Multipage TIFF und JPEG 2000 (Part1), und arbeitet mit Bildern in Schwarz-Weiß, Graustufen und Farbe. Es öffnet digital erstellte PDF-Dateien mit Hilfe der Adobe® PDF Library und verarbeitet verschiedene Arten von PDF-Dokumenten, selbst wenn sie nicht den PDF-Standards entsprechen.
Formate der Bilddateien
BMP, DCX, DjVu, JBIG2, JPEG, JPEG 2000, PNG, PDF, TIFF, PCX, GIF, multi-page TIFF
Formate der Bilddateien aus dem Speicher
  • Raw
  • Bitmap (HBITMAP)
  • DIB
Zusätzliche Funktionen für PDF-Import
  • Extrahieren der Textebene aus PDFs
  • Eingabe von Nur-Bild-PDFs und vektorisierten PDFs
  • Passwort geschützte PDF
  • Extraktion von Daten wie XML aus PDF/A-3-Dateien möglich
  • Möglichkeit, die ursprünglichen PDF-Eigenschaften wie Lesezeichen zu erhalten

Möchten Sie mit unserem Expertenteam sprechen?