
Retrieval Augmented Generation
Gewinnen Sie aussagekräftigere und relevantere Einblicke, indem Sie Ihr LLM auf eine breitere Wissensbasis stützen.
Effektivieren Sie die KI-Automatisierung mit zuverlässiger, präziser OCR-Technologie
Steigern Sie die Straight-Through-Dokumentenverarbeitung mithilfe datenbasierter Erkenntnisse
Integrieren Sie zuverlässige Document AI mit nur wenigen Zeilen Code in Ihre Automatisierungsworkflows
PROZESSVERSTÄNDNIS
PROZESSOPTIMIERUNG
Purpose-Built-AI für grenzenlose Automatisierung.
Starten Sie Ihre Automatisierung mit vorgefertigten KI-Extraktionsmodellen.
Lernen Sie die Mitwirkenden kennen, erkunden Sie Assets und vieles mehr.
Nach Industrie
Nach Geschäftsprozess
Nach Technologie
AUFBAUEN
Integrieren Sie erweiterte Texterkennungsfunktionen über die API in Ihre Anwendungen und in Ihre Workflows.
KI-fähige Dokumentendaten für kontextbezogene GenAI-Ausgabe mittels RAG.
LERNEN
Tauschen Sie sich mit Gleichgesinnten sowie mit erfahrenen OCR-, IDP- und KI-Experten aus.
Ein angesehener Titel, der an Entwickler verliehen wird, die außergewöhnliche Fachkenntnisse im Bereich ABBYY AI vorweisen können.
Entdecken
Einblicke
Implementierung
Education | Education/Research | Text to Speech | PDF and Document Conversion

Den meisten Anwendern ist ABBYY FineReader als nützlicher Helfer im Büroalltag bekannt, der aus Papierdokumenten und PDFs editierbare Dateien erstellt. Einen eher ungewöhnlichen Einsatz findet das Produkt hingegen im Studienzentrum für Sehgeschädigte der Universität Karlsruhe (TH), wo es seinen Beitrag zum barrierefreien Studium leistet.
Das Studienzentrum für Sehgeschädigte (SZS) ist eine wissenschaftliche Einrichtung der Universität Karlsruhe für sehgeschädigte Studenten. Die Philosophie des SZS zielt darauf, blinde und sehbehinderte Studierende dort zu unterstützen, wo sie Einschränkungen erfahren. Da an Universitäten der Gebrauch von Büchern und Skripten üblich ist, gehört es ebenfalls zu den Aufgaben des SZS, sehgeschädigten Studenten Zugang zu diesen Unterlagen zu ermöglichen, indem die Inhalte in Brailleschrift übersetzt oder für die Anzeige auf Bildschirmen aufbereitet werden.
Hierbei kommt ABBYY FineReader eine wichtige Rolle zu. Mit dieser OCR-Software (Optical Character Recognition, deutsch: Optische Zeichenerkennung) können gescannte Papierdokumente, PDF-Dateien oder Digitalfotos von Dokumenten in editierbare und durchsuchbare Daten umgewandelt werden. Das Programm beginnt den Erkennungsprozess mit der Strukturanalyse des Dokuments. Es unterteilt jede Seite in einzelne Elemente – in Textblöcke, Tabellen und Grafiken. Dann ermittelt es Zeilen, einzelne Wörter und Buchstaben. Jedes „Abbild eines Buchstabens“ wird mit zahlreichen vorhandenen Mustern verglichen und das Programm berechnet, um welchen Buchstaben es sich mit höchster Wahrscheinlichkeit handelt. Unter Verwendung integrierter Wörterbücher werden anschließend die einzelnen Buchstaben zu Wörtern verbunden. Auf diese Weise setzt FineReader das gesamte Dokument zusammen und baut es in der Ausgabedatei nach. So werden aus einem „Abbild von Buchstaben“ echte Buchstaben und Wörter in einer elektronischen Datei, die anschließend weiter bearbeitet oder auch archiviert werden kann.
Eine Besonderheit stellen hierbei Bilder und Grafiken dar. Da sie von FineReader als Bilddaten in den Textfluss eingebunden werden, müssen sie zusätzlich in Textform beschrieben werden,damit sie auch für blinde Studenten aussagekräftig sind. Diese Aufgabe übernehmen studentische Hilfskräfte, die in einem Arbeitsschritt die Beschreibung der Bilder und auch die Korrektur unsicher erkannter Zeichen erledigen.
Im Rahmen dieser Arbeit werden gegebenenfalls auch mathematische Formeln in den Text eingebunden. Die Darstellung mathematischer Symbole am Computer erfolgt in der Regel grafisch und ist für Blinde nicht lesbar. Um mathematische Symbole zugänglich zu machen, werden sie in eine Zeichendarstellung umgewandelt. Die verfügbaren Zeichen sind dabei auf den auf Computern verfügbaren ASCII-Zeichensatz beschränkt. Damit können die erstellten Texte mit jedem einfachen Editor gelesen und verändert werden, unabhängig vom verwendeten System. Für diese sogenannte Serialisierung – zweidimensionale Abbildungen von Formeln (Brüchen, Integralen etc.) werden in eindimensionale, serielle Version zur Ausgabe per Braillezeile und zur Sprachausgabe umgewandelt – nutzt das SZS verschiedene Notationen wie AMS, LaTeX sowie LAMBDA.
Derzeit kommt ABBYY FineReader 7.0 Professional zum Einsatz, demnächst ist ein Upgrade der Software auf Version 9.0 vorgesehen. Dank der neuen, einzigartigen Adaptive Document Recognition Technology (ADRT™) versteht die neueste Programmversion die logische Struktur eines mehrseitigen Dokuments und liefert neben erstklassigen Erkennungsergebnissen auch Formatierungselemente wie Kopf- und Fußzeilen, Fußnoten und Seitennummerierung. Dies ist vor allem für Dokumente im wissenschaftlichen und universitären Umfeld interessant: „Gerade die Erkennung von Strukturelementen wie Fußnoten und Kapitelmarkierungen ist für unseren Einsatz sehr sinnvoll“, freut sich Michael Zacherle. Somit wird ABBYY FineReader auch in Zukunft seinen Beitrag zum barrierefreien Studium leisten