Künstliche Intelligenz von ABBYY
Purpose-Built-AI Center
Ihre zentrale Anlaufstelle um Einblicke in die hochmodernen KI-Tools von ABBYY zu erhalten – Bereitstellung präziser Daten für die Automatisierung von Geschäftsprozessen.

Im Mittelpunkt der Lösungen von ABBYY steht eine Kombination von Technologien, die eine erstklassige intelligente Dokumentenverarbeitung (IDP) ermöglichen.
Innovative KI ist in der ABBYY IDP-Plattform in alle Schritte der intelligenten Dokumentenverarbeitung integriert, von der Bildverbesserung über die Objekterkennung, OCR/ICR, die Klassifizierung und die Extraktion aus halbstrukturierten Dokumenten bis hin zur Extraktion aus unstrukturierten Dokumenten.
Mit der richtigen Kombination von Technologien und Techniken können die IDP-Lösungen von ABBYY jede Art von Dokument verarbeiten – jedes Format, jede Sprache, jede Struktur. Alle unsere spezialisierten Techniken wurden für bestmögliche Schlussfolgerungen bei einer möglichst geringen Menge an benötigten Ressourcen optimiert, um Kosten zu optimieren und den größtmöglichen ROI für unsere Kunden zu erzielen.

Hochmoderne KI-Tools als Grundlage für maßgeschneiderte Lösungen von ABBYY
Eine Kombination aus hochgradig optimierten KI-Modellen und -Algorithmen für die jeweilige Aufgabe.
Phoenix 1.0
Phoenix 1.0 ist ein hochmodernes multimodales Modell, das erweiterte Bild- und Textanalyse kombiniert, indem es Convolutional Neural Networks (CNNs) zur visuellen Datenverarbeitung in das auf Textverständnis trainierte RoBERTa-Sprachmodell integriert. Phoenix verfügt über eine innovative KI-gesteuerte Pipeline, die Zero-Shot-Extraktionsfunktionen für Schlüssel-/Wertpaare bietet und damit eine Automatisierung des oft mühsamen Dokumentmodelltrainings ermöglicht. Im Gegensatz zu allgemeiner angelegten Sprachmodellen, die ein breites Spektrum von Sprachverständnisaufgaben abdecken, stellt Phoenix ein robusteres Framework für die Dokumentenverarbeitung zur Verfügung, insbesondere beim Umgang mit multimodalen Daten. Es bietet erweiterte Funktionen zur Merkmalsextraktion, Effizienz bei der Verarbeitung von Arbeitsabläufen und ein tieferes Kontextverständnis, das mit umfassenden Sprachmodellen allein wahrscheinlich nicht vollständig erreicht wird. Diese Spezialisierung macht es zur idealen Wahl für Anwendungsfälle, die stark auf Informationen angewiesen sind, die über Dokumente übertragen werden. Zugleich gewährleistet sie eine präzise Datenverarbeitung mit schnellen Durchlaufzeiten.
Phoenix wurde entwickelt, um die Effizienz und Effektivität von Dokumentenverarbeitungsaufgaben zu steigern. Durch Nutzung der Stärken von Convolutional Neural Networks für die Bildanalyse zusammen mit dem erweiterten Sprachverständnis von RoBERTa ermöglicht diese Integration ein differenziertes Verständnis komplexer Dokumente, die sowohl Text- als auch visuelle Elemente enthalten. Mithilfe des fokussierten Ansatzes können Unternehmen eine höhere Genauigkeit bei der Extraktion und Analyse von Informationen erreichen als bei der Verwendung von Allzweckmodellen. Darüber hinaus minimiert das Design den Ressourcenverbrauch, indem der Verarbeitungsablauf, rationalisiert wird, was die Verarbeitungsgeschwindigkeit steigert und die Betriebskosten senkt. Dadurch können Unternehmen Dokumente effektiver verarbeiten, einen erheblichen Mehrwert erzielen und ihre Gesamtproduktivität steigern.
Loading component...
OCR & ICR – optische Zeichenerkennung und Handschrifterkennung
ABBYY ist ein Pionier auf dem Gebiet der optischen Zeichenerkennung und forscht und entwickelt in diesem Bereich seit 1993, als unser erstes Omnifont-OCR-System ABBYY FineReader auf den Markt kam. Im Laufe der Jahre hat sich die Technologie von der Erkennung einzelner Zeichen, der Identifizierung von Wörtern und der Reproduktion der Seitenstruktur hin zur Anwendung der adaptiven Dokumentenerkennungstechnologie (ADRT®) entwickelt, die Dokumente in ihrer Gesamtheit versteht, einschließlich Layout, mehrseitiger Struktur und Elementen wie Kopf- und Fußzeile sowie Inhaltsverzeichnis.
Mit dem Fortschritt auf dem Gebiet der künstlichen Intelligenz hat ABBYY in den letzten Jahren seinen End-to-End-Ansatz für OCR und ICR entwickelt und gefestigt. Bei diesem Ansatz kommen dieselben Technologien zum Einsatz, die auch die Grundlage für generative KI-Tools bilden – Convolutional Neural Networks, Transformatoren und Sprachmodelle.
Das Convolutional Neural Network zerlegt ein Bild von handgeschriebenem oder gedrucktem Text auf einem Dokument in seine Bits und Bytes und versucht zu verstehen, was es eigentlich ist. Der gesamte Input des CNN geht dann in einen Transformator, um ein mögliches Ergebnis eines Wortes zu liefern. Dann ziehen wir unser eigenes LM heran, das auf Milliarden von Parametern trainiert ist und die spezielle Funktion hat, den Kontext aller verschiedenen Wörter in einer Gruppe zu berücksichtigen und diese Informationen bestmöglich zu nutzen, um zu einer Schlussfolgerung zu gelangen. Diese Technik verbessert die Leistung und Genauigkeit unserer OCR- und ICR-Funktionen insgesamt drastisch und wird in Kombination mit unserem statistischen Ansatz eingesetzt. Unsere KI entscheidet automatisch, welcher Ansatz für Ihre Dokumente am besten geeignet ist, um die Konsistenz, Genauigkeit und Geschwindigkeit zu optimieren und bessere Verarbeitungsraten zu erzielen.



















