ABBYY FineReader Engine

Les technologies de reconnaissance complètes d'ABBYY FineReader Engine

Intégrez des fonctionnalités OCR reposant sur l’IA à vos applications.

Reconnaissance

Une gamme complète de technologies de reconnaissance

Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.

La reconnaissance de texte imprimé est disponible en plus de 200 langues :

Langues européennes (alphabets latin, cyrillique, arménien, grec)
Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire

La reconnaissance de texte manuscrit est disponible en plus de 120 langues :

Langues européennes et non européennes
22 types régionaux d’écriture manuelle
Reconnaissance de caractères manuscrits dans des champs et cadres
ICR pour les chiffres indiens utilisés dans les pays arabes

La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.

Codes-barres 1D et 2D

Extraction rapide de codes-barres. Cette fonction permet la recherche automatique et la reconnaissance de codes-barres quel que soit l’angle du document.

Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.

Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.

Reconnaissance plein-texte et reconnaissance par champ

En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.

Le tableau suivant montre les différences :

Specification	Full text recognition	Field-level recognition
Used for:	Document conversion, books archiving	Data capture / Data extraction
Document analysis:	General document analysis, document analysis for invoices, document analysis for full-text indexing	Manual blocks specification for field-level recognition
Recognition technologies:	OCR with up to 99% accuracy	OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate
Verification:	Recommended (for content reuse)	Obligatory (as accuracy is a critical issue in most cases)
Synthesis:	Used for document reconstruction	Not used
Export format:	Document files (RTF, DOC, PDF, etc.)	Export to XML file or database

La reconnaissance plein texte est le type de reconnaissance de base pour différentes tâches, comme :

la conversion de livres et de documents pour l’archivage
la conversion de documents pour la réutilisation de contenu
l’extraction de texte brut pour la détection de champs et la classification de documents

Toutes ces tâches requièrent la reconnaissance (OCR) de l’intégralité du texte. Le texte qui en résulte est exporté, en fonction de la tâche, sous forme uniquement de texte ou dans un document au format pris en charge.

Pour aider à l’exécution de tâches commerciales clés telles que le traitement de formulaires, la classification par mots-clés la vision industrielle ou l’automatisation robotisée, ABBYY FineReader Engine extrait le texte contenu dans des champs ou des zones. Parmi les fonctionnalités-clés, on compte l’OCR et l’ICR multilingues, l’OMR, la reconnaissance des codes-barres et toute une palette de fonctionnalités spécifiques telles que :

L’extraction de données à partir de champs ayant des cadres et des bords différents
La définition de contenu de champ en définissant les alphabets, les dictionnaires, les expressions régulières, les styles d’écriture, etc.
La détection de l’espacement dans les champs
Le traitement intelligent des blocs avec recoupement des parties et des lignes
Le nettoyage de blocs de texte permet de définir la taille des « traces » blanches ou noires
La reconnaissance par champ est aussi prise en charge par des outils spécialement conçus pour les développeurs comme la Voting API et l’outil d'ajustement de la reconnaissance «à la volée».

Pour améliorer la qualité de la reconnaissance, ABBYY FineReader Engine fournit une API pour paramétrer et modifier la reconnaissance des langues, affiner la reconnaissance prédéfinie des langues et ajouter de nouveaux mots aux langues de l’utilisateur. Exemples:

Pour améliorer la qualité de la reconnaissance ICR sur des formulaires, vous pouvez utiliser les langues de l’utilisateur pour décrire le type d’informations qui peut être entré dans chaque champ (code postal, codes produits, numéros).
Pour améliorer la reconnaissance des codes produits, numéros de téléphone ou de passeport, vous pouvez créer une nouvelle langue de reconnaissance, ce qui aidera le programme à lire ces données spécifiques.

Dans la grande majorité des cas, ABBYY FineReader Engine réussit à lire des textes sans apprentissage préalable. Cependant, lorsqu’il s’agit de reconnaître des polices décoratives ou en contours ou encore des documents dont l’impression est de mauvaise qualité, il est possible de former l’outil pour accroître la qualité de la reconnaissance.

Vantage 3.0

Retrieval-Augmented Generation (RAG)

Gartner® Magic Quadrant™ pour les solutions de traitement intelligent des documents

Qu’est-ce qu’ABBYY Marketplace ?

11 compétences documentaires pour le transport et la logistique

7 compétences documentaires pour les services financiers

Vantage 3.0

Retrieval-Augmented Generation (RAG)

Gartner® Magic Quadrant™ pour les solutions de traitement intelligent des documents

Qu’est-ce qu’ABBYY Marketplace ?

11 compétences documentaires pour le transport et la logistique

7 compétences documentaires pour les services financiers

Les technologies de reconnaissance complètes d'ABBYY FineReader Engine

Reconnaissance

Une gamme complète de technologies de reconnaissance

Reconnaissance optique de caractères (OCR)

Reconnaissance intelligente de caractères (ICR)

Reconnaissance de codes-barres (OBR)

Mode de reconnaissance précis

Mode de reconnaissance «Rapide»

Reconnaissance plein-texte et reconnaissance par champ

Reconnaissance plein-texte

Reconnaissance par champ

Langues utilisateur

Formation de modèle

Prêt à parler à un expert ?

Vantage 3.0

Retrieval-Augmented Generation (RAG)

Gartner® Magic Quadrant™ pour les solutions de traitement intelligent des documents

Qu’est-ce qu’ABBYY Marketplace ?

11 compétences documentaires pour le transport et la logistique

7 compétences documentaires pour les services financiers

Vantage 3.0

Retrieval-Augmented Generation (RAG)

Gartner® Magic Quadrant™ pour les solutions de traitement intelligent des documents

Qu’est-ce qu’ABBYY Marketplace ?

11 compétences documentaires pour le transport et la logistique

7 compétences documentaires pour les services financiers

Les technologies de reconnaissance complètes d'ABBYY FineReader Engine

Reconnaissance

Une gamme complète de technologies de reconnaissance

Reconnaissance optique de caractères (OCR)

Reconnaissance intelligente de caractères (ICR)

Reconnaissance de codes-barres (OBR)

Mode de reconnaissance précis

Mode de reconnaissance «Rapide»

Reconnaissance plein-texte et reconnaissance par champ

Reconnaissance plein-texte

Reconnaissance par champ

Langues utilisateur

Formation de modèle

Prêt à parler à un expert ?

Prêt à parler à un expert ?