ABBYY FineReader Engine
Les technologies de reconnaissance complètes d'ABBYY FineReader Engine
Reconnaissance
Une gamme complète de technologies de reconnaissance
Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.
Reconnaissance optique de caractères (OCR)
La reconnaissance de texte imprimé est disponible en plus de 200 langues :
-
Langues européennes (alphabets latin, cyrillique, arménien, grec)
-
Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
-
FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
-
Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire
Reconnaissance intelligente de caractères (ICR)
La reconnaissance de texte manuscrit est disponible en plus de 120 langues :
- Langues européennes et non européennes
- 22 types régionaux d’écriture manuelle
- Reconnaissance de caractères manuscrits dans des champs et cadres
- ICR pour les chiffres indiens utilisés dans les pays arabes
La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.
Reconnaissance de codes-barres (OBR)
- Codes-barres 1D et 2D
- Extraction rapide de codes-barres. Cette fonction permet la recherche automatique et la reconnaissance de codes-barres quel que soit l’angle du document.
Mode de reconnaissance précis
Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.
Mode de reconnaissance «Rapide»
Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.

Reconnaissance plein-texte et reconnaissance par champ
En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.
Le tableau suivant montre les différences :
Loading component...
Reconnaissance plein-texte
La reconnaissance plein texte est le type de reconnaissance de base pour différentes tâches, comme :
- la conversion de livres et de documents pour l’archivage
- la conversion de documents pour la réutilisation de contenu
- l’extraction de texte brut pour la détection de champs et la classification de documents
Toutes ces tâches requièrent la reconnaissance (OCR) de l’intégralité du texte. Le texte qui en résulte est exporté, en fonction de la tâche, sous forme uniquement de texte ou dans un document au format pris en charge.






