ABBYY FineReader Engine

Le SDK OCR le plus complet pour les développeurs de logiciels. 

Intégrez des fonctionnalités OCR reposant sur l’IA à vos applications. 

Reconnaissance

Une gamme complète de technologies de reconnaissance

Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.

Factoids 026 77X77

Reconnaissance optique de caractères (OCR)

La reconnaissance de texte imprimé est disponible en plus de 200 langues :

  • Langues européennes (alphabets latin, cyrillique, arménien, grec)
  • Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
  • FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
  • Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire
Factoids 024 77X77

Reconnaissance intelligente de caractères (ICR)

La reconnaissance de texte manuscrit est disponible en plus de 120 langues :

  • Langues européennes et non européennes
  • 22 types régionaux d’écriture manuelle
  • Reconnaissance de caractères manuscrits dans des champs et cadres
  • ICR pour les chiffres indiens utilisés dans les pays arabes

La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.
 

Factoids 017 77X77

Reconnaissance de codes-barres (OBR)

  • Codes-barres 1D et 2D
  • Extraction rapide de codes-barres. Cette fonction permet la recherche automatique et la reconnaissance de codes-barres quel que soit l’angle du document.

Modes de reconnaissance

En définissant un mode de reconnaissance, les développeurs peuvent rapidement configurer et régler la vitesse et la précision du traitement. En plus du mode de traitement par défaut, la reconnaissance OCR et la reconnaissance ICR peuvent être effectuées en mode normal, rapide ou équilibré :

Benefits 119B 77X77

Mode de reconnaissance précis

Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.

Benefits 102V 77X77

Mode de reconnaissance «Rapide»

Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.

Reconnaissance plein-texte et reconnaissance par champ

En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.

Le tableau suivant montre les différences :

Spécification Reconnaissance plein-texte Reconnaissance par champ
Utilisé pour : Conversion de documents, archivage de livres Acquisition / Extraction de données (data capture)
Analyse de documents : Analyse générale de documents, analyse de documents pour les factures, analyse de documents pour l’indexation plein texte Spécification de blocs manuel pour la reconnaissance par champ
Technologies de reconnaissance : OCR avec précision jusqu'à 99 % OCR, ICR, OMR, reconnaissance de codes-barres avec des types de données prédéfinis et des valeurs possibles. Précision de 99,99 %
Vérification : Recommandée (pour la réutilisation de contenu) Obligatoire (car la précision est un élément-clé dans la plupart des cas)
Synthèse : Utilisé pour la reconstruction du document Non utilisée
Format d'export : Fichiers de documents (RTF, DOC, PDF, etc.) Export vers un fichier XML ou une base de données
Reconnaissance plein-texte

La reconnaissance plein texte est le type de reconnaissance de base pour différentes tâches, comme :

  • la conversion de livres et de documents pour l’archivage
  • la conversion de documents pour la réutilisation de contenu
  • l’extraction de texte brut pour
    la détection de champs et la classification de documents

Toutes ces tâches requièrent la reconnaissance (OCR) de l’intégralité du texte. Le texte qui en résulte est exporté, en fonction de la tâche, sous forme uniquement de texte ou dans un document au format pris en charge.

Reconnaissance par champ

Pour aider à l’exécution de tâches commerciales clés telles que le traitement de formulaires, la classification par mots-clés la vision industrielle ou l’automatisation robotisée, ABBYY FineReader Engine extrait le texte contenu dans des champs ou des zones. Parmi les fonctionnalités-clés, on compte l’OCR et l’ICR multilingues, l’OMR, la reconnaissance des codes-barres et toute une palette de fonctionnalités spécifiques telles que :

  • L’extraction de données à partir de champs ayant des cadres et des bords différents
  • La définition de contenu de champ en définissant les alphabets, les dictionnaires, les expressions régulières, les styles d’écriture, etc.
  • La détection de l’espacement dans les champs
  • Le traitement intelligent des blocs avec recoupement des parties et des lignes
  • Le nettoyage de blocs de texte permet de définir la taille des « traces » blanches ou noires
  • La reconnaissance par champ est aussi prise en charge par des outils spécialement conçus pour les développeurs comme la Voting API et l’outil d'ajustement de la reconnaissance «à la volée».

Langues utilisateur

Pour améliorer la qualité de la reconnaissance, ABBYY FineReader Engine fournit une API pour paramétrer et modifier la reconnaissance des langues, affiner la reconnaissance prédéfinie des langues et ajouter de nouveaux mots aux langues de l’utilisateur. Exemples:

  • Pour améliorer la qualité de la reconnaissance ICR sur des formulaires, vous pouvez utiliser les langues de l’utilisateur pour décrire le type d’informations qui peut être entré dans chaque champ (code postal, codes produits, numéros).
  • Pour améliorer la reconnaissance des codes produits, numéros de téléphone ou de passeport, vous pouvez créer une nouvelle langue de reconnaissance, ce qui aidera le programme à lire ces données spécifiques.

Formation de modèle

Dans la grande majorité des cas, ABBYY FineReader Engine réussit à lire des textes sans apprentissage préalable. Cependant, lorsqu’il s’agit de reconnaître des polices décoratives ou en contours ou encore des documents dont l’impression est de mauvaise qualité, il est possible de former l’outil pour accroître la qualité de la reconnaissance.

Demandez plus d’information

Version d'essai

Remplissez le formulaire ci-dessous et nous vous répondrons dans les plus brefs délais.

J’ai été informé que je peux retirer mon consentement à tout moment en cliquant sur le lien de désabonnement se trouvant dans tout email reçu d’ABBYY Solutions Ltd. ou en utilisant le formulaire Droits d’accès aux données personnelles d’ABBYY.

J’autorise l’utilisation de mes données personnelles aux fins prévues dans la Politique de confidentialité.

Ce site est protégé par reCAPTCHA et la Politique de confidentialité et les Conditions d'utilisation de Google s'appliquent.

Merci de votre intérêt pour les produits ABBYY !

Votre demande a été transmise au Responsable commercial de votre pays et une réponse vous sera donnée le plus rapidement possible. Veuillez visiter notre page Contacts pour prendre contact avec votre équipe ABBYY la plus proche.

Avec nos meilleures salutations,
Votre équipe ABBYY