Traitement des documents avec ABBYY Mobile OCR Engine


Description des étapes du traitement


Étape 1 : importation et traitement de l’image

L’image est chargée depuis la mémoire et préparée pour l’OCR. La binarisation d’image sépare le texte de l’arrière-plan, générant une image en noir et blanc bien moins volumineuse que l’originale en couleur.
Vous pouvez également appliquer une correction de l’alignement et de l’orientation du document supplémentaire.

 
Détails

Fonction de correction automatique de l’alignement.

Lorsque vous prenez des photos avec un appareil photo mobile, ou qu’en déplacement, vous scannez des images à l’aide d’un scanner portable,les images peuvent ne sont pas être correctement alignées la plupart du temps, ce qui a un impact négatif sur la qualité de la reconnaissance. Le moteur OCR mobile d’ABBYY permet la détection et la correction des désalignements avec une précision au degré près, ce qui entraîne une amélioration significative de la qualité et de la précision de l’OCR mobile.

Fonction de détection de l’orientation du document.

Le prétraitement de l’image détecte automatiquement l’orientation d’une page de texte à reconnaître (si elle est placée en biais ou retournée).


Étape 2 : analyse de document

L’analyse de documents est un ensemble d'algorithmes analysant l’image : elle détecte les lettres, les lie pour former des mots, puis des lignes de texte et pour finir des paragraphes. De plus, la zone de lecture est nettoyée et le bruit supprimé.

 
Détails

Prise en charge de la césure.

Si le moteur rencontre une partie d’un mot césuré (par ex. : Lun-) sur une ligne, et la seconde partie (ici, di) sur la suivante, il les relie pour ne former qu’un mot (Lundi).

Correcteur orthographique

La correction de l’orthographe pendant la reconnaissance contribue considérablement à la qualité du texte lu.

Préservation des polices de caractères.

Le moteur OCR mobile d’ABBYY identifie les propriétés de police d’un texte source, c’est-à-dire « gras », « italique » ou « souligné ».

Indicateur de niveau de confiance.

Cette fonction affiche le niveau de certitude du texte reconnu, permettant aux développeurs de définir des critères flexibles dans le cadre de l’implémentation de fonctions de relecture et de vérification.
La vérification de l’orthographe pendant la reconnaissance améliore également considérablement la qualité du texte en sortie.

Préservation du texte multicolonnesur plusieurs colonnes.

Dans les versions précédentes du moteur OCR mobile d’ABBYYd’ABBYYY Mobile OCR Engine, le texte était invariablement reconnu de gauche à droite et de haut en bas, ce qui avait pour résultat de placer toutes les données reconnues dans un bloc linéaire. Le moteur OCR mobile d’ABBYY a une fonction appelée « Assemblage des paragraphes » grâce à laquelle la nouvelle DA’algorithme identifie les bordures des blocs de texte et reconnaît chaque bloc séparément, reconnaissant le texte de gauche à droite et de haut en bas en tant que bloc distinct et préservant ainsi le format d’un texte ou d’un paragraphe rédigé sur plusieurs colonnes et la segmentation du texte.


Étape 3 : reconnaissance optique de caractères (OCR)

Les blocs détectés sur l’image sont ensuite reconnus à l’aide de la langue spécifique et des définitions de gabarits. Si les dictionnaires sont disponibles, les textes sont ensuite comparés pour améliorer la qualité de reconnaissance globale. Les résultats de la reconnaissance sont l’ensemble des caractères dont les coordonnées sont jointes sous forme de lignes. Chaque caractère a un niveau de confiance représentant la certitude du moteur de reconnaissance dans le choix final du caractère.

 
Détails

Deux modes de reconnaissance mobile :

  • Mode rapide de reconnaissance express – très pratique lorsque l’image est de bonne qualité et qu'elle permet de réduire le temps requis pour sa reconnaissance et son traitement.
  • Mode complet pour une reconnaissance précise – le meilleur choix pour les images de mauvaise qualité qui nécessitent plus de temps pour obtenir un résultat optimal.

Reconnaissance de codes-barres (en option)

Cette fonction permet de reconnaître les codes-barres et prend en charge de nombreux types de codes-barres 1D et 2D.
La recherche d’un code-barres sur une page ainsi que la détection de codes-barres ne sont pas disponibles. L’utilisateur doit soit uniquement capturer le code-barres uniquement, soit rogner manuellement l’image du pour que seul le code-barres soit identifiable.

Reconnaissance de cartes de visite (en option)

Les résultats de la reconnaissance sont analysés et les coordonnées de contact correspondantes sont extraites à partir des cartes de visite.
Cette fonction permet de récupérer des coordonnées à partir d’images de cartes de visite, comme le prénom, le nom de famille, la position du porte-cartefonction, différents types de numéros de téléphone, l’adresse électroniquele courriel, le nom de la société, le site Web internet et l’adresse postale de la société.
La technologie de lecture des cartes de visiteCe module permet désormais de reconnaître les cartes de visite dans 23 langues.


Étape 4 : traitement des résultats

Les résultats de la reconnaissance peuvent être traités et exportés. Le développeur de l’application a un contrôle total sur les résultats de l’OCR.

Avez-vous des questions ?
Souhaitez-vous une version d’évaluation ?

N'hésitez pas à nous contacter !