Actualités

ABBYY ouvre de nouvelles voies aux professionnels grâce a ses technologies innovantes réunies dans un seul SDK

04 octobre 2005

FineReader Engine 8.0 passe à un niveau supérieur grâce à son support de reconnaissance par champ/zone, un nouveau processus de traitement des PDF et l'optimisation de la plate-forme de développement

FineReader Engine 8.0 passe à un niveau supérieur grâce à son support de reconnaissance par champ/zone, un nouveau processus de traitement des PDF et l'optimisation de la plate-forme de développement

Paris, Forum de La GEIDE, 04 octobre 2005 - ABBYY Software House a annoncé aujourd'hui le lancement de FineReader Engine 8.0, la toute dernière version de son puissant Kit de Développement Logiciel (SDK) de reconnaissance. Grâce à ses fonctions de reconnaissance pleine page, de reconnaissance par champ, de conversion PDF et de capture de données, FineReader Engine 8.0 est un SDK complet permettant aux développeurs d'intégrer la technologie d'ABBYY à des applications destinées au traitement de documents et de contenus, à la classification, à l'indexation, à l'archivage, à la conversion de document de type PDF, au traitement de formulaires et à la capture de données de formulaires et documents semi-structurés.

FineReader Engine est la plate-forme idéale pour les applications d'indexation de mots clés, de classification de documents, de systèmes de contrôle et de vidéo codage, d'extraction de données sur des documents non structurés. Par son analyse intelligente (chèques, factures, passeports), grâce à de nouvelles fonctionnalités permettant une reconnaissance performante des champs, FineReader Engine s'adresse avec cette nouvelle version aux nouveaux segments des du marché. Combinées à une conversion PDF optimisée, ces fonctionnalités viennent s'ajouter aux nouveaux outils de personnalisation mis au service des développeurs pour faire de FineReader Engine 8.0 le SDK de reconnaissance le plus précis et le plus complet dans le domaine de la conversion de documents et de la capture de données. FineReader Engine est le seul logiciel réunissant les fonctionnalités nécessaires au support des applications DMS et ECM actuelles, se démarquant ainsi des autres kits de sa catégorie.

ABBYY FineReader Engine 8.0 prend en charge 189 langues dans le domaine de l'OCR, 91 langues en ICR, la technique OMR ainsi que les codes barres 1D et 2D. La nouvelle version offre une plus grande précision de la reconnaissance, en particulier une meilleure reconnaissance de champ, de nouveaux outils d'analyse de documents ainsi que de nouvelles fonctionnalités telles que le prétraitement d'indexation plein texte. Ces innovations permettent d'utiliser FineReader Engine 8.0 pour l'exécution de tâches variées. Le logiciel offre également aux développeurs chargés de créer des applications précises et performantes un grand nombre d'outils de programmation, comme le support API de sélection externe (destiné aux solutions comprenant des moteurs multiples) et l'accès de moindre niveau permettant le réglage de la reconnaissance « on-the-fly ». FineReader comporte en outre une bibliothèque d'échantillons de codes, d'images et de tests de performance correspondants aux cas d'usages les plus courants. ABBYY est également prestataire de services auprès de professionnels et travaille en étroite collaboration avec sa communauté de développeurs à l'augmentation de la rapidité et de la précision de chaque application.

 

Une reconnaissance affinée

  • Optimisation de la précision OCR. La qualité de la reconnaissance d'ABBYY FineReader Engine 8.0 a augmenté de façon significative. La précision de la reconnaissance des images « difficiles à lire » comme les télécopies et les documents numérisés à une faible résolution a été améliorée jusqu'à 30%.
  • ICR en mode rapide. FineReader Engine possède également une option permettant d'accélérer l'ICR par champ, processus jusqu'à deux fois plus rapide.
  • Prétraitement adaptatif aux images d'appareils photos. Cette nouvelle technologie applique plusieurs algorithmes de traitement pour corriger les distorsions propres aux images prises par un appareil photo numérique. En comparaison des versions antérieures, cette nouvelle technologie apporte une amélioration de 40% de la qualité dans le processus OCR lié aux appareils photo numériques.
     

Amélioration de la reconnaissance par champ/zone

FineReader Engine 8.0 possède une série de fonctions de reconnaissance de champs permettant la reconnaissance OCR, ICR, OMR ou la lecture de codes barres ainsi que l'extraction de texte ou de données de zones sélectionnées ou de parties d'image. Les améliorations apportées à la version 8.0 garantissent la rapidité et la précision du traitement des champs/zones de taille réduite.

Au nombre de ces améliorations, on compte :

  • Un mode ICR rapide pour une reconnaissance intelligente des caractères jusqu'à deux fois plus rapide.
  • Une meilleure extraction du texte des champs, même si le texte est couvert par des lignes de champs.
  • La détection d'espaces à l'intérieur des champs, reconnaissance précise de champs, où l'espace est autorisé. La nouvelle version comporte également des dictionnaires, qui peuvent contenir des combinaisons de mots avec espace.
  • Le traitement intelligent de blocs avec intersection de parties et de lignes. Le moteur reconnaît d'abord le texte avec ses mots et ses symboles, qui sont entièrement localisés à l'intérieur des bordures des blocs, au lieu de s'attarder sur des blocs de textes secondaires autour.
  • La réduction de pixels parasites autour de blocs de texte, avec la possibilité de définir la taille des « parasites » blancs ou noirs.
  • L'API de sélection, hypothèse par niveau de mot et de caractère pour les scénarios de sélection ultérieurs.
  • La reconnaissance affinée « on-the-fly», permet aux intégrateurs d'influencer sur le choix des hypothèses en ajoutant des critères supplémentaires sur le classement durant le processus de reconnaissance.

Reconnaissance plein page/conversion de documents (PDF)

Les améliorations importantes apportées par ABBYY à FineReader Engine 8.0 contribuent à augmenter la précision et ce jusqu'à doubler la vitesse du processus de reconnaissance lors de la conversion de fichiers PDF. Les fonctionnalités avancées de la version 8.0 en matière d'importation et d'exportation de PDF offrent aux développeurs de nouveaux outils puissants de création d'applications de conversion PDF (notamment des formats variés d'exportation et création de PDF interrogeables).

Conversion PDF optimisée (Importation de PDF)

  • Une précision plus fine et un traitement jusqu'à deux fois plus rapide - Pendant le traitement des PDF, ABBYY FineReader Engine détermine si le texte est incorporé, puis il examine l'intégrité de la couche de texte, ensuite il analyse les documents PDF sources en se basant sur les informations intrinsèques des fichiers PDF, telles que les annotations, les métadonnées, les objets texte, les dictionnaires de polices et les flux de contenu. Fort de ces informations, il décide s'il extrait le texte ou applique le traitement OCR. Il vérifie chaque bloc un à un et sélectionne la méthode la plus appropriée à chacun. Cette démarche garantie une plus grande précision et une conversion plus rapide des PDF.
  • Extraction de liens et de liens hypertextes contenus dans un PDF
  • Compatibilité avec les para mètres de sécurité des fichiers sources PDF

Exportation optimisée des PDF

  • Support des paramètres de sécurité et de l'encodage des PDF. ABBYY FineReader Engine 8.0 prend en charge les mots de passe, les niveaux d'autorisation et les droits d'auteur pour l'exportation des PDF. Cette fonctionnalité, qui permet aux utilisateurs de restreindre les droits d'impression, de modification ou d'extraction de contenu de fichier, fait de FineReader Engine un outil de travail idéal pour les professionnels des organismes publics ou d'organisations gouvernementales pour lesquelles la sécurité est primordiale. FineReader Engine supporte également les algorithmes d'encodage RC4 40
    jusqu'à 128 bits ainsi qu'AES (Advanced Encryption Standard) 128 bits.
  • « Tagged PDF »(PDF marqué). Outre les PDF exportés interrogeables et les fichiers « image-seule », la nouvelle version permet de créer des documents PDF marqués qui s'adaptent aux largeurs différentes de page ou d'écran. Cette fonctionnalité simplifie la création de fichiers PDF optimisés pour la lecture sur PDA et leur accessibilité sur les lecteurs d'écran qu'utilisent les malvoyants.
  • Métadonnées pour fichiers PDF. Il est possible d'ajouter les métadonnées suivantes lors de l'exportation des PDF : signets, liens hypertextes et propriétés
    de documents.

Analyse de documents pour indexation plein texte

Cette fonctionnalité supporte la détection automatique et la reconnaissance de texte incorporé à une image, notamment de textes imbriqués dans des photographies, des tableaux et des diagrammes. L'analyse de documents pour indexation plein texte fournit les informations essentielles à une indexation ultérieure de documents. Cette fonctionnalité rend FineReader Engine 8.0 indispensable aux solutions d'indexation (pour la création d'index en/pour DMS, CMS et pour les systèmes d'archivage).

Capture de données de formulaires et documents semi-structurés

La nouvelle version d'ABBYY FineReader Engine peut traiter les formulaires et documents semi-structurés grâce à la dernière version de l'outil ABBYY FlexiCapture Studio 1.5, qui y est intégré. Cet outil permet de gagner en précision lors du traitement de formulaires et de documents semi-structurés et réduit le nombre d'ajustements nécessaires à chaque projet. Les nouvelles fonctionnalités prises en charge par FlexiCapture Studio 1.5 comprennent :

  • Le support d'éléments de tableaux
    Permet la lecture des tableaux à l'intérieur des documents et l'extraction des éléments du tableau. Idéal pour le traitement des factures et autres documents financiers.
  • Le support d'éléments numériques spécialisés
    En simplifiant la description de ce type de données sur le formulaire, le support des nouveaux types d'éléments «téléphone» et «monnaie» augmente la qualité de la capture.
  • Le filtrage de texture
    Des technologies avancées de prétraitement isolent les textures non pertinentes susceptibles d'amoindrir la qualité de reconnaissance.
  • La sélection multilingue en pré reconnaissance
    Cette nouvelle fonctionnalité permet à l'utilisateur de présélectionner des combinaisons de langues, par exemple anglais-allemand, pour une simplification le traitement de documents multilingues.

Optimisation des fonctions de la plateforme de développement

Echantillons de codes pour une performance et une efficacité maximales

Le nouveau SDK est livré avec une bibliothèque d'échantillons d'usages de moteurs courants afin d'aider les développeurs à adapter FineReader Engine de façon adéquate à chaque nouveau projet. Ces profils, à la vitesse et précision optimales, peuvent être ouverts sur demande et sont conçus pour des tâches particulières telles que la reconnaissance de champ, l'archivage avec visualisation de l'image et indexation, la conversion plein texte au format RTF ou HTML, etc. La banque de données contient des échantillons d'images et de tests de performance.

Support d'algorithmes de sélection externes

Utilisé comme un moteur parmi d'autres dans une application tierce, FineReader fournit des propositions (ou hypothèses) disposant d'un niveau de certitude approprié sur les caractères, les mots et la séparation des caractères. Ceci aide les développeurs à mettre au point un algorithme de sélection efficace et précis. Par exemple, lorsque FineReader Engine reconnaît « O », il pourra délivrer trois hypothèses : « 0 » (zéro) à un niveau de certitude de 60%, « O » majuscule, à 80% et « C », à 10%. Un autre exemple, cette fois pour la séparation des caractères : « m » peut avoir les hypothèses « m », « rn » et « in ».

Affinement de la reconnaissance « on-the-fly »

La version 8.0 du kit SDK fournit aux développeurs l'accessibilité et les fonctionnalités dont ils ont besoin pour manipuler le moteur à un premier niveau lors du processus de reconnaissance. Tandis que le moteur de reconnaissance de FineReader génère des hypothèses (ou propositions de reconnaissance), la nouvelle version du logiciel permet aux développeurs d'ajuster ou d'affiner la procédure relative à la mise au point du niveau de certitude de chaque hypothèse (en vue de la sélection de l'hypothèse la plus probable) sur la base de leurs propres critères.

« Les développeurs de nos clients intègrent FineReader Engine pour améliorer leur application utilisant la conversion de document et les capacités d'extraction de données, qui offrent le meilleur équilibre entre la précision et la rapidité », explique Alex Rylov, responsable chef de produit pour les produits de licence technologique ABBYY. « FineReader Engine 8.0 offre une combinaison puissante de technologies de base, proposant des outils productifs tels que des outils de diagnostic, des échantillons prédéfinis pour les fameux scénarios de traitement, et un API de sélection ainsi que l'affinement de la reconnaissance. Nous proposons aux clients les outils dont ils ont besoin pour influencer de façon significative sur leur productivité. Notre communauté de développeurs collabore constamment et étroitement avec leurs développeurs pour atteindre un niveau idéal de performance, quelle que soit l'application. »

Prise en charge de formats d'importation/d'exportation pour tous types de fonctions

ABBYY FineReader Engine prend en charge un large éventail de formats d'importation d'images (notamment BMP, PCX, DCX, JPEG, PNG, TIF et PDF) et de sauvegarde de documents (DOC, RTF, PDF, HTML, PPT, TXT, XLS, DBF et trois types de XML). La nouvelle version supporte également les nouveaux formats d'exportation : GIF et DjVu, très appropriés pour Internet mais aussi pour l'archivage en ligne, le filtrage des SPAM et d'autres applications destinées à Internet.

Disponibilité et prix

ABBYY FineReader Engine est constitué d'un set de bibliothèques de liens dynamiques (DLL) et est accessible par le biais d'une interface de programmation standard conforme au modèle COM (Component Object Model) pouvant supporter les plateformes C/C++, Visual Basic et Visual Studio.Net.

Le logiciel sera disponible en novembre 2005. Si vous souhaitez des informations sur les types de licences, les tarifs ou si vous avez des questions d'ordre technique, n'hésitez pas à contacter votre bureau ABBYY le plus proche. Pour plus d'informations commerciales ou sur les produits, veuillez visiter le site de la société à l'adresse www.abbyy.com.

Connect with us