
Retrieval-Augmented Generation (RAG)
Obtenez des informations plus précises et plus riches en vous appuyant sur une base de connaissances élargie pour votre LLM.
Optimisez l'automatisation de l'IA grâce à la puissance d'une OCR fiable et précise
Améliorer le traitement direct des documents grâce à des informations fondées sur des données
Automatisez grâce à une IA documentaire fiable et facile à intégrer
COMPRÉHENSION DES PROCESSUS
OPTIMISATION DES PROCESSUS
L’IA conçue sur mesure pour une automatisation sans limite.
Lancez votre automatisation grâce aux modèles IA d’extraction préconfigurés.
Rencontrez les contributeurs, explorer les ressources et plus encore.
Par secteur
Par processus d'entreprise
Par technologie
CONSTRUIRE
Intégrez des fonctionnalités avancées de reconnaissance de texte dans vos applications et flux de travail via l'API.
Données documentaires prêtes pour l'IA pour une sortie GenAI contextualisée grâce à la génération augmentée par la recherche (RAG).
CROÎTRE
Échangez avec des personnes partageant les mêmes idées et avec des experts expérimentés en OCR, IDP et IA.
Ce titre prestigieux est décerné aux développeurs qui font preuve d'une expertise exceptionnelle dans le domaine de l'ABBYY AI.
Explorez
Connaissances
Implémentation
ABBYY FineReader Engine
Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.
La reconnaissance de texte imprimé est disponible en plus de 200 langues :
Langues européennes (alphabets latin, cyrillique, arménien, grec)
Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire
La reconnaissance de texte manuscrit est disponible en plus de 120 langues :
La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.
Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.
Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.
En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.
Le tableau suivant montre les différences :
Specification | Full text recognition | Field-level recognition |
---|---|---|
Used for: | Document conversion, books archiving | Data capture / Data extraction |
Document analysis: | General document analysis, document analysis for invoices, document analysis for full-text indexing | Manual blocks specification for field-level recognition |
Recognition technologies: | OCR with up to 99% accuracy | OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate |
Verification: | Recommended (for content reuse) | Obligatory (as accuracy is a critical issue in most cases) |
Synthesis: | Used for document reconstruction | Not used |
Export format: | Document files (RTF, DOC, PDF, etc.) | Export to XML file or database |
La reconnaissance plein texte est le type de reconnaissance de base pour différentes tâches, comme :
Toutes ces tâches requièrent la reconnaissance (OCR) de l’intégralité du texte. Le texte qui en résulte est exporté, en fonction de la tâche, sous forme uniquement de texte ou dans un document au format pris en charge.
Pour aider à l’exécution de tâches commerciales clés telles que le traitement de formulaires, la classification par mots-clés la vision industrielle ou l’automatisation robotisée, ABBYY FineReader Engine extrait le texte contenu dans des champs ou des zones. Parmi les fonctionnalités-clés, on compte l’OCR et l’ICR multilingues, l’OMR, la reconnaissance des codes-barres et toute une palette de fonctionnalités spécifiques telles que :
Pour améliorer la qualité de la reconnaissance, ABBYY FineReader Engine fournit une API pour paramétrer et modifier la reconnaissance des langues, affiner la reconnaissance prédéfinie des langues et ajouter de nouveaux mots aux langues de l’utilisateur. Exemples: