
検索拡張生成(RAG)
外部の知識ソースに接続することで、LLMの精度と品質をさらに向上させましょう。
信頼性が高く正確なOCRの力でAIによる自動化をさらに強化
わずか数行のコードで信頼性の高いDocumentAIを自動化ワークフローに統合
プロセス理解
プロセスの最適化
無制限の自動化のために専用開発したAI
事前構築済みのAI抽出モデルを使用して、即座に自動化を開始できます
コントリビューター(スキル開発者)の御紹介、アセットの探索など
産業別
ビジネスプロセス別
技術別
構築
高度なテキスト認識機能をAPI経由でアプリケーションやワークフローに統合できます。
AIに対応した文書データは、RAGでコンテキストに基づいたGenAI出力が可能です。
発展
同業者や経験豊富なOCR、IDP、AIの専門家と交流できます。
ABBYY AIにおいて卓越した専門知識を持つ開発者に贈られる称号です。
リソース情報
インサイト
実装
実際にテキストを認識する工程では、印刷文字の認識(OCR)、手書き文字の認識(ICR)、光学式マークの読み取り(OMR)、バーコードの読み取り(OBR)など、幅広い認識技術を活用します。 市場をリードするABBYYではOCR対応言語数が最大で、また、各言語の組み合わせも可能です。 以下に、ご利用可能な技術と処理オプションをご紹介します。
搭載されたOCR技術では200を超える言語に対応しています。
ヨーロッパ言語(ラテン、キリル、アルメニア、ギリシャの各文字)
非ヨーロッパ言語: 日本語、中国語、韓国語、アラビア語、ペルシャ語、タイ語、ベトナム語、ヘブライ語、ビルマ語(プレビュー版
FineReader XIXでは、1600年から1937年までの間に古いフォント(フラクトゥール、シュヴァーバッハ、ゴシックなど)で出版された英語、フランス語、ドイツ語、イタリア語、スペイン語の文書、書籍、新聞にも対応
OCR-A、OCR-B、MICR(E13B)およびCMC7の各フォント、ドットマトリクスプリンタで印刷された文書、タイプライタで打たれた文書の認識
ICR技術は120を超える言語に対応しています。
異なる言語で記載された手書き文字の認識(多言語ICR)も可能です。
最高の認識結果を達成する最も正確なモードです。認識した内容を再利用したい場合などに適しています。
標準モードに比べ、処理速度が200~250%向上します。コンテンツ管理(CMS)や文書管理(DMS)、アーカイブ化といった用途に適しています。
認識工程では、全文認識とフィールドレベル認識という2種類のテキスト認識が可能です。 全文認識は文書変換で使用し、通常、OCRを使用して実施します。 フィールドレベル認識は特定のデータを抽出する際に使用し、OCRや ICRといった複数の技術を使用します
Specification | Full text recognition | Field-level recognition |
---|---|---|
Used for: | Document conversion, books archiving | Data capture / Data extraction |
Document analysis: | General document analysis, document analysis for invoices, document analysis for full-text indexing | Manual blocks specification for field-level recognition |
Recognition technologies: | OCR with up to 99% accuracy | OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate |
Verification: | Recommended (for content reuse) | Obligatory (as accuracy is a critical issue in most cases) |
Synthesis: | Used for document reconstruction | Not used |
Export format: | Document files (RTF, DOC, PDF, etc.) | Export to XML file or database |
全文認識は以下のような様々な用途に対応する基本の認識方法です。
これらの作業ではテキスト全文の認識(OCR)が必要となります。 認識結果はプレーンテキストとして、あるいは必要なファイル形式で完全な文書としてエクスポートすることが可能です。
用紙に記入された内容の処理やキーワードによる分類、マシンビジョンやロボットによるプロセスの自動化など、ビジネスで重要となる様々な業務に役立つのが、フィールドや特定範囲からのテキスト抽出です。ABBYY FineReader Engineでは、多言語対応のOCRやICR、OMR、バーコードの読み取りを始め、以下のような幅広い特別機能を備えています。
認識結果の品質を向上するため、ABBYY FineReader Engineには認識言語の作成・編集、定義済み認識言語の調整、ユーザー言語への単語登録を可能にするAPIを搭載しています。以下のような使い方が可能です。