多彩な機能を備えたOCRソフトウェア開発キット
人工知能を活用したOCR機能をソフトウェアに統合
実際にテキストを認識する工程では、印刷文字の認識(OCR)、手書き文字の認識(ICR)、光学式マークの読み取り(OMR)、バーコードの読み取り(OBR)など、幅広い認識技術を活用します。 市場をリードするABBYYではOCR対応言語数が最大で、また、各言語の組み合わせも可能です。 以下に、ご利用可能な技術と処理オプションをご紹介します。
搭載されたOCR技術では200を超える言語に対応しています。
ICR技術は120を超える言語に対応しています。
異なる言語で記載された手書き文字の認識(多言語ICR)も可能です。
認識モードを定義することにより、処理速度や精度を設定・調整する開発工程のスピードアップが可能です。 デフォルトの処理モードに加え、OCRでもICRでも、標準、準高速、高速の各認識モードから適切なモードを選択できます。
最高の認識結果を達成する最も正確なモードです。認識した内容を再利用したい場合などに適しています。
標準モードに比べ、処理速度が200~250%向上します。コンテンツ管理(CMS)や文書管理(DMS)、アーカイブ化といった用途に適しています。
認識工程では、全文認識とフィールドレベル認識という2種類のテキスト認識が可能です。 全文認識は文書変換で使用し、通常、OCRを使用して実施します。 フィールドレベル認識は特定のデータを抽出する際に使用し、OCRや ICRといった複数の技術を使用します。
分類 | 全文認識 | フィールドレベル認識 |
---|---|---|
用途 | 文書変換、書籍のアーカイブ化 | データキャプチャ/データ抽出 |
文書分析モード | 標準モード、請求書モード、全文索引化モード | フィールドレベル認識用にブロックをマニュアル指定 |
認識に使用する技術 | OCR(最大精度99%) | OCR、ICR、OMR、バーコード認識(データタイプと値の範囲を事前に定義)。 99.99%の精度。 |
検証 | 推奨(再利用する場合) | 必須(多くの用途で精度が非常に重要であるため) |
合成 | 文書の再構築に使用 | 使用しない |
エクスポート形式 | 文書ファイル(RTF、DOC、PDFなど) | XMLファイルまたはデータベースにエクスポート |
全文認識は以下のような様々な用途に対応する基本の認識方法です。
これらの作業ではテキスト全文の認識(OCR)が必要となります。 認識結果はプレーンテキストとして、あるいは必要なファイル形式で完全な文書としてエクスポートすることが可能です。
用紙に記入された内容の処理やキーワードによる分類、マシンビジョンやロボットによるプロセスの自動化など、ビジネスで重要となる様々な業務に役立つのが、フィールドや特定範囲からのテキスト抽出です。ABBYY FineReader Engineでは、多言語対応のOCRやICR、OMR、バーコードの読み取りを始め、以下のような幅広い特別機能を備えています。
認識結果の品質を向上するため、ABBYY FineReader Engineには認識言語の作成・編集、定義済み認識言語の調整、ユーザー言語への単語登録を可能にするAPIを搭載しています。以下のような使い方が可能です。
FineReader Engineでは、事前学習を実施しなくてもテキストを正しく読み取ることができるケースが大半ですが、装飾フォントや縁取りフォントなどの特殊なフォントや文書の印字品質が良くない場合には、その文書固有のパターンを学習させて認識品質を向上させることができます。
下記のフォームにご入力いただければ、こちらから速やかにご連絡いたします。
担当者より最短でご連絡差し上げますので少しお待ち下さい。ABBYYオフィスに直接ご連絡を取りたい場合はコンタクトページを参照下さい。
ABBYY ジ ャ パ ン 株式会社