ABBYY FineReader Engine

多彩な機能を備えたOCRソフトウェア開発キット 

人工知能を活用したOCR機能をソフトウェアに統合 

幅広い技術を活用した認識工程

実際にテキストを認識する工程では、印刷文字の認識(OCR)、手書き文字の認識(ICR)、光学式マークの読み取り(OMR)、バーコードの読み取り(OBR)など、幅広い認識技術を活用します。 市場をリードするABBYYではOCR対応言語数が最大で、また、各言語の組み合わせも可能です。 以下に、ご利用可能な技術と処理オプションをご紹介します。

Factoids 026 77X77

光学式文字認識(OCR)

搭載されたOCR技術では200を超える言語に対応しています。

  • ヨーロッパ言語(ラテン、キリル、アルメニア、ギリシャの各文字)
  • 非ヨーロッパ言語: 日本語、中国語、韓国語、アラビア語、ペルシャ語、タイ語、ベトナム語、ヘブライ語、ビルマ語(プレビュー版)
  • FineReader XIXでは、1600年から1937年までの間に古いフォント(フラクトゥール、シュヴァーバッハ、ゴシックなど)で出版された英語、フランス語、ドイツ語、イタリア語、スペイン語の文書、書籍、新聞にも対応
  • OCR-A、OCR-B、MICR(E13B)およびCMC7の各フォント、ドットマトリクスプリンタで印刷された文書、タイプライタで打たれた文書の認識
Factoids 024 77X77

インテリジェント文字認識(ICR)

ICR技術は120を超える言語に対応しています。

  • ヨーロッパおよび非ヨーロッパ言語
  • 地域によって異なる22種類の手書きスタイル
  • フィールドおよびフレーム内の手書き文字の認識
  • アラブ諸国で使用されているインド数字のICR

異なる言語で記載された手書き文字の認識(多言語ICR)も可能です。

Factoids 017 77X77

光学式バーコード認識(OBR)

  • 1Dまたは2Dのバーコード
  • バーコードの高速抽出。 文書をどの角度から読み取ってもバーコードの自動検出および自動認識が可能です。

認識モード

認識モードを定義することにより、処理速度や精度を設定・調整する開発工程のスピードアップが可能です。 デフォルトの処理モードに加え、OCRでもICRでも、標準、準高速、高速の各認識モードから適切なモードを選択できます。
 

Benefits 119B 77X77

精度重視モード

最高の認識結果を達成する最も正確なモードです。認識した内容を再利用したい場合などに適しています。

Benefits 102V 77X77

高速認識モード

標準モードに比べ、処理速度が200~250%向上します。コンテンツ管理(CMS)や文書管理(DMS)、アーカイブ化といった用途に適しています。

全文認識とフィールドレベル認識

認識工程では、全文認識とフィールドレベル認識という2種類のテキスト認識が可能です。 全文認識は文書変換で使用し、通常、OCRを使用して実施します。 フィールドレベル認識は特定のデータを抽出する際に使用し、OCRや ICRといった複数の技術を使用します。

分類 全文認識 フィールドレベル認識
用途 文書変換、書籍のアーカイブ化 データキャプチャ/データ抽出
文書分析モード 標準モード、請求書モード、全文索引化モード フィールドレベル認識用にブロックをマニュアル指定
認識に使用する技術 OCR(最大精度99%) OCR、ICR、OMR、バーコード認識(データタイプと値の範囲を事前に定義)。 99.99%の精度。
検証 推奨(再利用する場合) 必須(多くの用途で精度が非常に重要であるため)
合成 文書の再構築に使用 使用しない
エクスポート形式 文書ファイル(RTF、DOC、PDFなど) XMLファイルまたはデータベースにエクスポート
全文認識

全文認識は以下のような様々な用途に対応する基本の認識方法です。

  • 文書や書籍を変換してアーカイブ化
  • 文書を変換してコンテンツを再利用
  • フィールド検出や文書分類の基礎となるテキスト抽出

これらの作業ではテキスト全文の認識(OCR)が必要となります。 認識結果はプレーンテキストとして、あるいは必要なファイル形式で完全な文書としてエクスポートすることが可能です。

フィールドレベル認識

用紙に記入された内容の処理やキーワードによる分類、マシンビジョンやロボットによるプロセスの自動化など、ビジネスで重要となる様々な業務に役立つのが、フィールドや特定範囲からのテキスト抽出です。ABBYY FineReader Engineでは、多言語対応のOCRやICR、OMR、バーコードの読み取りを始め、以下のような幅広い特別機能を備えています。

  • 様々な境界線や枠線を伴うフィールドからのデータ抽出
  • 使用文字、辞書、正規表現、手書きスタイルなどを設定してフィールドコンテンツを定義
  • フィールド内のスペースを検出
  • 交差するパーツやラインのあるブロックのインテリジェント処理
  • テキストブロックからノイズを除去し(しみ抜き)、ノイズ除去の際のドットサイズ指定も可
  • フィールドレベル認識は、投票(Voting)APIや認識中の「オンザフライ」調整など、開発者向け特殊ツールでも使用できます。

ユーザー言語

認識結果の品質を向上するため、ABBYY FineReader Engineには認識言語の作成・編集、定義済み認識言語の調整、ユーザー言語への単語登録を可能にするAPIを搭載しています。以下のような使い方が可能です。

  • ICRを使った用紙の読み取り品質を向上するため、ユーザー言語を使って各フィールドに記入されるべき情報の種類(郵便番号、製品コード、数字など)を記述する。
  • 製品コードや電話番号、パスポート番号などを正しく認識させるため、認識言語を新たに作成し、プログラムが特定の種類のデータを読み取るのを支援する。

パターン学習

FineReader Engineでは、事前学習を実施しなくてもテキストを正しく読み取ることができるケースが大半ですが、装飾フォントや縁取りフォントなどの特殊なフォントや文書の印字品質が良くない場合には、その文書固有のパターンを学習させて認識品質を向上させることができます。

お問い合わせ

体験版を申し込む

下記のフォームにご入力いただければ、こちらから速やかにご連絡いたします。

私は、ABBYY Solutions Ltd.から送信されるEメールに記載された配信停止リンクをクリックするか、または ABBYYデータ主体アクセス権利フォームを 介していつでも同意を取り消すことができることを理解しています。

このフォームを送信することで、私はプライバシーポリシーに記載されている目的に沿って自分の個人情報が使用されることに同意します。

ABBYY 製品 の お 問 合 せ あ り が と う ご ざ い ま す!

担当者より最短でご連絡差し上げますので少しお待ち下さい。ABBYYオフィスに直接ご連絡を取りたい場合はコンタクトページを参照下さい。

ABBYY ジ ャ パ ン 株式会社