ABBYY FineReader Engine

多彩な機能を備えたOCRソフトウェア開発キット

人工知能を活用したOCR機能をソフトウェアに統合

Recognition

幅広い技術を活用した認識工程

実際にテキストを認識する工程では、印刷文字の認識（OCR）、手書き文字の認識（ICR）、光学式マークの読み取り（OMR）、バーコードの読み取り（OBR）など、幅広い認識技術を活用します。市場をリードするABBYYではOCR対応言語数が最大で、また、各言語の組み合わせも可能です。以下に、ご利用可能な技術と処理オプションをご紹介します。

搭載されたOCR技術では200を超える言語に対応しています。

ヨーロッパ言語（ラテン、キリル、アルメニア、ギリシャの各文字）
非ヨーロッパ言語：日本語、中国語、韓国語、アラビア語、ペルシャ語、タイ語、ベトナム語、ヘブライ語、ビルマ語（プレビュー版
FineReader XIXでは、1600年から1937年までの間に古いフォント（フラクトゥール、シュヴァーバッハ、ゴシックなど）で出版された英語、フランス語、ドイツ語、イタリア語、スペイン語の文書、書籍、新聞にも対応
OCR-A、OCR-B、MICR（E13B）およびCMC7の各フォント、ドットマトリクスプリンタで印刷された文書、タイプライタで打たれた文書の認識

ICR技術は120を超える言語に対応しています。

ヨーロッパおよび非ヨーロッパ言語
地域によって異なる22種類の手書きスタイル
フィールドおよびフレーム内の手書き文字の認識
アラブ諸国で使用されているインド数字のICR

異なる言語で記載された手書き文字の認識（多言語ICR）も可能です。

1Dまたは2Dのバーコード

バーコードの高速抽出。文書をどの角度から読み取ってもバーコードの自動検出および自動認識が可能です。

最高の認識結果を達成する最も正確なモードです。認識した内容を再利用したい場合などに適しています。

標準モードに比べ、処理速度が200～250％向上します。コンテンツ管理（CMS）や文書管理（DMS）、アーカイブ化といった用途に適しています。

全文認識とフィールドレベル認識

認識工程では、全文認識とフィールドレベル認識という2種類のテキスト認識が可能です。全文認識は文書変換で使用し、通常、OCRを使用して実施します。フィールドレベル認識は特定のデータを抽出する際に使用し、OCRや ICRといった複数の技術を使用します

Specification	Full text recognition	Field-level recognition
Used for:	Document conversion, books archiving	Data capture / Data extraction
Document analysis:	General document analysis, document analysis for invoices, document analysis for full-text indexing	Manual blocks specification for field-level recognition
Recognition technologies:	OCR with up to 99% accuracy	OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate
Verification:	Recommended (for content reuse)	Obligatory (as accuracy is a critical issue in most cases)
Synthesis:	Used for document reconstruction	Not used
Export format:	Document files (RTF, DOC, PDF, etc.)	Export to XML file or database

Loading component...

全文認識は以下のような様々な用途に対応する基本の認識方法です。

文書や書籍を変換してアーカイブ化
文書を変換してコンテンツを再利用
フィールド検出や文書分類の基礎となるテキスト抽出

これらの作業ではテキスト全文の認識（OCR）が必要となります。認識結果はプレーンテキストとして、あるいは必要なファイル形式で完全な文書としてエクスポートすることが可能です。

用紙に記入された内容の処理やキーワードによる分類、マシンビジョンやロボットによるプロセスの自動化など、ビジネスで重要となる様々な業務に役立つのが、フィールドや特定範囲からのテキスト抽出です。ABBYY FineReader Engineでは、多言語対応のOCRやICR、OMR、バーコードの読み取りを始め、以下のような幅広い特別機能を備えています。

様々な境界線や枠線を伴うフィールドからのデータ抽出
使用文字、辞書、正規表現、手書きスタイルなどを設定してフィールドコンテンツを定義
フィールド内のスペースを検出
交差するパーツやラインのあるブロックのインテリジェント処理/li>
テキストブロックからノイズを除去し（しみ抜き）、ノイズ除去の際のドットサイズ指定も可
フィールドレベル認識は、投票（Voting）APIや認識中の「オンザフライ」調整など、開発者向け特殊ツールでも使用できます。

Loading component...

認識結果の品質を向上するため、ABBYY FineReader Engineには認識言語の作成・編集、定義済み認識言語の調整、ユーザー言語への単語登録を可能にするAPIを搭載しています。以下のような使い方が可能です。

ICRを使った用紙の読み取り品質を向上するため、ユーザー言語を使って各フィールドに記入されるべき情報の種類（郵便番号、製品コード、数字など）を記述する。
製品コードや電話番号、パスポート番号などを正しく認識させるため、認識言語を新たに作成し、プログラムが特定の種類のデータを読み取るのを支援する。

Loading component...

FineReader Engineでは、事前学習を実施しなくてもテキストを正しく読み取ることができるケースが大半ですが、装飾フォントや縁取りフォントなどの特殊なフォントや文書の印字品質が良くない場合には、その文書固有のパターンを学習させて認識品質を向上させることができます。

Loading component...

多彩な機能を備えたOCRソフトウェア開発キット

Recognition

幅広い技術を活用した認識工程

光学式文字認識（OCR)

インテリジェント文字認識（ICR）

光学式バーコード認識（OBR)

精度重視モード

高速認識モード

全文認識とフィールドレベル認識

Loading component...

全文認識

フィールドレベル認識

Loading component...

ユーザー言語

Loading component...

パターン学習

Loading component...

専門家に相談してみませんか？

Loading component...

フィールドレベル認識

ユーザー言語

パターン学習

専門家に相談してみませんか？