Recognition
幅広い技術を活用した認識工程
実際にテキストを認識する工程では、印刷文字の認識(OCR)、手書き文字の認識(ICR)、光学式マークの読み取り(OMR)、バーコードの読み取り(OBR)など、幅広い認識技術を活用します。 市場をリードするABBYYではOCR対応言語数が最大で、また、各言語の組み合わせも可能です。 以下に、ご利用可能な技術と処理オプションをご紹介します。
光学式文字認識(OCR)
搭載されたOCR技術では200を超える言語に対応しています。
-
ヨーロッパ言語(ラテン、キリル、アルメニア、ギリシャの各文字)
-
非ヨーロッパ言語: 日本語、中国語、韓国語、アラビア語、ペルシャ語、タイ語、ベトナム語、ヘブライ語、ビルマ語(プレビュー版
-
FineReader XIXでは、1600年から1937年までの間に古いフォント(フラクトゥール、シュヴァーバッハ、ゴシックなど)で出版された英語、フランス語、ドイツ語、イタリア語、スペイン語の文書、書籍、新聞にも対応
-
OCR-A、OCR-B、MICR(E13B)およびCMC7の各フォント、ドットマトリクスプリンタで印刷された文書、タイプライタで打たれた文書の認識
インテリジェント文字認識(ICR)
ICR技術は120を超える言語に対応しています。
- ヨーロッパおよび非ヨーロッパ言語
- 地域によって異なる22種類の手書きスタイル
- フィールドおよびフレーム内の手書き文字の認識
- アラブ諸国で使用されているインド数字のICR
異なる言語で記載された手書き文字の認識(多言語ICR)も可能です。
光学式バーコード認識(OBR)
- 1Dまたは2Dのバーコード
- バーコードの高速抽出。 文書をどの角度から読み取ってもバーコードの自動検出および自動認識が可能です。
精度重視モード
最高の認識結果を達成する最も正確なモードです。認識した内容を再利用したい場合などに適しています。
高速認識モード
標準モードに比べ、処理速度が200~250%向上します。コンテンツ管理(CMS)や文書管理(DMS)、アーカイブ化といった用途に適しています。

全文認識とフィールドレベル認識
認識工程では、全文認識とフィールドレベル認識という2種類のテキスト認識が可能です。 全文認識は文書変換で使用し、通常、OCRを使用して実施します。 フィールドレベル認識は特定のデータを抽出する際に使用し、OCRや ICRといった複数の技術を使用します
Loading component...
全文認識
全文認識は以下のような様々な用途に対応する基本の認識方法です。
- 文書や書籍を変換してアーカイブ化
- 文書を変換してコンテンツを再利用
- フィールド検出や文書分類の基礎となるテキスト抽出
これらの作業ではテキスト全文の認識(OCR)が必要となります。 認識結果はプレーンテキストとして、あるいは必要なファイル形式で完全な文書としてエクスポートすることが可能です。






