ABBYY FineReader Engine

多彩な機能を備えたOCRソフトウェア開発キット 

人工知能を活用したOCR機能をソフトウェアに統合 

AIと機械学習で文書を正確に再構築し、精度を向上

ABBYY FineReader EngineではAI、機械学習、ABBYY適応型文書認識技術(ADRT)を活用したアルゴリズムにより、文書レイアウトを分析して一つひとつの仮説を検証していきます。

分析工程では文書をページ単位に分割。各ページのレイアウトを体系的にチェックして、テキスト、画像、バーコード、表など、各エレメントの配置を検出します。 同時に文書全体も検証し、その論理構造を特定します。 これら工程を経て各テキストエレメントの「機能」をきちんと理解し、例えば、ヘッダーやフッターを個々のページに現れるテキストの断片だと誤認することなく、ヘッダーあるいはフッターと認識します。

FineReader Engineでは文書の論理構造を以下のように検出しています。

19-Features-ADRT

テキスト、画像、書式エレメントについての情報は保存され、最後に文書を再構築する際に使用します。 結果、例えばWord形式で文書を再構築した場合、表、フォントの種類とスタイル、ヘッダー、フッター、ページ番号、脚注、目次などの書式エレメントが正確に再現できるのです。

論理構造、エレメント、書式を保持して文書を再構築

  • 見出しの階層構造
  • 目次
  • フォントの種類とスタイル
  • 画像や図表のキャプション
  • ヘッダーとフッター
  • ページ番号
  • 脚注
  • 論理的なテキストの流れ
  • 箇条書きや番号付けの再現
  • ハイパーリンクの保持
Chaikovsky-new

AIを使ったアルゴリズムは、認識精度、特にヨーロッパ言語における認識精度の向上にも貢献します。

お問い合わせ

体験版を申し込む

下記のフォームにご入力いただければ、こちらから速やかにご連絡いたします。

私は、ABBYY Solutions Ltd.から送信されるEメールに記載された配信停止リンクをクリックするか、または ABBYYデータ主体アクセス権利フォームを 介していつでも同意を取り消すことができることを理解しています。

このフォームを送信することで、私はプライバシーポリシーに記載されている目的に沿って自分の個人情報が使用されることに同意します。

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約が適用されます。

ABBYY 製品 の お 問 合 せ あ り が と う ご ざ い ま す!

担当者より最短でご連絡差し上げますので少しお待ち下さい。ABBYYオフィスに直接ご連絡を取りたい場合はコンタクトページを参照下さい。

ABBYY ジ ャ パ ン 株式会社