ABBYY FineReader Engine ABBYY FineReader Engine

多彩な機能を備えたOCRソフトウェア開発キット

人工知能を活用したOCR機能をソフトウェアに統合

マルチコアCPUの活用と並列処理

柔軟でスケーラブルなアーキテクチャを搭載したABBYY FineReader Engineでは、マルチコアCPU を活用し、複数のスレッドで並列に画像を処理できます。 これにより、処理速度の大幅な向上が可能です。

デフォルトでは、多重処理を実施するかどうかはABBYY FineReader Engineが自動的に判断します。 その際に考慮されるのが、コンピュータシステムで使用できる物理的または論理的なCPUコアの数、ライセンスで定義されたCPUコアの数、文書に含まれるページ数などです。 必要に応じ、開発時に多重処理の設定を変更して、実行するプロセスの数を指定することも簡単にできます。

ABBYY FineReader Engineでは、FRDocumentとBatchProcessorという2つのオブジェクトで多重処理を実現しています。 どちらを使うかは、使用シナリオによって決めます。

数多くの複数ページの文書を変換する場合

書籍や長いレポートなどがこれに当たります。この場合、複数ページを並列に認識してから、合成とエクスポートはメインプロセスで実行することが可能です。 複数のエンジンを使用している場合には、複数ページからなる文書をいくつか同時に処理することも可能です。しかし、莫大なメモリ容量が消費されて、メモリ不足によるエラーが発生する恐れもあります。

複数ページからなる文書の並列処理では、FRDocumentの使用をお勧めします。追加で実装が必要となるインターフェースがなく、非常にプログラミングしやすい多重処理方法です。

FRDocument を使用した場合、データを開いて前処理を施し、分析・認識を実行するまでの工程が並列で、合成はメインプロセスで逐次で処理され、その後、エクスポートは再び並列処理となります。

数多くの単ページ文書を変換する場合

請求書や契約書、レターなどがこれに当たります。単ページ文書では一つひとつの文書が他の文書に依存しておらず、一度に必要なメモリ容量もそれほど大きくないため、並列処理がお勧めです。

FineReader Engineは、こういったシナリオで使用できる2つのオプションを備えています。

  • 使用する場合 BatchProcessor

    BatchProcessorを使うメリットは、処理する文書の数が前もって分からなくても使用できる点です。文書の種類がバラバラでも構いません。文書を受け取ったら、すぐにその文書を処理する必要があります。 ファイルアダプタと、任意の画像ソースを指定するためのインターフェースを実装する必要があるため、2の方法に比べて実現に手間がかかります。 データを開いて前処理を施し、分析・認識を実行する工程は並列処理されます。

  • COMを介してプロセス外から読み込んだ複数のエンジンを使用する場合

    処理速度ではこの方法が最も効率がよく、マルチスレッドで発生するあらゆる問題を自動的に排除できます。ABBYY FineReader Engineのオブジェクトを使用するすべての工程は、COMを介して逐次処理されます。

デモの依頼

お試しになりたいですか?もっと詳しい情報が必要ですか?下記のフォームにご入力いただければ、こちらから速やかにご連絡いたします。

私は、ABBYYから送信されるEメールに記載された配信停止リンクをクリックするか、または ABBYYデータ主体アクセス権利フォームを 介していつでも同意を取り消すことができることを理解しています。

このフォームを送信することで、私はプライバシーポリシーに記載されている目的に沿って自分の個人情報が使用されることに同意します。

ABBYY 製品 の お 問 合 せ あ り が と う ご ざ い ま す!

担当者より最短でご連絡差し上げますので少しお待ち下さい。ABBYYオフィスに直接ご連絡を取りたい場合はコンタクトページを参照下さい。

ABBYY ジ ャ パ ン 株式会社