強力なPDF処理機能
PDFの入力と処理
インテリジェントPDF処理
ABBYY FineReader Engineでは、ソースPDFファイル上にある以下のような内部情報を分析します。
- 注釈
- メタデータ
- テキストオブジェクト
- フォント辞書
- コンテンツストリーム
効率よく正確にテキストを検出することで、PDF変換の性能と速度を向上します。 PDFファイルにテキストが埋め込まれている場合、テキストレイヤーの完全性を検証し、テキストを抽出するか、ブロックごとにOCRを実行するかを決定します。 必要に応じてこの機能をオフに設定することも可能です。
PDFから内部情報をキャプチャ
PDF/A-3から添付ファイルを抽出

PDF output
PDFの安全機能や暗号化に対応
ABBYY FineReader Engineでは、PDFの安全を守る様々な設定に対応しています。
- 「ファイルを開く」をパスワードで保護し、文書への不正なアクセスを防止します。
- ファイル内容の印刷、編集、抽出など、特定の操作を制限するパスワードの設定が可能です。
- 最新の暗号化規格に対応しています。
メタデータのエクスポート
PDF/A形式への変換
タグ付きPDF形式で出力
日本語、中国語、韓国語をPDFにエクスポート
ページサイズの設定
PDF(PDF/A)のMRC圧縮
- MRC(Mixed Raster Content)と呼ばれる特殊な圧縮技術を活用し、PDFおよびPDF/Aファイルのサイズを最小限に抑えます。 原文の見た目を維持しながら、圧縮によりファイルサイズは大幅に小さくなります。 MRCは、カラー文書をスキャンして処理する場合に理想的なPDF圧縮技術です。 文書の見た目が美しく、同時に、JPEGによる圧縮に比べて最大で8分の1~10分の1までファイルサイズを縮小できます。
- 文書の画像ファイルが大きくなりがちなのは背景画像が原因です。最大でファイルサイズの90%を占める場合も少なくありません。 MRC圧縮技術はカラー背景を特定し、高い圧縮率で圧縮します。 画像オブジェクト(図表、ロゴ、写真、図面、スタンプ、署名など)も少し圧縮されるものの、見た目のクオリティを損なわない程度に圧縮率が制限されます。 その結果、生成されたPDFファイルは大幅に小さくなります
- また、MRC技術では、文書内の類似文字のアウトラインを分析して平均的な文字テンプレートを作成し、一つひとつの文字を適用する代わりにテンプレートを使用します。 そのため、文字に欠陥があっても修正され、文字アウトラインがより正確になります。 生成されたPDFファイルでは背景が抑えられ、テキストと画像が原文よりもはっきりと読みやすい上にファイルサイズも小さくなります。 文書をこのように再構築する方法は、画質の良くない画像を処理する場合に役立ちます







