ABBYY FineReader Engine ABBYY FineReader Engine

多彩な機能を備えたOCRソフトウェア開発キット

人工知能を活用したOCR機能をソフトウェアに統合

ABBYY FineReader Engine 12 技術仕様

ABBYY FineReader Engine 12では、3つのバージョンをご用意しております。

  • Windows向けABBYY FineReader Engine 12
  • Linux向けABBYY FineReader Engine 12
  • Mac向けABBYY FineReader Engine 12

システム要件

ハードウェア

x86互換プロセッサを搭載したPC(1GHz以上)

オペレーティングシステム

  • Windows Server 2016、Windows Server 2012、Windows Server 2012 R2(2014年4月更新プログラムのロールアップ、KB2919355)、Windows Server 2008 R2 SP1
  • Windows 10、Windows 8.1(2014年4月更新プログラムのロールアップ、KB2919355)、Windows 8。Windows 7 SP1

試験済みクラウドおよび仮想環境

  • Azure App Services
  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

ABBYY FineReader Engineは、対応するプラットフォーム上のDockerコンテナでも稼働できます。

テスト済みのJava開発環境

ABBYY FineReader Engine Javaのラッパーは以下のJava開発キットにてテスト済みです:

  • 32ビットOS用:
    • Oracle Java SE Development Kit 8u201 i586
    • Oracle Java SE Development Kit 8u202 i586
  • 64ビットOS用:
    • OpenJDK 11.0.2 x64
    • OpenJDK 12.0.2 x64
    • OpenJDK 13 x64
    • Oracle Java SE Development Kit 8u201 x64
    • Oracle Java SE Development Kit 8u202 x64
    • Oracle Java SE Development Kit 11.0.2 x64
    • Oracle Java SE Development Kit 12.0.2 x64
    • Oracle Java SE Development Kit 13 x64

メモリ

  • 単ページ文書の処理 — RAM 400MB以上(推奨 1GB以上)
  • 複数ページ文書の処理 — RAM 1GB以上(推奨 1.5GB以上)
  • 並列処理 — 各コアで RAM 450MB + 350MB
  • 日本語、中国語、韓国語、アラビア語の文書を並列処理 — 各コアで RAM 750MB + 850MB

ハードディスク容量

  • 1600 MBのライブラリ(コア機能)がインストール可能なディスク領域
  • 400 MBの追加OfficeConvertersモジュール・ライブラリがインストール可能なディスク領域
  • プログラムの動作に100MB
  • 複数ページの文書を処理する場合には、さらに1ページごとに追加で15MBが必要。

その他要件

  • TWAIN対応のスキャナ、デジタルカメラ、またはファックスモデム(スキャンまたは画像インポート用)
  • GUIを介したパターン学習、辞書編集、スキャンを実現する場合: ビデオカードとモニタ(解像度 1024×768以上)
  • Microsoft® Internet Explorer 8.0以上がインストールされていること。 フォントを正しく認識するため、文書に含まれるフォントがインストールされていること。

ABBYY SDK 12ライセンスサービス要件

ハードウェア

x86互換プロセッサを搭載したPC(1GHz以上)

オペレーティングシステム

  • Windows Server 2016、Windows Server 2012 R2、Windows Server 2012、Windows Server 2008 R2
  • Windows 10, Windows 8.1, Windows 8, Windows 7 SP1

ABBYY SDK 12ライセンスサービスは、以下の仮想環境で試験済みです。

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

開発ツール

Windowsのアプリケーションプログラミングインターフェース(API)向けABBYY FineReader EngineはCOM規格に準拠し、C/C++、Visual Basic、.NET、Delphi、Javaを始め、COMコンポーネントに対応するあらゆる開発ツールで使用できます。 また、VBS、JS、Perlなどのスクリプト言語で使用できるよう適応させることも可能です。

Linux向けABBYY FineReader Engine 12は、glibcのバージョン2.11以上向けに設計されています。 これより古いバージョンのglibcでABBYY FineReader Engineを使用する場合には、ABBYYオフィスまでお問い合わせください。 FineReader Engineダイナミックライブラリでは、標準のlibstdc++.so.6、libgcc_s.so.1およびlibgomp.so.1ライブラリを使用する必要があります。

ハードウェア

x86互換プロセッサを搭載したPC(1GHz以上)、SSEおよびSSE2命令セットに対応するものs

オペレーティングシステム

  • Fedora 30, 29, 28
  • Red Hat Enterprise Linux 7.6, 6.10
  • SUSE Linux Enterprise Server 15, 12 SP3, 11 SP4
  • Debian GNU/Linux 9.9, 8.11
  • Ubuntu 19.04, 18.10, 18.04.2 LTS, 16.04.6 LTS, 14.04.6 LTS
  • CentOS 7.6, 6.10
  • ALT Linux 8.2(Wibuドングル非対応)
  • Amazon Linux AMI 2018.03

さらにABBYYでは、上記以外のプラットフォームに対応するためのプロフェッショナルサービスもご提供しています。

試験済みクラウドおよび仮想環境

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

ABBYY FineReader Engineは、対応するプラットフォーム上のDockerコンテナでも稼働できます。

ABBYY FineReader Engine Javaラッパーは、次のJava開発キットでテストされています。

  • OpenJDK 11.0.2 x64
  • Oracle Java SE Development Kit 8u201 x64
  • Oracle Java SE Development Kit 8u202 x64
  • Oracle Java SE Development Kit 11.0.2 x64

メモリ

  • 単ページ文書の処理 — RAM 400MB以上(推奨 1GB以上)
  • 複数ページ文書の処理 — RAM 1GB以上(推奨 1.5GB以上)
  • 並列処理 — 各コアで RAM 450MB + 350MB
  • 日本語、中国語、韓国語、アラビア語の文書を並列処理 — 各コアで RAM 750MB + 850MB

ハードディスク容量

ライブラリのインストールに2,150MB、プログラムの動作に100MB、複数ページの文書を処理する場合には、さらに1ページごとに追加で15MBが必要。

その他要件

  • Tmpfsサイズ — 4GB + 1GB × コアの数
  • Swapサイズ — 4GB + 1GB × コアの数
  • ABBYY FineReader Engineはsystemd initシステムに対応
  • フォントを正しく認識するため、文書に含まれるフォントがインストールされていること。

開発ツール

Linux向けABBYY FineReader EngineではC/C++のネイティブAPIおよびJavaのラッパーを提供しているため、アプリケーションはC/C++またはJavaを使って書く必要があります。

ハードウェア

Intelプロセッサ(x86)を搭載したPC(1GHz以上)。

オペレーティングシステム

Mac OS X(10.12.x、10.13.x)。

メモリ

  • 単ページ文書の処理 — RAM 400MB以上(推奨 1GB以上)
  • 複数ページ文書の処理 — RAM 1GB以上(推奨 1.5GB以上)

ハードディスク容量

ライブラリのインストールに1GB、プログラムの動作に100MB、複数ページの文書を処理する場合には、さらに1ページごとに追加で15MBが必要。

フォントを正しく認識するため、文書に含まれるフォントがインストールされていること。

開発ツール

OS X向けバージョンではC/C++ネイティブAPI以外は提供していません。そのため、ソフトウェアはC/C++を使って書く必要があります。

認識対応言語

ABBYY FineReader Engine 12は市場最大の認識対応言語数を誇ります。 ラテン、キリル、ギリシャ、アルメニアの各文字を使用する言語はもちろん、日本語、中国語、韓国語、アラビア語、ビルマ語(テクニカルプレビュー版)、ペルシア語、ヘブライ語、タイ語などの言語にも対応しています。 認識精度をさらに向上するため、数多くの言語で辞書も内蔵しています。 珍しい単語やあまり使用されないフォントも確実に認識できるよう、小さなユーティリティを内蔵し、独自辞書の実装や独自の文字パターンの作成が可能です。

さらに、17世紀から19世紀の間に印刷された英語、フランス語、ドイツ語、イタリア語、スペイン語の古文書、人工言語(エスペラント、インターリングア、イド、オクツィデンタル)、プログラミング言語(BASIC、C/C++、COBOL、Fortran、Java、Pascal)、簡単な化学式や標準種の数字も認識します。

× 辞書対応言語

アブハズ語
アディゲ語
アフリカーンス語
アグール語
アルバニア語
アルタイ語
アラビア語(サウジアラビア)×
アルメニア語(東)×
アルメニア語(グラバール)×
アルメニア語(西)×
アヴァル語
アイマラ語
アゼルバイジャン語(キリル文字)
アゼルバイジャン語(ラテン文字)×
バシキール語×
BASIC(プログラミング言語)
バスク語
ベラルーシ語
ベンバ語
ブラックフット語
ブルトン語
ブゴトゥ語
ブルガリア語×
ビルマ語(テクニカルプレビュー版)
ブリヤート語
C/C++(プログラミング言語)
カタルーニャ語×
チャモロ語
チェチェン語
簡単な化学式
簡単な数式(Windows向けのみ)
中国語(簡体字)
中国語(繁体字)
チュクチ語
チュヴァシュ語
MICR(CMC-7)フォント
COBOL(プログラミング言語)
コルシカ語
クリミア・タタール語
クロアチア語×
クロー語
チェコ語×
デンマーク語×
ダルギン語
数字
ドンガン語
オランダ語(オランダ)×
オランダ語(ベルギー)×
MICR(E-13B)フォント
英語×
エスキモー語(キリル文字)
エスキモー語(ラテン文字)
エスペラント
エストニア語×
エヴェン語
エヴェンキ語
フェロー語
ペルシャ語×
フィジー語
フィンランド語×
Fortran(プログラミング言語)
フランス語×
フリジア語
フリウリ語
スコットランド・ゲール語
ガガウズ語
ガリシア語
グルジア語(Windows向けのみ)
ドイツ語×
ドイツ語(ルクセンブルク)
ドイツ語(新正書法)×
ギリシャ語×
グアラニ語
ハニ語
ハウサ語
ハワイ語
ヘブライ語×
ハンガリー語×
アイスランド語
イド語
インドネシア語×
イングーシ語
インターリングア
アイルランド語
イタリア語×
日本語×
日本語(現代)×
Java(プログラミング言語)
カバルド語
カルムイク語
カラチャイ・バルカル語
カラカルパク語
カシューブ語
カワ語
カザフ語
ハカス語
ハンティ語
キクユ語
キルギス語
コンゴ語
韓国語×
韓国語(ハングル)×
コリャーク語
クペレ語
クミク語
クルド語
ラク語
サーミ語(ラップ語)
ラテン語×
ラトビア語×
ラトビア語(ゴシック体で記載)
レズギ語
リトアニア語×
ルバ語
マケドニア語
マラガシ語
マレー語
マリンケ語
マルタ語
マンシ語
マオリ語
マリ語
マヤ語
ミャオ語
ミナンカバウ語
モホーク語
モンゴル語
モルドビン語
ナワトル語
ネネツ語
ニヴフ語
ノガイ語
ノルウェー語×
ノルウェー語(ブークモール)×
ノルウェー語(ニーノシュク)×
ニャンジャ語
オクツィデンタル
OCR-Aフォント
OCR-Bフォント
オジブウェー語
古英語×
古フランス語×
古ドイツ語×
古イタリア語×
古スラブ語×
古スペイン語×
オセット語
パピアメント語
Pascal(プログラミング言語)
トク・ピシン語
ポーランド語×
ポルトガル語(ブラジル)×
ポルトガル語(ポルトガル)×
プロバンス語
ケチュア語
レト・ロマン語
ルーマニア語
ルーマニア語(モルドバ)
ロマ語×
ルワンダ語
ルンディ語
ロシア語(旧正書法)×
ロシア語×
ロシア語(アクセント記号付き)×
サモア語
セリクプ語
セルビア語(キリル文字)
セルビア語(ラテン文字)
ショナ語
スー語(ダコタ語)
スロバキア語×
スロベニア語×
ソマリ語
ソルブ語
ソト語
スペイン語×
スンダ語
スワヒリ語
スワジ語
スウェーデン語×
タバサラン語
タガログ語
タヒチ語
タジク語
タタール語×
タイ語×
チンプオ語
トンガ語
ツワナ語
トルコ語×
ジンポ語
トルクメン語
トルクメン語(ラテン文字)
トゥヴァ語
ウドムルト語
ウイグル語(キリル文字)
ウイグル語(ラテン文字)
ウクライナ語×
ウズベク語(キリル文字)
ウズベク語(ラテン文字)
ベトナム語×
セブアノ語
ウェールズ語
ウォロフ語
コーサ語
ヤクート語
サポテク語
イディッシュ語
ズールー語
アフリカーンス語
アルバニア語
アラビア語(サウジアラビア)
アイマラ語
アゼルバイジャン語(ラテン文字)
バスク語
ベンバ語
ブラックフット語
ブルトン語
ブゴトゥ語
ブルガリア語
ブリヤート語
チャモロ語
クリミア・タタール語
クロアチア語
クロー語
チェコ語
デンマーク語
数字
オランダ語(オランダ)
オランダ語(ベルギー)
英語
エストニア語
エヴェン語
エヴェンキ語
フィジー語
フィンランド語
フランス語
フリジア語
フリウリ語
スコットランド・ゲール語
ガリシア語
ガンダ語
ドイツ語
ドイツ語(ルクセンブルク)
ドイツ語(新正書法)
ギリシャ語
グアラニ語
ハニ語
ハワイ語
ハンガリー語
イド語
インドネシア語
インターリングア
アイルランド語
イタリア語
カラチャイ・バルカル語
カシューブ語
カワ語
カザフ語
キルギス語
コンゴ語
クペレ語
クミク語
クルド語
サーミ語(ラップ語)
ラテン語
ラトビア語
リトアニア語
ルバ語
マラガシ語
マリンケ語
マオリ語
マヤ語
ミャオ語
ミナンカバウ語
モホーク語
モンゴル語
モルドビン語
ナワトル語
ネネツ語
ニヴフ語
ノガイ語
ノルウェー語
ノルウェー語(ブークモール)
ノルウェー語(ニーノシュク)
ニャンジャ語
オジブウェー語
古英語
古フランス語
古ドイツ語
古イタリア語
古スペイン語
パピアメント語
トク・ピシン語
ポーランド語
ポルトガル語(ブラジル)
ポルトガル語(ポルトガル)
ケチュア語
レト・ロマン語
ルーマニア語
ルーマニア語(モルドバ)
ロマ語
ルワンダ語
ルンディ語
ロシア語
サモア語
セリクプ語
セルビア語(キリル文字)
セルビア語(ラテン文字)
スー語(ダコタ語)
スロバキア語
スロベニア語
ソマリ語
ソト語
スペイン語
スワヒリ語
スワジ語
スウェーデン語
タガログ語
タヒチ語
タジク語
チンプオ語
トンガ語
ツワナ語
トルコ語
トルクメン語(ラテン文字)
トゥヴァ語
ウイグル語(ラテン文字)
ウクライナ語
ウズベク語(ラテン文字)
セブアノ語
ウォロフ語
コーサ語
サポテク語
ズールー語

* アラビア語ICRには対応していませんが、手書きのアラビア数字は認識可能です。

中国語(簡体字)
中国語(繁体字)
チェコ語
デンマーク語
オランダ語(オランダ)
英語
エストニア語
フィンランド語
フランス語
ドイツ語
ギリシャ語
ハンガリー語
インドネシア語
イタリア語
日本語
韓国語
ノルウェー語
ノルウェー語(ブークモール)
ノルウェー語(ニーノシュク)
ポーランド語
ポルトガル語(ブラジル)
ポルトガル語(ポルトガル)
ロシア語
スペイン語
スウェーデン語
トルコ語
ウクライナ語

*WindowsとLinuxのバージョンは210のOCR言語を提供しています。 Mac版は208のOCR言語を提供しています。

ユーザーインターフェイス言語

エラーメッセージや役に立つ情報、警告表示などのメッセージボックスは次の言語に対応しています。英語、ブルガリア語、チェコ語、中国語(簡体字・繁体字)、デンマーク語、オランダ語、エストニア語、フランス語、ドイツ語、ギリシャ語、ハンガリー語、イタリア語、日本語、韓国語、ポーランド語、ポルトガル語(ブラジル)、ロシア語、スロバキア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語。

Officeの入力フォーマットもサポート

ABBYY FineReader Engineは、以下のフォーマットの文書データを開くことができます:

  • テキストフォーマット: formats .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • テーブル(表)フォーマット: .xls, .xlsx, .ods
  • プレゼンテーションフォーマット: .ppt, .pptx, .odp
  • PDFデータ: .pdf

注:この機能は、Windows向けABBYY FineReader Engine および Linux向けABBYY FineReader Engineで利用できます。 現在、Mac向けABBYY FineReader Engineではサポートされていません。

対応画像形式(開く、保存)

ABBYY FineReader Engineでは様々な形式の画像ファイルを開くことができ、認識結果の保存も数種類の形式の中から選択できます。

対応画像形式一覧

形式 拡張子 開く 保存
BMP
非圧縮モノクロ
4、8ビット — 非圧縮パレット
16ビット — 非圧縮、非圧縮マスク
24ビット — 非圧縮
32ビット — 非圧縮、非圧縮マスク
bmp    
BMP
4、8ビット — RLE圧縮パレット
bmp    
DCX
モノクロ
2、4、8ビットパレット
24ビットカラー
dcx    
DjVu(Windows 向け仕様のみ)
モノクロ、グレースケール、カラー
djvu, djv    
GIF
モノクロ — LZW圧縮
2、3、4、5、6、7、8ビットパレット — LZW圧縮
gif    
JBIG2
モノクロ
jb2    
JPEG
グレースケール、カラー
jpg, jpeg, jfif    
JPEG 2000
グレースケール — Part 1
カラー — Part 1
jp2, jpc, j2k    
PCX
モノクロ
2、4、8ビットパレット
24ビットカラー
pcx    
画像PDF(スキャンしたPDF) pdf    
デジタル作成したPDF(バージョン1.7以前) pdf    
PNG
モノクロ、グレースケール、カラー
png    
TIFF
モノクロ — 非圧縮、CCITT3、CCITT4、Packbits、ZIP、LZW
グレースケール — 非圧縮、Packbits、JPEG、ZIP、LZW
24ビットカラー — 非圧縮、JPEG、ZIP、LZW
1、4、8ビットパレット — 非圧縮、Packbits、ZIP、LZW
(複数ページのTIFFを含む)
tif, tiff    
TIFF
モノクロ — CCITT3FAX
tif, tiff    
WDP(Windows向け仕様のみ)
モノクロ、グレースケール、カラー
(WICまたはMicrosoft .NET Framework 3.0が必要となります)
Wdp    
WIC互換(Windows向け仕様のみ)
(WICまたはMicrosoft .NET Framework 3.0が必要となります)
     

注意: ABBYY FineReader Engineでは32512×32512画素を超える画像は開けません。

対応文書保存形式

ABBYY FineReader Engineでは、認識したテキストを以下の形式で保存できます。

  • RTF
  • DOCX
  • XLSXとXLS(Windows向け仕様のみ)

    XLS形式で保存する場合、FineReader EngineはMS Excel 5および 8の形式に対応しています。

  • PPTX
  • PDF, PDF 2.0、 PDF/UA
  • PDF/A-1 (a、b)、PDF/A-2 (a、b、u)、PDF/A-3 (a、b、u)

    FineReader Engineは、あらゆるPDF形式でMRC圧縮に対応しています。

  • HTML、HTML 5

    FineReader Engineは様々なコードページ(Windows、DOS、Mac、ISO)およびUnicode(UTF-16、UTF-8)に対応しています。

  • TXT

    FineReader Engineは様々なコードページ(Windows、DOS、Mac、ISO)およびUnicode(UTF-16、UTF-8)に対応しています。

  • CSV
  • XML — このファイル形式では、認識されたテキストの構造はXMLタグを使って記述されています。
  • ALTO 3.1
  • XPS(Windows向け仕様のみ)
  • FB2
  • EPUB
  • ODT
  • vCard — 名刺のエクスポートのみ

対応バーコードタイプ

ABBYY FineReader Engineは以下のタイプのバーコードを読み取ります。

  • 1次元: Codabar、Code 128、Code 39、Code 93、Code 32、EAN 8および13、Full ASCII Code 39、GS1-128、IATA 2 of 5、Industrial 2 of 5、Interleaved 2 of 5、Intelligent Mail(別名USPS 4-CB)、Matrix 2 of 5、Patch、PostNet、UPC-A、UPC-E。
  • 2次元: Aztec、Data Matrix、MaxiCode、PDF 417、QRコード。

機械可読領域(MRZ)からデータの抽出

ABBYY FineReader Engineは、身分証明書や旅行用文書から機械可読領域(MRZ)を検出します。そして、IC旅券規格(ICAO Doc 9303)に準拠してコード化されたデータを抽出します。

OCRエンジンは、次の両タイプのMRZの機械可読データを抽出することができます:

  • 2行タイプ
  • 3行タイプ

次のデータを抽出することができます:

  • MRZ内の行数
  • 各行の全ての文字
  • 各行の追加データ
  • 身分証明書の各種タイプおよびサブタイプ
  • 身分証明書の番号
  • 発行国コード
  • 有効期限満了日
  • 名字および全ての記載された名前
  • 国籍
  • 生年月日および性別
  • 個人番号

OCRエンジンは抽出した数値に加えて、チェックデジットがある場合は各値のチェックデジットも抽出します。 データ抽出クオリティーの情報を提供するために、ブーリアン型の数値を用いています。この数値は、各個別の数値の合計がチェックディジットと合致するかどうかを特定するために使用されます。

注:この機能は、Windows向けABBYY FineReader Engine および Linux向けABBYY FineReader Engineで利用できます。 現在、Mac向けABBYY FineReader Engineではサポートされていません。

光学式マーク認識(OMR)

ABBYY FineReader Engineではシンプルなチェックマークはもちろん、グループ化されたチェックマーク、モデルチェックマーク、手で修正されたチェックマークを読み取ります。

  • 枠が四角のチェックマーク
  • 背景に何もないチェックマーク
  • 非標準チェックマーク(このタイプでは事前学習が必要です)

注:この機能は、FineReader Engine for Windows および FineReader Engine for Linuxで利用できます。 現在、ABBYY FineReader Engine for Macではサポートされていません。

上記以外の技術情報については、ABBYY.technologyまたは ABBYY FineReader Engineのヘルプファイルをご覧ください。

デモの依頼

お試しになりたいですか?もっと詳しい情報が必要ですか?下記のフォームにご入力いただければ、こちらから速やかにご連絡いたします。

I am aware that I can revoke my consent entirely or in part at any time with effect for the future.

To revoke your consent, please go to unsubscribe webpage or send email at dataprotection@abbyy.com.

このフォームを送信することで、私はプライバシーポリシーに記載されている目的に沿って自分の個人情報が使用されることに同意します。

ABBYY 製品 の お 問 合 せ あ り が と う ご ざ い ま す!

担当者より最短でご連絡差し上げますので少しお待ち下さい。ABBYYオフィスに直接ご連絡を取りたい場合はコンタクトページを参照下さい。

ABBYY ジ ャ パ ン 株式会社