失敗から学ぶ3つのAI OCR自動化ポイント

なぜOCR導入はうまくいかないのか

働き方改革や業務自動化の一環として多くの企業がAI OCRを採用、導入しています。ところが実際に導入された企業において、読み取り精度(識字率)やAI自動学習、設定の簡便さといった特徴ばかりを気にしすぎた為に、当初予定していたOCR業務プロセスがうまく回らずに、利用をやめるケースがあります。

OCRの検討段階では気づきにくい、OCRによる働き方改革や業務自動化を実現する上で注意すべきポイントについてご紹介いたします。

OCR導入に失敗する要因その1:文書レイアウトに起因する問題

OCR導入の失敗には、3つの系統的な要因が見られます。その一つとして挙げられるのは、文書レイアウトに起因する問題です。

文書レイアウトに起因する問題は様々ですが、ここではよくある要因を3つ挙げたいと思います。

  • AI自動学習では正確に領域を特定できない
  • ノイズのある文書が読めない
  • 異なる種類の文書をひとつのまとまりとして扱えない

一つ目は、「AI自動学習では正確に領域を特定できない」ということです。昨今のOCRはAIによる自動学習にて抽出項目を構成する機能があります。AI自動学習は読み取りたい帳票を準備するだけで良く、人の手による細かな設定が不要のため人気ですが、少し複雑になるととたんに抽出できなくなります。例えば下表はデリバリコードが5つリストされており、概要では、それぞれのコードごとに数量、生産国などの属性値が表記される表です。デリバリコード数は帳票により増減しますが、属性値の数もアイテムにより増減するような表です。このような表はAI自動学習で項目を構成するのは難しく、確実に抽出できるような他の方法が必要になります。

AIOCR自動化を成功させる方法

2つ目は、「ノイズのある文書が読めない」というものです。請求書などの会社発行の書類では、自社情報の付近に押印されているケースがあります。このような押印が会社情報に被ると会社情報を抽出するのが難しくなります。画像処理により押印部分を除去することで改善、解決することができますが、OCR製品によっては画像処理を行えないものがあります。

3つ目は、OCR製品の多くは「異なる種類の文書をひとつのまとまりとして扱えない」というものです。申請業務などでは、申請書の他に免許証やパスポートの写しなど本人確認の書類が付属することがあります。また自動振込の依頼書などその他の書類が添付されることも良くあります。世の中にはフォーマットが別々でも同一処理を行う必要性のある書類群が存在しますが、OCRは一般的にページ単位や書類単位で処理されるため、

繋がりを考慮しない処理しかできないケースがあります。先ほどの例で申しますと、本来であれば異なる種類の申請書に記載のある氏名と本人確認書類の氏名が一致しているか、など書類間で確認すべき事項があっても、繋がりを意識できないOCR製品の場合は目視での確認のみに留まります。

OCR導入に失敗する要因その2:業務利用に起因する問題

二つ目に挙げられるのは、業務利用を検討する際に発生する問題です。

こちらも同様に様々な問題がありますが、よくある要因として3つ挙げます。

  • 秘匿性の担保
  • パフォーマンスと拡張性
  • セキュリティと接続性

一つ目は、「秘匿性の担保」です。個人情報や会社の機密情報が記載されている帳票は、部分的に隠してOCR処理したい場合があります。部分的に隠す=墨消しが求められるケースとして2つほど例を挙げますと、OCR結果を検証するオペレータにその他情報を見せたくない場合や、検証者には検証のため見せても良いが出力結果では墨消ししたい、といったケースがそれにあたります。このように情報を隠匿できないと情報漏洩に繋がることが考えられます。

AIOCR自動化を成功させる方法

また秘匿性という観点では、OCR処理内容を他の部署に見せたくないなど、部門ごとのセキュリティが求められるケースもあります。この場合はテナント機能により部門ごとに作業領域を区分けできることが重要です。

AIOCR自動化を成功させる方法

3つ目は、「セキュリティと接続性」です。OCR処理を行う帳票には、個人情報や会社の機密情報が含まれることが多々あります。OCR製品の選択では、充分なセキュリティを保てない、あるいは社内のセキュリティ基準を満たせない場合が無いか検討が必要です。

また、社内の認証手続きに合致しない、社内ネットワーク基準に干渉するためアクセスできない、といったことが無いように、シングルサインオンや多段階認証への対応であるとか様々なシステムとの接続性にも事前に目を向ける必要があります。

OCR導入に失敗する要因その3:ワークフローに起因する問題

三つ目に挙げられるのは、求められるフローを実現できない問題です。

こちらは導入後の問題というよりも、利用したい機能があるにも関わらず選択する製品によっては実現できないことがあるという検討段階の問題です。よくある要因として3つ挙げます。

  • 手元の紙情報を自動でWebフォームへ入力したい
  • 外部エンジンや外部データと連携したい
  • 自社プロセスに沿った挙動にしたい

一つ目は、「手元の紙情報を自動でWebフォームへ入力したい」という要望です。窓口業務などで、免許証などの本人確認書類をスマホやタブレットで撮影して、そのままフォームへの入力へつなげたいという要望を頂くことがあります。この場合、OCR処理だけでなく、スマホやタブレットとの連携や業務アプリケーションと連携できることがOCR製品に求められます。

2つ目は、「外部エンジンや外部データと連携したい」という要望です。会社名に紐づく会社コードのように、紙面上の情報だけでなくそれに紐づく別の情報を出力したいというケースがあります。この場合はマスターデータで会社名を突き合わせて会社コードを持ってくるような挙動が必要になります。また、OCR処理する場合に単一のOCRエンジンだけでなく、複数のOCRエンジンを利用したいという要望を頂くことがあります。

このようにOCR処理が内部で閉じることなく、利用形態に合わせて外部エンジンや外部データと連携することが必要になる場合があります。

3つ目は、「自社プロセスに沿った挙動にしたい」という要望です。通常のOCR処理は、1. 文書の投入(スキャン)、2. 仕分けやOCR処理(認識)、3. オペレータによる目視検証、4. データの出力、という4つのステップを経て処理されていきます。それに対して、例えば文書に書かれた情報によって並び替えたいとか、出力は検証結果が承認されてから処理をしたいという要望があるとフローを変更する必要があります。このようにフローを柔軟に変更できる否かはOCR製品の作りに依存します。

AIOCR自動化を成功させる方法

AI OCRの自動化で失敗しないためには

今まで見てきたように、OCR導入とその自動化は、「識字率、AI自動学習、簡単さ」といったOCRそのものの性能・特徴だけではなく、「文書レイアウトへ柔軟に対応できるのか、業務での利用に耐えうる製品か、望むフローを構成できるのか」といった領域についても考慮することが重要です。

本コラムでは、OCR導入と自動化についての評価ポイントについて紹介しました。これらのポイントを踏まえ、適切なソリューションを選定することが非常に重要となります。また、ABBYY FlexiCapture がご評価の選択肢となるような場合は、是非弊社までご連絡いただければ幸いです。

お問い合わせ

※ ABBYY FlexiCaptureについての概要は、ABBYY FlexiCapture 12紹介 – はじめの一歩 をご参照ください。

Content Intelligence DX(デジタルトランスフォーメーション) OCR(文字認識) エンタープライズ

ブログのアップデートを購読

購読登録が正常に完了しました。メールボックスにメールが届いておりますのでご確認下さい。数分待ってもメールが届かないようでしたら、迷惑メールボックスをご確認頂けますと幸いです。

私は、ABBYY Solutions Ltd.から送信されるEメールに記載された配信停止リンクをクリックするか、またはABBYYデータ主体アクセス権利フォームを介していつでも同意を取り消すことができることを理解しています。

このフォームを送信することで、私はプライバシーポリシーに記載されている目的に沿って自分の個人情報が使用されることに同意します。

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約が適用されます。

サブスクリプションが無事完了しました!

SNSでつながりましょう