{site_name}

オペレーションを進化させる
現場のWEBマガジン
【実録】知らなきゃソン!AI-OCR活用における3つのポイント
  • #AIーOCR
  • #AI
  • #デジタルトランスフォーメーション

DIGITAL

MT

2021.10.06

これまで、AI-OCRを活用する際のポイントの紹介や、AI-OCRの今後など様々な側面からAI-OCRをご紹介する記事を掲載してきました。

今回の記事では、AI-OCRを利用している実際の業務事例とともに、AI-OCRを利用する上で抑えておきたいポイントをご紹介します。

AI-OCR業務における3つの“ポイント”

今回、ご紹介する、実業務事例を通じたAI-OCR導入の“ポイント“は、どのような業務においても共通しており、しっかりと把握できていないと、AI-OCR導入に失敗する・上手く活用できない3点をピックアップしました。

逆に言えば、この3点のポイントを理解し、AI-OCRを導入した業務では、総じて高い効率性を実現しています。

ということで見ていきましょう。

ポイント①:エントリーツールとして便利

AI-OCRは、実はエントリーツールとして便利である、ということは導入によって最も効果を感じられるポイントかもしれません。AI-OCRをOCRツールではなく、エントリーツールとして捉える事で処理速度の向上や、ミスの抑止にもつながります。

『AIが文字を読み取るのだから処理速度が上がって当たり前だろう』と思われる方も多いでしょう。勿論、“読取”による効率化は多分にありますが、今回は“エントリーツール”としての有効性に着目します。

一般的に、データエントリーの業務では、エントリー対象物の書類原本を手元に用意するか、PDFなどの画像データを画面に表示しながら、エントリー先(エクセル等のツールや、基幹システム)に作業者(オペレーター)が入力をしていく流れになります。

AI-OCR、我々が導入しているDX Suiteがエントリーツールとして優れているのは、この「対象書類」と「入力箇所(エントリー先)」が同一の画面(UI)で表示される事に加え、書類上の情報記載箇所が入力箇所毎に表示される点です。

以下を見ていただくと、とても入力のしやすいUIになっていることがお分かりいただけると思います。


図1.参考画像 DX Suiteエントリー画面イメージ

データエントリー業務では、書類上に記載されている情報を間違いなく、対象の入力箇所に入力していく事が最も重要になります。そのため、熟達したオペレーターでも目線の動きは「対象書類」→「入力箇所」と流れ、“情報を正しく入力する“という作業に集中することになり、目線を動かす距離が短ければ短いほど、生産性を高められるのです。

DX Suiteでは、この目線の動きが「入力箇所」近辺で完結し、目線を動かす距離を最小限として、“情報の妥当性”に意識を配る事ができます。例えば、通常のエントリーの場合は10桁の数字を入力する際、入力値が“10桁あるか”“数字の並びは間違えていないか”と何回か書類を確認する事もあるでしょう。DX Suiteの場合、この目線の動きが短縮され、効率的に入力作業を行う事が出来ます。

また、図1のように入力箇所(AI-OCR読取項目)があらかじめ決まった順番で設定されている事も効率的な処理につながっています。

決められた順番で入力項目が設定されていることで、『「フリガナ」の次は「銀行名」だな』と予測しながら処理を行う事ができます。

この入力者の“予測”により入力箇所もしくは書類上の記載情報の妥当性を鑑みた処理が可能になります。『「銀行名」は必ず記載されるはずなのに入力がないor銀行名と全く関係のない情報が入っている』といった具合です。
これは、通常のエントリー作業と比較して、一歩先の工程から作業に取り掛かる事が出来る、という事になります。


更に、ミス抑止という面においてエントリー業務のミスの要因として多いのは、「入力箇所を間違える」「入力を飛ばしてしまう(書類上の情報を読み飛ばしてしまう)」ではないでしょうか。

このようなミスの要因に対して、エントリーツールとしてのDX Suiteは多いに活用が可能です。そもそも、入力項目はすでに決められているため、項目を間違えて入力することは発生しえないからです。

さて、ここまでご紹介した内容は、エントリーシステムを使えば当たり前な事だとお考えの方もいらっしゃるでしょう。勿論その通りです。

ただし、ご紹介をしているのはAI-OCRですので、ここに“AIの読取”という最大の特徴が付きます。このAIによる読取が、人間がエントリーをする際の“目線移動の簡素化”や、“(次の)入力箇所の予測を平行して作業すること”を助け、効率的な入力処理を実現しています。

ポイント②:多種請求書データ化業務

続いてご紹介するのは、数百種類に及ぶ請求書のデータ化業務にAI-OCRを導入している業務の事例となります。
また、本業務で取り扱う請求書は1種類あたり多くて100枚、少なければ数枚といった、いわゆる“少量多種”な書類となります。

つまり、少量多種帳票を取り扱う業務でも十分な効果を発揮できるという事です。

AI-OCRは帳票の設定が必要なので、少量多種な書類の場合、種類ごとに帳票設定が必要となります。そのため、AI-OCRは向かないのではないか、とも取れます。

しかし、その設定を行ってまでも得られるメリットが生じるケースがあります。

まず、帳票設定をしてでも、手作業によるエントリーよりもAI-OCRを使う方が効率的、という点があげられます。実際に手作業でこの請求書を処理したケースとAI-OCRでエントリーしたケースを比較すると倍近く生産性(1時間当たりの処理枚数)の実績が出ています。

合わせて、もう1点それでAI-OCRを活用することで、帳票のマージが簡単になるという点があげられます。
仮に、AI-OCRを使用しないエントリー業務の場合、どのように処理を行うでしょうか。
受領した対象書類を仕分けずに順次取り掛かり、複数のオペレーターでデータ化を行ったとします。

しかし、納品時には、各オペレーターが入力したデータを、帳票種類ごとにデータをマージする必要があります。そのために、出来上がったデータは、どの帳票だったのかを確認してマージをする事となります。

しかし、これだと非効率なので、2点の解決策が考えられます。①エントリーをする際に帳票種類ごとにエントリー先(エクセル等)を用意する、②どの帳票種類の処理を行ったかフラグを付与する運用とする。のどちらかです。
この場合、正しいツールを使えているのか(①の場合)、または、フラグを選択出来ているのか(②の場合)を最終的に確認する必要が出てきます。

しかし、このように入力する帳票種類を仕分けせずにオペレーターに入力してもらうことにすると、データ入力時に何かしらのフラグ付けが必要になってしまい、オペレーターの工数が増えてしまうため、結局は、最初に帳票の種類別に仕分けを行うことになります。

よって、少量多種の帳票を入力する場合以下のような工程となります。

①    帳票種類別に仕分け
②    仕分種類別にツールを選択
③    エントリー
④    結果データのマージ
⑤    最終チェック

これを、AI-OCRに置き換えた場合、残念ながら①帳票種類ごとに仕分け と③エントリーは必要となりますが、それ以外の項目は自動で対応が可能となります。


帳票種類ごとに仕分けを行い、所定のフォルダに格納する工程を設ける事で、RPAを活用し、DX Suiteの定められた設定別に自動的なアップロードが可能です。

また、エントリー終了後にCSVファイルをRPAで自動ダウンロードし、PDFファイル名等のユニークコードをキーとして、同じ帳票ごとにマージを行う事も自動化で対応が可能です。

このように、AI-OCRを導入する事で前後工程を自動化する方法論の幅が広がり、業務全体的な効率化を図る事が可能となります。

ポイント③:入力データ=“テキストデータ“の活用方法

ここまでの2つのポイントでは、AI-OCR導入により得られる効果は何なのかを把握し活用する事で、効率性を最大化できるという事に着目してきました。
最後は、これまでの対となり、このポイントを把握して導入をしなければ導入効果が薄くなるといったものです。

そのポイントとは、AI-OCR単体で得られるデータはテキストデータであり、納品データではないという事を把握できているか。また、その前提で業務フローを設計できるかという点です。

事例③でご紹介する取扱い帳票は、具体的には医療機関にて医師が手続申請書です。様々な医療機関、医師の方が記入をする事になるため、その記載方法や表現が多少なりとも変わってきます。

例えば、「日付」を記入する箇所でも「令和3年10月1日」と記載される方もいらっしゃれば、「R.3 10月1日」「2021年10月1日」「2021/10/1」と、様々なパターンが存在します。

しかし、このデータを扱う人は、往々にしてシステムに投入し使用するため、「20211001」という形式でデータ投入したいとします。この場合、AI-OCRでどのように読取をしたとしても、必要な情報への変換が必ず発生します。
このようなデータの加工は、納品データ及びそのロジックの理解、更にテキストデータの取得があってはじめて可能になってきます。

しかし、AI-OCRによって作成できるデータが納品データそのものになるという前提で業務を設計してしまうと、このようないろんな「日付形式」はイレギュラーになってしまい、効率性を低下させる結果となってしまいます。

変換することを前提に業務設計ができれば、日付があっていれば、どのような日付型でも正解であるわけです。AI-OCRの導入においては、まずAI-OCRで叶う事を正確に把握し、その前提で業務フローの設計をしていくことが必要不可欠になります。

ここまで、3つの事例を通じてAI-OCRにおけるポイントをご紹介してきました。

実は、ここまでの中でAI-OCRの話をする際の代名詞ともいえる“識字率(読取精度)”には触れておりません。
勿論、AI-OCRを利用するにあたり、識字率が高い事は、その効果を向上させる事に直結します。ですが、業務運営において、識字率の高さのみをもって効率化を図る事はできません。

事例③でご紹介した帳票では、一部の情報において非常に識字率が低い事象が発生しました。これは医療機関を特定させるユニークコードに該当する情報でしたが、記入者が入力を省略したり、走り書きでの記入により識字が上手くできませんでした。

しかし、該当情報は医療機関のユニークコードなため、同一機関であれば同一のコードが入る事になります。このことを理解した上で、複数枚帳票でも読取を行う1枚目に識字可能な状態の書類を仕分ける事で、2枚目以下の情報はコピーする運用を行う設計をしました。

これにより、この業務では1時間あたり120枚を超過する生産性での運用を実現しています。このように、前後のフローを見直す事でより効率的な運用を実現するケースもあります。

AI-OCRの識字率に捕らわれすぎてしまうと、1つの項目だけでも目標値に達しない場合、運用がうまくいかず、AI-OCR導入が失敗してしまったという経験になってしまいます。

まず重要なのは、ここまでご紹介したようなAI-OCRを1つのツールとして捉え、効率的な業務フローを設計し効果を最大限に発揮する方法論を検討する事に尽きるとこれまでの我々の実績から学んで参りました。

皆様におかれましても、損なくAI-OCR活用していただき、効果を最大化していただきたいと思っております。

ビーウィズでは「デジタル&オペレーション」として、AIをはじめとする先進的なデジタル技術を活用したオペレーションサービスをご提供しております。
最先端技術を手軽にご活用いただき、業務プロセスの効率化や品質向上のお手伝いをさせていただきます。


関連記事