{site_name}

オペレーションを進化させる
現場のWEBマガジン
“ひと手間”で人手間をかけないAI-OCR
  • #AIーOCR
  • #デジタルトランスフォーメーション

DIGITAL

MT

2022.01.12

2022年も始まり、2週間程度が経っております。
遅れ馳せながら皆様、新年明けましておめでとうございます。本年もどうぞ宜しくお願い致します。

皆さんは年末年始をどのようにお過ごしになりましたか。
例年思うことですが、今年もアッという間に年末年始が過ぎ去ってしまった印象です。
そんな中でも、家庭内の立場を何とか確保するため、気持ちばかりの大掃除の手伝いをするのも宿命でしょうか。

年末大掃除の代名詞、かどうかはわかりませんが、エアコンの清掃をなかなか定期的に行えない私です。半年分のホコリを見るといつもぞっとしますが、結局放ってしまいます。私の場合、横柄なものでフィルターを外して洗面台に直行してしまいます。

お湯で濡らしながら、ある程度固まったホコリをごそっとゴミ箱に入れながら、洗剤を使って洗っていく作業を繰り返し繰り返し行ってしまうんですよね。

「まずは掃除機でホコリを吸ったり、ガムテープで取ってから洗うほうが何回も洗わなくて済むし楽だよ」なんて言われます。勿論、頭ではわかっているのですが、掃除機を出したりするより何回か洗うほうが楽だし早い、なんて根拠の無い自信で取り組んでしまうんです。

そうして結果、30分くらいかけてやっとフィルターの掃除が終わる結果を毎年繰り返しています。なので、今年は半分の時間を「掃除機で先にホコリを吸う」というひと手間にさいて取り組んでみました。やっぱり早いですね。15分で綺麗になってくれました。わかっていましたとも。

掃除でも料理でも、“ひと手間”はやはり偉大です。先人の知恵というやつですから。

そんな“ひと手間”は、AI-OCR等のシステムツールを効率よく使うシーンにもあったりします。今回はそんな一見面倒くさいひと手間をかけることで、ゆくゆくの人の手間を小さくできるポイントをご紹介してみたいと思います。

AI-OCRの“ひと手間“ その神髄は帳票設定に

様々な場面でAI-OCR利用の工夫ポイントはありますが、今回は“ひと手間”がテーマですので、利用前に行わなければならない帳票の設定に着目してみたいと思います。

いくつか、実例を交えてご紹介しますが、今回は帳票設定のひと手間、中でも識字を向上させるというよりは、AI-OCRで読み取った後に人が目視で確認、修正を行う工程を効率化させるような設定のひと手間、つまりAI-OCR利用における生産性向上に繋がるひと手間のご紹介となります。


・読み飛ばし機能を活用した設定
まず、ご紹介差し上げるのは、図1のように読取対象の記入欄にあらかじめ印字が存在する帳票処理に活用できるひと手間です。
よくあるケースとしては、電話番号や日付の記入欄に「()」・「-(ハイフン)」・「/」などの記号が印字されているケースです。


これらの記号も含めてデータ化することに問題が無ければ、図1のように全体を設定するのみで問題はありません。
しかし、生成したデータの取込先システムの仕様によって、これらの記号を含めることが出来ない場合、この設定のままでは記号をエントリー時に削除するなどの対応が必要です。

もしくは、図2のように読取範囲自体を区切って設定をすることで、「()」を含まないデータを生成し、CSVデータをマージすることで数字のみのデータにするといった方法論もあります。


ですが、図1・2ともに後の工程に人の手間が発生してしまいます。
図2のケースでは、エントリー項目が増えることで生産性向上とは言えない対応になります。

ここで、“ひと手間“として、読み飛ばし設定を活用した設定方法を図3でご紹介差し上げます。


読み飛ばし設定とは、指定された範囲の読取を行わないようにする設定となり、図3の【帳票設定画面】において「()」の部分を指定している範囲に施しています。

これにより、【エントリー画面】をご覧頂くと、「()」の部分が表示されていないことが確認できます。同様に読取結果においても「()」がデータ化されません。

【帳票設定画面】をご覧頂くと、図1~3において図3が最も多くの箇所を指定しており、
指定範囲においても読み飛ばし設定を施すといった“ひと手間”をかけることになりますが、作業者がエントリーする際に、表示されている内容をそのまま確認すれば良い構造となるため、処理生産性向上に繋がります。


・一意な変換が可能なデータ加工設定の活用
続いてご紹介する“ひと手間”は、各読取項目単位で設定することが可能なデータ加工設定の活用となります。
データ加工設定は、読取及びエントリー結果に対して、一意的な変換を実行させることが可能な設定となります。変換内容については自由度が高く、ある程度任意に変換のルールを作成することが可能となります。

先ほどご紹介した読み飛ばし設定と同様に作業者が“見たまま入力“をしつつ、生成したいデータレイアウトに沿ったデータ化を可能にする機能となります。


図4でご紹介している2つの事例は、千単位区切りのカンマを削除する、「年月日」表記の日付を「yyyymmdd」に直す変換の事例となります。
【エントリー画面】では、あくまでも帳票上に表記されている内容をそのままに表示及びエントリーをすることで、生成データのみを指定の変換を経たデータに出力しています。

日付の例では、「年月日」の箇所に先ほどの読み飛ばし設定を施したとしても、生成されるデータは「2021823」となり、「mm」にするために人による入力(手間)が発生してしまいます。

このように任意の変換を施せるデータ加工設定ですが、一意的な変換に限られるため、読取結果・エントリールールに規則が無いと活用が難しいことは留意すべき点となります。
日付の例では、「年月日」を目印として「yyyymmdd」のどの数字に該当するかを指定し変換しているため、「年月日」のいずれかの文字が抜け落ちてしまうと上手く変換できないといった形になります。

しかし、規則性のある項目であれば、上記例のみではなく、「半角文字を全角文字に変換」や、「特定の文字を先頭に付与」など様々な対応が可能となっています。

今回ご紹介した2つの設定機能は、冒頭に申し上げた通り、読取精度向上に対するアプローチというより、人の手間をかけない=生産性の向上に直結するような事例でした。

実は、数年前までは読取精度を向上させるために読取範囲の大きさを調整するなどの職人芸のような設定が一定量必要でした。
ですが、現状はこういった“職人芸設定“をせずとも、一定レベルまで全体の読取精度向上がシステムのアップデートにより得られてきています。

実運用業務を通すと、読取精度向上を目指した細々とした“職人芸設定”を施すよりも、今回ご紹介差し上げたような人の手間を省略可するための設定を行うほうが、業務全体の生産性に対して大きなインパクトを与えています。

『AI-OCRなんだから読取が出来なければダメだ』と読取精度を追い求めることに躍起になるよりも、『ツールをどのように使えば人の手間をなるべくかけなくて済むか』改めて原点に立ち返り工夫することが求められてきているのかもしれません。

ビーウィズでは、手書き帳票を簡単にデジタル化する『ANNIM(アニム)』をご提供しています。

突発的な業務量の増加(データエントリ)を社外に委託する新しいタイプのBPOで、手入力の手間とコストを削減することができます。
少額サブスクリプションモデルのため、帳票量が少ない企業様でも、手軽にご利用いただけます。

詳しい資料は、以下からご覧いただけます。
https://www.bewith.net/gemba-driven/download/entry-127.html


関連記事