2019年6月26日掲載 ICT利活用 InfoCom T&S World Trend Report

AI-OCRの現状と導入のポイント ~業務効率化で実現する働き方改革



本誌3月号の拙稿「動き出す新たな働き方改革関連法~認知度の向上とICT利活用が改革成功のカギ」で概説した主要な法令の適用が4月よりスタートした。年次有給休暇の確実な付与や時間外労働の上限規制など、企業はこの新制度への対応に追われているようだ。

こうした企業の反応にみられるように、働き方改革を「残業制限」と受け取る向きは依然少なくない。しかし、働き方改革の目指すところは「一億総活躍社会」の実現であり、そのための生産性向上こそが本質である。

本稿では、生産性・効率性を実現する具体的なICT利活用のケースとして、AI-OCRの導入の現状と取り組みのポイントについて考察する。

AI-OCRとは

OCR(光学文字認識)は、主に「活字」の文字を認識しデータ=文字コードの列として変換する技術である。キーボードに依存せず文字入力を可能とするこの技術は、モールス符号の文字変換などに応用されるなど歴史のあるテクノロジーで、主に海外で発展した。

一方日本語に関しては、漢字の読み取りが難しいことなどがあり、近年になってようやく急速に研究が進んだ。

近年起こった新たな潮流は、言わずもがな人工知能(AI)ブームである。OCRの研究が進むと、対象は「活字」から「手書き文字」へ広がった。個性を反映する、バラエティに富んだ「手書き」を画像として認識し、データへと変えるための取り組みこそがAI-OCRである。

正確には、OCRの時代にも手書き文字の認識は可能であった。1998年には、郵便局で7桁の郵便番号の読み取りと、それによる分類がOCRで行われた。ただし、それはアラビア数字の0から9の十種類の文字のみが対象であった。

OCRは、AIが筆跡を学習することで「識字率」の精度を高めた。そして、漢字を含んだ帳票の手書き文字を認識しデータ化することで、様々な業務の効率化を図るべく研究が進められた。

AI-OCRによって、紙の帳票上の文字がデータ化されると、人手をかけて転記するような業務は大幅に効率化されるだろう。さらに、RPA(ロボティック・プロセス・オートメーション)によるPC上の定型作業の自動化と合わせて、大幅な業務効率化ができるとの期待も高まっている。

事例にみる圧倒的な作業時間短縮

特に2018年以降、AI-OCRを活用した業務効率化の事例が顕著だ。中には具体的な業務効率化の程度を公開しているものもあり、多くは驚くような効果を上げている。そのいくつかの例を紹介したい。

2018年9月に、ゆうちょ銀行が投資信託の口座開設業務において、OCRおよびRPAによる業務自動化システムの運用を開始した。顧客から紙で届く口座開設申込書をスキャナーで読み取る。自動化処理により、行員が手入力で行っていた従来と比べて業務時間を3分の1に短縮できたという。

またNECは2018年11月にAI-OCRを活用した伝票処理業務の効果検証を行ったところ、人がすべてデータ入力した場合と比べ帳票入力作業時間を75%効率化できたと発表した。

さらに東京都港区では、手書きで受け付けているコミュニティバス乗車券の発行手続き業務にAI-OCRとRPAを活用し、作業時間を年間900時間削減できる予測を立てている。

AI-OCRを上手く導入することができれば、企業にとって働き方改革の切り札にもなりそうだ。

民間・自治体で注目を集めるAI-OCR

2018年はじめより、請求業務や受発注業務、金融機関における申請業務の手書き帳票入力の効率化など、AI-OCRは主に民間企業での検討や導入が進んだ。現状の実施状況としては自治体に比べ、民間の事例が圧倒的に多いと言える。

自治体への導入は2018年に実証実験としての動きがみられ、一部先述の東京都港区などの自治体が取り組み、成果を上げたことでこの事例が注目を集めている。

自治体の取り組みが企業より一歩遅れるのは、AI-OCRに限った話ではない。特にAI-OCRの場合は、手書きから読み取った情報が個人情報に準ずる場合があるため、セキュリティ面でデリケートな部分があり、導入について慎重な態度を示す自治体が多いようだ。

これだけ注目度が高まると、導入の実態が気になる。採用する企業や自治体は何をポイントに製品を選定するのだろうか。あるいはベンダーはユーザー企業に対し、何を訴求すべきであろうか。

本稿の執筆にあたり、ユーザーやベンダーの生の声を知るべく、港区のケースを手がける株式会社JSOLの武井力氏、藤田博生氏に話を伺った。

鵜呑みにできない「認識率」

株式会社JSOL 藤田 博生氏

株式会社JSOL 藤田 博生氏
(株式会社JSOL提供)

AI-OCRで注目されるポイントのひとつは、文字の認識率である。AI-OCRを提供する各社も、様々なかたちで認識率を発表している。
「活字」では90%、国産のものでは95%以上が珍しくない。「手書き」でも実測95%以上を謳うベンダーも多い。
しかし、JSOLによると導入初期には手書き文字の認識率が読み取り項目によっては60%程度ということもあるそうだ。「初期段階では、認識率が期待値に届いていなかった。」と藤田氏は話す。自治体の手書き帳票などを書くのは住民であり、達筆で書かれた申請もみられ、解読が難しい文字もあるという。
精度のカギを握るのはAIであり、どのようにチューニング、つまり学習させるかが重要になる。
特に手書き文字の認識率に関して言えば、書き手に大きく依存するものだと言えよう。

AI-OCRにおける「学習」

株式会社JSOL 武井 力氏

株式会社JSOL 武井 力氏
(株式会社JSOL提供)

では、AI-OCRにおける「学習」とはどのようなものか。JSOLの武井氏によると、①ひとつの帳票についてしっかり学習させる「ハンドメイド型」と、②特定の帳票をターゲットにせず様々なパターンを学習させていく「サービス型」があるという。
対象帳票に特化して精度を高められるのは「ハンドメイド型」で、港区で採用するのもこの形態だ。多くの、様々な字で記入される帳票をできる限り精度高く読み取るためにAIを「学習」させる。しかし、学習を自動でさせてしまうと、先程の達筆の例も学習してしまうことになり精度が鈍る。もちろん達筆をターゲットにチューニングすれば達筆に対する認識率は100%に近づくが今度は汎用性を欠き、学習結果を他帳票に活用しにくくなる。
学習させる、させないの判断をユーザー側で行うのは最初は難しい。それが達筆であると判断し学習対象から除くなど、ベンダー側はそれなりに労力が必要だ。AI-OCRの精度はベンダーが公表する実測値だけでは見定められない。むしろ、学習のための初期チューニングに依存し、それはユーザーの腕にかかっていると言えるだろう。

4つの提供形態

AI-OCRは提供形態により、クラウドサービス利用型とオンプレミス型のいずれのパターンでの利用も検討可能だ。さらにJSOLの場合は、自治体向けの広域/閉域ネットワークであるLGWAN(Local Government Wide Area Network) を介した提供も行っており、先の港区もLGWANを採用している。またLGWANでも、AIのエンジンをパブリッククラウドに置くハイブリッド型での提供もある。

図1は、JSOLが自治体での利用をイメージした4つの利用形態とその特徴を分類したものだ。どのパターンがユーザーに最適かは、ユーザー側のセキュリティポリシーと、AI-OCRエンジンの提供方式の兼ね合いで決まる。それゆえJSOLでは、特定のAI-OCR製品のみを扱うのではなく、ケースバイケースで選定できるようにしている。

AI-OCRの提供形態

【図1】AI-OCRの提供形態
(出典:株式会社JSOL)

セキュリティやコストはどうか

AI-OCRでは、時に個人に関する情報を扱うこともあるだろう。セキュリティ対策としては原則的にサーバー側でデータが暗号化されるという。

図1で示す4つの形態では、右に行くほどセキュリティは強固になるが、左へ行くほど安価で可用性が高くなる。

LGWANは地方公共団体相互を専用の回線で接続するネットワークシステムであり、インターネットには接続しない。

武井氏によると、自治体の中でもハイブリッド型を認める動きがあるという。AIエンジンがオンプレミスやLGWANにある構成では、ベンダーによるOCRの強化やメンテナンスの柔軟性に欠ける。データを効率よく学習させ、精度を高め、かつ安価に運用するにはクラウドを上手く取り込んでいく方がメリットが大きい。

クラウドサービス型の場合は、各社料金体系が明確だ。利用量に応じた課金体系が一般的で、スモールスタートが切りやすい。

一方、LGWANの場合は初期費だけで1,000万円前後となる場合もある。AI-OCRにおいては、セキュリティとコスト・可用性がトレードオフとなっている。

AI-OCRへの期待と導入のポイント

LGWANのようにイニシャルコストを想定する場合には、スモールスタートは困難だ。精度検証し、自治体の原課のどのような業務が効率化できそうか、各課の声を聞く。その上でLGWANでの運用でコストメリットがでるかを検討する。ベンダー側にはこのような対応が求められ、ユーザー側としてはこのような対応能力や実績のあるベンダーと付き合いたい。

AI-OCRは手書き文字をデータ化し、大幅な業務効率化を実現できる可能性を秘め、今すぐ検討可能な働き方改革の切り札だと言える。

しかし、事例やニュースが増えてきているからといって、安易に「手書き帳票の電子化」だけに目を向けることについては注意が必要だ。

武井氏と藤田氏は、JSOLはAI-OCRだけを提供する企業ではないという。働き方改革全体のことを一緒に考え、ICTで改善できる部分を提案し、その一部がOCRで実現されていく。これこそがAI-OCR導入の重要なポイントなのではないだろうか。

このようなICTの活用で、生産性の向上を伴う本当の意味での働き方改革が進んでいくことを、今後ますます期待したいところだ。

※この記事は会員サービス「InfoCom T&S」より一部無料で公開しているものです。

会員限定レポートの閲覧や、InfoComニューズレターの最新のレポート等を受け取れます。

ICR|株式会社情報通信総合研究所 情報通信総合研究所は情報通信のシンクタンクです。
ページの先頭へ戻る
FOLLOW US
FacebookTwitterRSS