Main content

認識精度99%!デジタル化へのカギを握るAI-OCR

ここから本文です

企業を取り巻く環境が日々大きく変化するニューノーマル時代、取引先とのやり取りの電子化は加速度的に進んでいます。また、2022年1月に施行された、改正電子帳簿保存法や、2023年10月にはインボイス制度の導入を控え、各企業の電子化に対するニーズが高まっています。本コラムでは業務のデジタル化における課題とその解決手段としてのAI-OCRの活用について解説します。

アナログな手書きや紙の複写伝票から脱却するには?

そもそもデジタル化とは、今まで手書きや紙によって管理されていた情報をコンピュータで扱えるようにすることです。これにより、業務のミス防止、スピードアップや効率化が見込めます。しかし、手書きや紙などのアナログデータをデジタル化するには手書きの帳票を目視しながら手入力でコンピュータへ入力するといった非効率的な作業が前提となるため、業務のミス防止・スピードアップ・効率化を目指すには、「アナログデータのデジタル化」という作業自体の効率化も検討していくことが重要です。
しかし、「アナログデータのデジタル化」は、取引先から紙(アナログ)で届くのか、はたまた電子(デジタル)で届くのか、またそれらのフォーマットや記載のされ方など、帳票の状態に大きく影響を受けます。例えば取引先から請求書を受け取る場合、すべてメールや電子取引サービス等を通してデジタルデータとして受け取ることができれば、その後の自社での業務処理もデジタルデータを主体として進めることができるでしょう。しかし、実際にはほとんどの企業が、メールなどのデジタルデータ以外にも、A4サイズの紙に印刷された活字やドットインパクトプリンターで印刷された不定形サイズの複写式伝票、そして手書きのような紙の請求書が郵送されるなど、アナログとデジタルが混在した帳票の管理を行っています。さらに、取引先によって帳票のサイズやフォーマットなど多種多様であり、「アナログデータのデジタル化」の作業に想像以上の負担がかかってしまったという企業も少なくありません。
取引先から届く帳票の状態に依存することなくデジタル化を推進するにはAI-OCRの導入が効果的です。「アナログデータのデジタル化」において、請求書や納品書などの帳票を目視しながら手入力でコンピュータへ入力するといった非効率的な作業ではなく、AI-OCRによりデータ化することで、入力業務に要する時間を短縮することができるでしょう。

AI-OCRの課題と選定のポイント

取引先から受け取る帳票には、メール添付のPDFファイルや、複写式伝票やA4サイズなどの紙など様々な種類があり、またそれらのフォーマットは取引先によって多種多様です。さらに、情報の記載は印刷された活字に加え、手書きも存在することでしょう。その場合、下記のようなAI-OCRを選定することがポイントとなります。

  • ● 印刷された活字でも手書きでもデータ化できる
  • ● 紙でもPDFでもデータ化できる
  • ● フォーマットがばらばらでも業務に必要なデータを自動的に抽出できる

しかし、手書きやドットインパクトプリンターによって印字された帳票は、インクの過不足などによる文字のかすれやにじみ、印刷位置のズレによって発生する用紙上の罫線との重なりなどが起こりやすく、OCRの認識精度に課題がありました。そこで、リコーが独自に開発したAI-OCR技術をご紹介します。

認識精度98.87%※1を実現したリコー独自のAI-OCR技術

リコーが開発したAI-OCR技術は、独自に膨大な量の請求書や納品書を事前にAIに学習させることで、画像や周辺の文字パターンから「取引先名」や「金額」など必要な情報が書かれている場所をAIが判断して自動的にデータを抽出することができます。また、手書き文字の認識やドットインパクトプリンターのインクリボンの消耗による文字のカスレ、印刷された帳票フォーマットと文字との位置ズレや文字重なり、インクジェットインクのにじみなどをAIが読み取り、複数の画像処理技術を適切に施すことで、帳票に記載されている「会社名」「金額」「帳票番号」「日付」「商品名」などの情報を正確に読み取ることも可能です。

画像:認識精度98.87%を実現したリコー独自のAI-OCR技術

開発したOCR技術による読み取り事例

リコーのAI-OCR技術は、画像処理、帳票知識処理、OCRによって構成されています。画像処理ではOCRに不利に作用する印影を除去すると共に、帳票上の罫線や背景色の濃淡など、文字以外の情報を検出します。帳票知識処理では、膨大な請求書や納品書から学習したデータをもとに、画像処理で検出した文字以外の情報が文字列をどのように関係づけているかを判定し、OCRに不利に作用する情報を画像処理で無効化します。またOCRでは、手書き、活字を問わず認識できる技術によって画像からテキストデータを生成し、その結果を帳票知識処理に入力します。帳票知識処理では、請求書や納品書特有の単語や、法人名、金融機関名などの辞書データをもとに文字列の区切り位置の判定や、ズレやかすれによって誤って認識した文字の補正を行うと共に、税率や小計額などをもとにした金額の検算と補正を行います。このような工程によって、汎用的なAI-OCRでは読み取りが難しい画像であっても高精度なデジタル化を実現しています。

画像:認識精度98.87%を実現したリコー独自のAI-OCR技術

※1 自社調べ。様々な業種から無作為に収集した260社分の請求書データを用いて評価 (2022/8末時点)

「RICOH 受領請求書サービス/RICOH 受領納品書サービス」導入検討ガイド

PDF版無料ダウンロード

イメージ

RICOH 受領請求書サービス/RICOH 受領納品書サービス の特長、メリット、業務改善例、製品詳細を
わかりやすくまとめた “「RICOH 受領請求書サービス/RICOH 受領納品書サービス」導入検討ガイド” を
ご用意いたしました。ぜひご一読ください!

以下のような内容を掲載しています。

  • RICOH 受領請求書サービス/RICOH 受領納品書サービスとは
  • 製品概要
  • 改善提案事例
  • サービス価格 など

関連情報