請求書などの紙文書やPDFファイルから必要な情報を抽出し、業務の効率化を実現する「AI-OCR」技術。近年では、その読み取り精度や適用範囲が向上し、さらに生成AIの登場により、大きな技術的進化が進みつつあります。本コラムでは、AI-OCR技術の進化と帳票受領ソリューションの普及背景を振り返りながら、リコーが提供する「適応型AI-OCR」の魅力をご紹介します。
従来のOCR(Optical Character Recognition/光学文字認識)技術は、スキャンされた文書や画像から文字情報を抽出する手段として広く活用されてきました。しかし、文字のかすれやレイアウトの違い、手書き文字への対応には限界があり、読み取り精度に課題が残っていました。
そこで登場したのがAI-OCRです。AI-OCRでは、大量の文字データ、文書データを学習したAIによって、従来では難しかった手書き文字やかすれ文字、レイアウトや表現が書式によって異なる非定型帳票の読み取りにも対応できるようになりました。
企業のデジタル化が進む中で、帳票処理業務にも変革が求められています。取引先から紙やPDFで受け取る請求書や納品書などの処理は、社内システムへの手作業での転記や確認に多くの時間と労力がかかる上に月末や月初に作業が集中することで、多くの企業にとって負担となっています。
こうした課題を解決する手段として、帳票受領ソリューションの導入が広がっており、中でも請求書処理の分野では特に普及が進んでいます。帳票受領ソリューションのデジタル化には「OCR方式」と「入力代行方式」の2つがあり、それぞれメリット、デメリットがあります。
OCR方式は、AI-OCRを活用して請求書や納品書に記載された日付や金額、取引先名などの項目をOCR技術で読み取るもので、リアルタイム対応に優れていますが、読み取った内容を人が確認・修正する工程が必要です。
一方、入力代行方式は、帳票の画像データを専用センターに送って人の手で入力してもらう仕組みです。正確なデータが得られるという利点がありますが、処理に時間とコストが掛かるうえ、会社固有の処理ルールがある場合には最終的にユーザーによる修正が必要となってしまいます。
このため、帳票受領ソリューションを導入する企業では正確さ、コスト、スピードのバランスを考慮して、自社に合った方法を選ぶことになります。
RICOH 受領請求書・RICOH 受領納品書サービスではOCR方式と入力代行方式の両方に対応しています。
RICOH 受領請求書・RICOH 受領納品書サービスで採用しているAI-OCR技術は、画像処理、OCR、帳票知識処理、学習機能によって構成されています。画像処理ではOCRに不利に作用する印影を除去すると共に、罫線など、文字列の区切りを示す情報を検出します。OCRでは手書き、活字を問わず認識できる技術によって画像からテキストデータを生成します。そして帳票知識処理では、請求書や納品書特有の単語や、法人名、適格請求書発行事業者の登録番号、金融機関名などの辞書データをもとに補正を行うと共に、税率や小計額をもとにした金額の検算と補正を行います。
また学習機能では誤った位置から抽出した場合のユーザーによる修正を学習することができると共に、会社ごとに抽出したい位置が異なる場合にも対応できます。
RICOH 受領請求書・RICOH 受領納品書サービスは、汎用的なAI-OCRでは読み取りが難しい画像であっても、上記のような工程で高精度なデジタル化を実現できますが、実際の帳票処理業務では「正確なデジタル化」だけでは対応できないケースがありました。それは企業や担当者ごとの運用により、記載内容を修正・変換して後段の基幹業務システムに入力する場合です。例えば、帳票に記載されるお客様番号や請求書番号を後段のシステムの桁数上限に合わせて一部分を削除して抽出したり、和暦の日付を西暦に変換したりする場合です。そこで、RICOH 受領請求書・RICOH 受領納品書サービスでは、ユーザーによる修正履歴などの情報を生成AI に取り込むことで、このような処理ルールに合わせた出力を事前の設定なしに実現する「適応型AI-OCR」技術を追加採用しました。生成AIとは、学習したデータをもとに、ユーザーからの指示や質問に対して回答を生成するAIです。生成AIを効果的に活用するためには、ユーザーが「プロンプト」と呼ばれる指示や命令文を適切に作成し、AIに送る必要があります。生成AIから得られる回答は、このプロンプトの内容によって大きく左右されるため、プロンプトの作成には高度な知見が求められます。しかし、すべての企業に、専門のIT部門や情報技術を熟知している担当者が存在するわけではありません。そこで、本技術では、ユーザーの修正履歴の情報収集から、その整理、生成AIへ指示をするところまでを自動で行うことで、ITの専門部門や担当者がいない企業でも簡単に生成AIを業務に活用できるようになりました。
従来の帳票受領ソリューションはOCR方式、入力代行方式ともに、文書内の情報を正確に抽出してテキスト化することを目的としていましたが、本技術では従来方式では対応が難しいユーザーの処理ルールまで反映したテキスト出力が、生成AIの活用によって可能になります。
AIを利用すればあらゆるものが完璧に自動化できるかと言うと、そうではありません。AIと聞くとすべてを正確に行えると錯覚してしまいがちですが、AIでも人間と同じようにミスをすることがあり、どうしても学習をしきれない部分や誤認識をすることがあります。そのため、実際の業務でAIを有効活用するためには、どのような目的で利用するのかを改めて確認することが重要になります。
紙の帳票を目視しながらコンピュータへ手入力していては、どうしても打ち間違いやミスが発生します。また、紙を主体とすることで、働く場所や働き方に制限がでる場合もあるでしょう。AI-OCRを利用する際には、最終的には人間による確認・修正作業が必要になりますが、データ入力を一から人が行う場合と比較して、大幅に業務でのミスや手間の軽減を図ることができます。さらに、業務の効率化だけではなく、ペーパーレスによる在宅勤務の実現や属人化防止といった効果も感じていただけるでしょう。
取引先から受け取る請求書には多種多様なフォーマットが存在し、一定の割合で手書きの請求書を受け取っている企業も多いでしょう。 「RICOH 受領請求書サービス」では、手書きも含めた様々な請求書の読み取り・データ化が可能です。ユーザーによる事前の設計は不要で、受け取った請求書の情報をAIが自動で抽出するだけでなく、仕訳や振込データの作成などの経理業務も併せて削減することができます。「紙の請求書を目視しながら手入力で会計ソフトやインターネットバンキングへ入力する」といった作業から、「AIが作成したデータを確認する作業」へ切り替えることで、支払や会計業務のミス防止にも寄与します。
取引先から受け取る納品書は、複写式伝票にドットインパクトプリンターで印刷されているものが数多く存在し、文字のかすれや印刷位置のズレ、商品コードと商品名が段組みで記載されているなど、一般的にAI-OCRでの読み取りが難しいとされています。しかし「RICOH 受領納品書サービス」では、そのような複写伝票や、段組み、手書きなど様々な納品書の読み取り・データ化が可能です。受け取った納品書の情報をAIが抽出するだけでなく、自社の商品マスターから適切な商品コードを自動で付与するなど、面倒な仕入管理システムへの入力作業も併せて削減することができます。
ぜひともこの機会にご相談、お問い合わせください。