OCR
OCRは、画像、スキャンPDF、写真に含まれる文字を読み取り、検索や入力に使えるテキストへ変換する技術です。
意味
OCRはOptical Character Recognitionの略で、紙の書類、画像、PDF、写真に写った文字を読み取り、テキストデータに変換する技術です。AI活用では、請求書、領収書、申込書、現場メモ、名刺、紙の手順書をデジタル化する入口になります。
中小企業で気にする理由
中小企業では、紙書類やPDFが残っている業務が多くあります。OCRを使うと、手入力を減らし、検索や確認がしやすくなります。ただし、読み取りミスがある前提で、人が確認する工程を残すことが重要です。
業務での使いどころ
経理では、請求書や領収書の金額、日付、取引先名を読み取る場面があります。バックオフィスでは、申込書や紙の届出をテキスト化できます。建設や物流では、現場メモ、納品書、チェックシートを後から検索しやすくする用途があります。
OCRは入力を早くできますが、読み取った内容が正しいとは限りません。特に金額、日付、住所、氏名、品番、数量は誤読が起きやすいため、承認や会計処理の前に確認します。
OCRは入力を早くできますが、読み取った内容が正しいとは限りません。特に金額、日付、住所、氏名、品番、数量は誤読が起きやすいため、承認や会計処理の前に確認します。
AIと組み合わせるときの注意
OCRで読み取った文字をAIに要約させたり、分類させたりすることがあります。このとき、OCRの誤読をAIが自然な文章に直してしまい、間違いに気づきにくくなることがあります。元画像と読み取り結果を並べて確認できる運用が必要です。
個人情報や取引情報を含む書類は、保存先、閲覧権限、外部サービスへの送信可否を確認します。最初は重要度の低い社内書類から試し、経理・契約書類は確認手順を決めてから進めます。
個人情報や取引情報を含む書類は、保存先、閲覧権限、外部サービスへの送信可否を確認します。最初は重要度の低い社内書類から試し、経理・契約書類は確認手順を決めてから進めます。
確認した情報
参照先は、Microsoft Learn: Document Intelligence Read OCR model、Microsoft Learn: Read API、Google Cloud Document AI overviewです。