人間の癖、OCRの癖

控除証明書の記載事項を読み取る作業に、今年はOCRを活用することを計画しています。
従来は、2人の人間が、AIのサポートを受けながら、目視で読み取って入力していました。いわゆるダブルエントリーです。

これをOCRと目視の組み合わせによるダブルエントリーに変更しようという試みです。
これまで行なってきた様々な検証作業の結果は良好です。

OCRと目視の組み合わせに私が期待していることは、正確性の向上です。
人間の目視の癖と、OCRの癖はまったく異なっています。これらを組み合わせることで、正確性の向上が期待できます。

たとえば、OCRは見落としというエラーを起こしません。読み間違いはあるのですが、そこに文字や数字があるのに見落とすというエラーは起こさないのです。
しかし人間は、集中力が欠如してくると、見落としというエラーが頻発します。

一方でOCRは、読み取るべき保険料の横に手書きのチェックマークが入っていたら、それを「1」と読んでしまいます。しかし人間は、印字と手書きを混在させることはありません。

Mominonkiは、目視とOCRの特質を組み合わせ、100%正確な読み取りを目指します。

2021年10月1日