AIとOCRの再教育

AIとOCRは、今や普通に入手可能なテクノロジーです。
Mominokiの読取プロセスを担うAIとOCRはいずれも、特殊なものではありません。

まず大事なのは、AIとOCRというツールをどのように使って読取プロセスを効率化するのかという構想力です。
次に、構想を実現するだけの技術力。
そして最後に大事なのが、結果を検証して修正して検証する、というしつこいまでの試行錯誤だと思います。

11月初旬のMominokiはやや安全サイドに偏りすぎていました。
AIとOCRが控除証明書のレイアウトを読み取れたものは、ほぼ100%正しく読み取れていました。
しかし、読み取ることができないレイアウトの比率も高かったのです。

そこで、読み取ることができなかったレイアウトを取り上げ、何故そのレイアウトをAI+OCRが読み取れなかったのかを検証し、設定を修正してからまた検証する、というチューニングを施してきました。
しつこいチューニングのお陰で、読取精度を高く保ったまま、読み取ることができるレイアウトの割合を増加させることができました。

この設定は来年に引き継がれます。
来年は、今年の最終的な読取精度を出発点として、さらなる精度向上を求めることができます。

2021年11月21日