勝負相手はOCR

1年間の地道なトレーニングにより、確かな実力を身につけた画像認識AIとOCR(ただし初対戦の相手にはまったく歯が立たない)。

今年の読取プロセスでは先発を任され、人間様が読み取るより前に、まずはOCRが証明書の記載事項を読み取っています。
そして人間様が読み取った結果と自分が(というかOCRが)読み取った結果とを比較して、一致しているかを判断してくれます。

こんな感じで。

一致していないとこんな赤目が表示されます。これを見て人間は、もう一度証明書を見つめ直すわけです。

そして正しく修正すると、こんな表示が。

この場合は人間様が、新一般と旧一般を間違えていたんですね。
このように、どこが不一致かは表示されず、不一致であることだけが、赤目と緑目で示されます。

赤目だからといって、OCRが正しいとは限りません。
手書きの文字とかチェックマークが書き込まれていれば、OCRはこれを律儀に読み取ります。
「1」を罫線と間違えて省略してしまったり、逆に罫線を「1」と認識してしまうこともあります。

ですから、自分が(この場合は人間が)間違えていないと判断すれば、不一致のまま登録することもできます。
そして両者不一致のケースでは、最終的には管理者がどちらが正しいかを判断します。

人間とOCRは「間違える癖」が違います。両者の組み合わせは、精度を100%に近づけることを確信しています。

2021年11月25日