勝負相手はOCR
1年間の地道なトレーニングにより、確かな実力を身につけた画像認識AIとOCR(ただし初対戦の相手にはまったく歯が立たない)。
今年の読取プロセスでは先発を任され、人間様が読み取るより前に、まずはOCRが証明書の記載事項を読み取っています。
そして人間様が読み取った結果と自分が(というかOCRが)読み取った結果とを比較して、一致しているかを判断してくれます。
こんな感じで。
一致していないとこんな赤目が表示されます。これを見て人間は、もう一度証明書を見つめ直すわけです。
そして正しく修正すると、こんな表示が。
この場合は人間様が、新一般と旧一般を間違えていたんですね。
このように、どこが不一致かは表示されず、不一致であることだけが、赤目と緑目で示されます。
赤目だからといって、OCRが正しいとは限りません。
手書きの文字とかチェックマークが書き込まれていれば、OCRはこれを律儀に読み取ります。
「1」を罫線と間違えて省略してしまったり、逆に罫線を「1」と認識してしまうこともあります。
ですから、自分が(この場合は人間が)間違えていないと判断すれば、不一致のまま登録することもできます。
そして両者不一致のケースでは、最終的には管理者がどちらが正しいかを判断します。
人間とOCRは「間違える癖」が違います。両者の組み合わせは、精度を100%に近づけることを確信しています。
2021年11月25日