Pdfの画像認識について

citrix

#1

PDF上の画像認識を試したことがある人に以下の点をお聞きしたいです。

現在、決まったフォーマットのPDFからはんこの有無だけ判断して、処理を進めるプロセスを考えています。(PDFは印刷したものに、はんこを押して、スキャンしてます。)

実際問題、↑のプロセスだとPDFを作る際にノイズが入ったり、傾いたりと、RPAのみで処理するのは現実的ではないと思っていますが、
もしどなたか似たようなことを試したことがある人がいれば、実際の精度や困難な点等の所感を教えていただきたいです。

以上、よろしくお願いします。


#2

@Jumbo さん、こんにちは
はんこは角度とかノイズはさておき社印のように常に同じ印影なのでしょうか?


#3

@tangoさん、こんにちは。

印鑑としてはシャチハタの承認印のみを想定しています。
見たところ、ほとんどは100円ショップで売ってるような丸型印なので、
それ以外(角型とか)でちゃんと認識できない場合は、exceptionとして別処理にしようかと考えています。

よって、印影は中の文字が違っています。形は基本的に同じです。