Pdfの画像認識について

Jumbo · April 13, 2018, 2:49am

PDF上の画像認識を試したことがある人に以下の点をお聞きしたいです。

現在、決まったフォーマットのPDFからはんこの有無だけ判断して、処理を進めるプロセスを考えています。(PDFは印刷したものに、はんこを押して、スキャンしてます。)

実際問題、↑のプロセスだとPDFを作る際にノイズが入ったり、傾いたりと、RPAのみで処理するのは現実的ではないと思っていますが、
もしどなたか似たようなことを試したことがある人がいれば、実際の精度や困難な点等の所感を教えていただきたいです。

以上、よろしくお願いします。

tango · April 16, 2018, 3:53am

@Jumbo さん、こんにちは
はんこは角度とかノイズはさておき社印のように常に同じ印影なのでしょうか？

Jumbo · April 16, 2018, 4:20am

@tangoさん、こんにちは。

印鑑としてはシャチハタの承認印のみを想定しています。
見たところ、ほとんどは100円ショップで売ってるような丸型印なので、
それ以外(角型とか)でちゃんと認識できない場合は、exceptionとして別処理にしようかと考えています。

よって、印影は中の文字が違っています。形は基本的に同じです。

Topic		Replies	Views
Citrixな画面からテーブルのデータを取得フォーラム	0	1156	November 28, 2018
ブラウザ上のリンクからPDFをダウンロードフォーラム studiox	8	256	March 11, 2024
表形式の内容を取得したいフォーラム	0	1309	November 6, 2018
フォルダ内の複数のマルチTiffファイルを１PDF化するアクティビティをご存じないですか？フォーラム question	1	448	July 6, 2023
PDFの注釈のみを取得する方法についてフォーラム	0	1399	December 7, 2020