gorby
(RPA Ninja)
May 5, 2025, 7:45am
1
こんにちは
UiPath Studio 2025.0.161 Community editionのユーザーです。
1.やりたいこと
PDFから文字列をString変数に取得したい。
2.悩んでいること
OCR で PDF を読み込みアクティビティ内部にOmniPage OCRを置いてスキャンしたら、正常に読み込めましたが、
テキストを取得アクティビティやPDF のテキストを読み込みアクティビティでは、1文字も読み込めませんでした。セレクタはページ全体を指定しています。
PDF のテキストを読み込みアクティビティでは、範囲はALLを指定しています。
原因は何でしょうか?(追記:PDF内部が90度回転していることが読み取れない原因の可能性があります。この場合、テキストを取得アクティビティやPDF のテキストを読み込みアクティビティは使えないでしょうか?)
下記にPDFの一部を表示します。書籍を600DPIでスキャンしたので目視では鮮明に読み取れます。
Hello,
your input pdf is scanned PDF and not a native PDF, due to which ‘Read PDF Text’ will not work.
You need to use Get OCR Text activity to extract pdf text.
You can use any OCR Engine like OmniPage, Tesract, UiPath OCR.
Hope this helps.
vhvinodsai
(Vinod harapanahalli )
May 5, 2025, 8:34am
3
Hi @gorby
You can try to use pdf activities use get ocr text activity to extract data as well ocr engines also you can use like terresact ocr try this
system
(system)
Closed
May 10, 2025, 1:25am
4
This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.