PDF から文字列が読み取れない理由

こんにちは
UiPath Studio 2025.0.161 Community editionのユーザーです。

1.やりたいこと

PDFから文字列をString変数に取得したい。

2.悩んでいること

OCR で PDF を読み込みアクティビティ内部にOmniPage OCRを置いてスキャンしたら、正常に読み込めましたが、
テキストを取得アクティビティやPDF のテキストを読み込みアクティビティでは、1文字も読み込めませんでした。セレクタはページ全体を指定しています。
PDF のテキストを読み込みアクティビティでは、範囲はALLを指定しています。
原因は何でしょうか?(追記:PDF内部が90度回転していることが読み取れない原因の可能性があります。この場合、テキストを取得アクティビティやPDF のテキストを読み込みアクティビティは使えないでしょうか?)
下記にPDFの一部を表示します。書籍を600DPIでスキャンしたので目視では鮮明に読み取れます。


Hello,
your input pdf is scanned PDF and not a native PDF, due to which ‘Read PDF Text’ will not work.
You need to use Get OCR Text activity to extract pdf text.

You can use any OCR Engine like OmniPage, Tesract, UiPath OCR.
Hope this helps.

Hi @gorby
You can try to use pdf activities use get ocr text activity to extract data as well ocr engines also you can use like terresact ocr try this

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.