PDFアクティビティを使用して、一部データを取得したい

いつもお世話になっております。

PDFアクティビティを使用して、表から一部の値だけ変数に入れるには、どのような手順をふめば良いでしょうか。

以下手書きで申し訳ありません。斜線のような中途半端な位置を取得したいです。

UiPath.PDF.Activities packageでしょうか?このパッケージ配下のアクティビティですと出来ることは限られていますので、PDF内の文字がテキストで格納していれば、それを抽出して正規表現で抽出できるかの検討、画像ならOCRを用いて文字抽出して、同様に正規表現で抽出できるかの検討でしょうか。(ただし必ずできるとは限りません)

コスト的に許容されるのであれば、DocumentUnderstandingやIXP、あるいはGenAIアクティビティの画像分析アクティビティを使う手もあるかと思います。

@Yoichi
いつもお世話になっております。

おっしゃる通り、PDF.Activities package になります。

「PDF内の文字がテキストで格納していれば」との事ですが、できないパターンもあるということでしょうか。
【PDFのテキストを読み込み】でテキストを取得しようとしたのですが、メッセージボックスで出力しても空白となってしまいました。

画像として格納されているのではと思います。AcrobatReaderやブラウザでそのPDFを開いてみて、テキストとして選択→コピーできますでしょうか?できなければ画像として格納されている可能性が高いと思います。

@Yoichi
ご回答ありがとうございます。

Chromeは選択できましたが、AcrobatReaderは選択できませんでした。

画像として読み込まれているということは、
そもそも前提として今回のような「PDFアクティビティで」というのは無理という認識で合ってますでしょうか。

Chromeは内臓のOCRが働いていないでしょうか?コピー&ペーストで正確に文字が取れていますでしょうか?

画像として読み込まれているということは、
そもそも前提として今回のような「PDFアクティビティで」というのは無理という認識で合ってますでしょうか。

Read PDF With OCR アクティビティがありますので、これでテキストとして抽出することは可能です。ただし読み取り精度は利用するOCRに依存します。

@Yoichi
遅くなり申し訳ございません。
たしかにChromeを開いた際、「PDFからテキストを抽出しています」と用事されているためOCRが働いているようです。

ご教授頂きましたアクティビティを試してみようと思います。
ありがとうございます。

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.