Pdfファイルのエレメントがうまく選択できません。

pdf
activities
studio

#1

Get textアクティビティでPDFのテキストを選択しようとすると
うまく選択できません。全体が選択されたり、文字列と対応していない場所が選択されます。
画像はワードで作成したTestドキュメントをPDFで保存したものです。
今選択されている場所でAaaaaaaaaの文字列を出力することができました。


Adobe Readerの問題でしょうか。Accessibilityの設定は確認しました。
よろしくお願いします。


数ページあるpdfデータ→エクセルへの書き込み
#2

Hi,

Please go through this post and u will get ur solution.U just need to make some configuration in ur abobe to get accesss to the elements in pdf. See reply of Vikas.Jain

https://forum.uipath.com/t/selecting-pdf-elements/2603


#3

Raguvarthanさんが貼ってくださったリンクですと英語でしか書かれておりませんでしたので、横から失礼いたします。
PDFファイルのエレメント認識が上手く作動しないというのはAdobe ReaderのアクティビティAPIが正常にロードされないことにより発生している可能性がございますが、Accessibilityの設定というのはPDFメニュータブのEdit(もしくは編集)ボタンからの設定を確認したという認識であっていますか。
回避策として、一度UiPathとAdobe Readerを立ち上げ、もう一度編集タブ --> アクティビティ --> セットアップアシスタントから何も設定をいじらずにOKや次を押してその設定画面を終了させてください。
その後でGet TextでPDFを読み込むと正しくエレメント認識されるようです。

もし、それでも改善しない場合は、OCRやImageベースでの自動化で回避するということ考えられます。
OCRやImageベースのアクティビティを出来るだけ回避したい場合は、UiPath.PDF.Activities(https://www.uipath.com/kb-articles/scraping-pdf-files-using-read-pdf-activity)を使用して文字列を抜き出したり、「正規表現」といったツールを使用することが考えられます。


#4

Hi Raguvarthan,

Thank you for your reply.
I have already read that post, and I tried
but it didn’t work well.

I’m so sorry I cannot explain the detail in English.
I wil talk with Yutaro-san, thank you.


#5

返信ありがとうございます。
そうですね、Edit > Accessibility > Setup assistant のことです。
再度立ち上げてトライしましたが、改善されませんでした。
Raguvarthanさんのリンクから試せることは試したつもりですが、うまくいきませんでした。
同じファイルをacrobat readerが入っているPCへ送り、試したところうまく要素を示してくれました。
ですので今のPCのadobe readerがおかしいと思います。
acrobat readerを導入して試してみます。(会社PCで権限の話がありすぐにインストールできないので時間かかりそうですが)

ありがとうございます。


#6

PDFのビューアーをAcrobat Reader DCに変えたところうまくテキストを選択でき、出力も正しい文字列で得られました。

Adobe reader はサポートされてないのでしょうかね。解決したのでこれ以上の原因の追及はしませんが疑問が残るところではあります。

回答ありがとうございました。

I become able to select text element by changing PDF viewer from Adobe Reader to Acrobat Reader.

Thank you for your help!