PDFを読み込むと文字化けしてしまう

【問題】
機密情報が記載されているためPDFは共有できないのですが、
そのPDFを「UiPath.PDF.Activities」パッケージ(ver 3.19.1)の
「ReadPDFText」アクティビティを使用すると文字化けしてしまいます。
文字化けせずに取得する方法はないでしょうか。

【試したこと】
①VB.netの「Spire.Pdf」による文字列に変換
→上記ライブラリのインストール方法が分からず断念
②文字コードを使用してutf-8やshift-jisへ変換
→元の文字コードが分からず断念

こんにちは

原因を特定できないと対処のしようがないですね。
場合によってはセキュリティ強化目的で読める形でのテキストとして取り出せないようにしている場合もありますので、そのあたりの見極めも必要かもしれません。
AdobeReaderで開いたとき、テキストは正常にコピーして取得できますでしょうか?

あるいは別のアプローチとしてMS Wordで開いてみて正常に読み取れるのであれば、UiPath.Word.Activities pacakgeを使う手があるかもしれません。

いつもお世話になっております。

AdobeReaderで開いたとき、テキストは正常にコピーして取得できますでしょうか?

こちらは問題なく、表示通りのテキストを正常にコピーできております。

MS Word

こちらは開くと文字が消えていたり箇所がある等
動作が安定していませんでした。

こちらExcel VBAで完全ではありませんが、
読取りたい箇所の抽出には成功しました。

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.