同一形式の帳票を複数枚スキャンしたPDFのテキスト一括読取

こんにちは。

1日数百枚発生する同じ形式の紙帳票から、すべてのページに対してその一部分のテキストを読み取ってエクセルに一覧として転記するワークフローを作成しています。
いろいろ試した結果、スキャン後にDocument Understandingでの読取が一番確実でした。
ただ、複数枚を1つのPDFとしてスキャンしたもので上記を試した結果、
最初の1ページ目だけが結果として出力されます。

ファイルサーバーの圧迫や処理時間延長を防ぐために、1ページずつPDFを分割してループ処理をするのは避けたいのですが、
Document Understandingで複数ページを一括読取処理するのは可能でしょうか。
ご指導よろしくお願いいたします。

1 Like

@Tettsu さんこんにちは!
ご質問の投稿から48時間経過しましたが最初の回答がまだ来ていないようです。
2つほどご提案させてください。
1.回答をするために十分な情報は記載しましたか?
問題の場合は再現方法の手順や状況についての情報、エラーメッセージがある場合はエラーメッセージ全体のテキスト情報があると回答しやすくなります。
何かの操作を実現する方法を聞きたい時は、なぜその操作が必要なのか目的や背景まで含めて説明いただくと、
たとえばその操作とは違ったより目的に沿った方法での解決方法が教えてもらえるかもしれません。
問題の場合も操作を聞く場合も、より具体的な情報やスクリーンショットがあった方が回答しやすくなります。
また、コミュニティである性質上、必ず回答があるわけではないことをご理解いただければと思います。
チケットによるサポートをご希望の場合はライセンスの購入をご検討下さい。
2.すでにフォーラムやドキュメントは検索されましたか?
特にフォーラムの日本カテゴリーやドキュメントポータルで検索されるのをおすすめいたします。
フォーラム右上の虫眼鏡のアイコンをクリックいただき、optionsをクリック、
その後Categorizedで日本を選択いただくことで日本カテゴリー内の投稿を検索いただけます。
ドキュメントポータルのリンクはこちらです。

下記サイトもよろしければご確認ください。
ナレッジベース ナレッジベース | UiPath
デベロッパーブログ デベロッパーブログ RPAの開発情報 | UiPath
答えが検索後見つかった場合、そちらの情報をぜひご記載ください。他のコミュニティメンバーの助けになります。
フォーラムをご利用いただきありがとうございます。
Forum_Staff より