複数ページのあるWeb画面から構造化データを抽出する方法

お世話になります。

以下の流れを自動化したいと考えていますが、どう組むべきか迷っています。
前提として、データを取得する対象のWeb画面は20件を超えると複数ページとなります。

①対象のWebページにアタッチ
②「構造化データを抽出」アクティビティでDTに格納
③「次ページ」ボタンがあれば次のページに移動し、データをDTに格納

③の際に、「要素の有無を検出」と「繰り返し(後判定)」を使用し、ループさせることはできるのですが、「構造化データを抽出」をどうするか悩んでいます。
今のところindex番号をつけたDTにそれぞれ保存して、ループを抜けた後でマージするしかないのかなと思っているのですが、、
何か良い方法あればご教示ください。

こんにちは

なんらかの制約で「構造化データを抽出」アクティビティの持つ複数ページ機能が使えない状況でしょうか?

「構造化データを抽出」アクティビティのデータテーブルプロパティは出力カテゴリーにありますが、引数の形態がInOut型になっています。
そのため同じDataTableをそのまま使いまわすと自動的に追記されると思いますが....
一度上記挙動をご確認いただければと思います。

1 Like

@Yoichi

ご回答頂きありがとうございます。
標準で複数ページ機能があること知りませんでした。。
ありがとうございます。

複数ページ機能を使用する場合、「次リンクのセレクター」に次へボタンのセレクターを
設定したらよいのでしょうか?

こんにちは

はい、結果的にはそこに設定することになりますが、多くの場合はデータスクレイピングウイザードを使った方が楽かと思います。(リボンメニューにある「データスクレイピング」をクリックします。対話形式で設定できます。)

1 Like

@Yoichi

回答ありがとうございます。

データスクレイピングウィザードを使用した際に、複数ページに渡る設定を
一旦飛ばしていたのを忘れていました。
解決いたしました。ありがとうございます。

2 Likes

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.