データスクレイピングが何度も繰り返してしまう。

1ページに10件表示されていて複数ページありのweb明細画面があります。
それを全ページの、ある1項目を取得しようと、データスクレイピングにて組みましたが、
「次へ」が押せなくなった時点で終了せず、また「1」~から始まり、
というのを何度も繰り返して終わりません。(結果最大数0で設定)

ちゃんとデータが取れているか確認するため、結果最大数100にして確認すると、
データは正しく取得されていますが、最終ページの次は1ページ目のデータから繰り返し取得しています。

ちなみに、
・web画面は、最終ページにいくと、「次へ」のリンクは押せなくなってます。
・ほかのweb画面でも同じ現象になります。

なにか原因があれば教えていただけないでしょうか?

こんにちは

NextLinkSelectorがFuzzyモードになっていて、完全一致しない他のリンクをクリックして
いる可能性があるのではと思います。
TaretingMethodの部分をFuzzyとImageを外して、Selectorのみにしてみてはいかがでしょうか?

お返事ありがとうございます。

ただ、お恥ずかしながらどこを直していいかわかりません。
申し訳ございませんがご教授いただけますか。

NextLinkSelectorの内容です。
webctrl aaname=‘次へ >’ parentid=‘sel_ResultListForm’ tag=‘A’ /

こんにちは

お使いのデータスクレイピングはモダン・クラシックいずれになりますでしょうか?
モダンなら下記のような設定がありますので、これを修正すると良いかと思います。

ありがとうございます。
モダンではないようです。

こんにちは

クラシックでしたら、原因の切り分けのために、SimulateClickやSendWindowMessageをオフにしてみる等は試してみても良いかもしれません。
あとは、例えばリトライスコープでリトライがかかっている可能性はありませんでしょうか?

・web画面は、最終ページにいくと、「次へ」のリンクは押せなくなってます。

手動のブラウザ操作で「次へ」のリンクが押下できるかではなく、
プロパティで設定している[次リンクのセレクター]の一致するかが重要です。

現状、最終ページで、[次リンクのセレクター]に一致するリンクがあり、
そのリンクが1ページ目になっている状況だと思います。

最終ページで「次へ」のリンクが非可視であれば、
Yoichiさんが指摘している通り、[クリックをシミュレート]のチェックを外せば、解決するかもしれません。

お返事ありがとうございます。
[クリックをシミュレート]のチェックを外したところ、最終ページに行ったところで止まり、ExtractDataのなかでタイムアウトとなりました。

すみません。宜しくお願い致します。

1 Like

こんにちは

上記の状態でエラー発生時に実行を継続をTrueにすると、とりあえずは動くと思います。
(Wizard完了時はもともとTrueかと思いますので)

ただし「次へ」のクリックが、デフォルトですとシミュレートに比べて不安定なケースも
ありますので、データスクレイピングでの「次へ」をクリックするのはやめて
ループを作成して、データスクレイピングは1ページづつ取得し、自力で「次へ」を
クリックするようにした方が良いかもしれません。
(おそらくリンク自体はあるので、属性の確認や最初に戻るようなリンク先だと終了とするような
条件になると思います。)

ありがとうございました。
エラー発生時に実行を継続をTrueでひとまず動きました。
タイムアウトを短く設定して、これで様子見ようと思います。

最後に教えていただけますか。
今回のケースは、自分の環境が要因でなく、web画面の作りによるものでしょうか。
素人ですみません、宜しくお願い致します。

こんにちは

主要因はWeb画面の作りかと思います。最終ページの「次へ」のリンクが(画面上は見えなくても)
HTML上は存在しており、UiPathがこれをクリックしていることが原因ではないかと思います。
(HTMLのソースを確認すると、より明確になるかもしれません)

1 Like

承知しました。勉強になりました。
今回はありがとうございました。

1 Like