Webページのテキスト抽出について

こんばんは。お世話になっております。

写真はメルカリの商品ページなのですが、紫マーカー部分の商品名テキストデータが取得出来ず困っています。

メルカリのどんな商品でも商品名を取得出来るようにしたいのですが、最初に設定した1つの商品しかテキストが取得出来ません。2つ目の商品でテキストを取得しようとすると、エラーになり止まってしまいます。

「テキストを取得」「画面スクレイピング」「フルテキストを取得」など色々やってみたのですが、全て2商品目が取得出来ず、八方塞がりです。

アドバイス頂けないでしょうか?

単純にセレクターが異なってる可能性が高いです。

一応、メルカリはスクレイピング行為を規約で禁止してますのでご留意ください。

1 Like

ご回答ありがとうございます。
度を過ぎた事をしないようにしようと思います。ご指摘頂いた所申し訳ないのですが質問失礼致します。

商品①の商品名(紫マーカー)の部分のセレクターと、また別の商品②の商品名のセレクターを見比べてみたのですが、違いは赤マーカー部分だけでした。
商品①⤵︎ ︎


商品②⤵︎ ︎

商品①の商品名を「テキストを取得」の「画面上で指定」から選択した時、商品①はテキストを取得してくれましたが、商品②で同じプログラムを実行した所テキストは取得されませんでした。
商品②の商品名を画面上から指定した場合も同様でした。

商品名も一言一句同じでないといけないという事でしょうか?

お気づきの通りです。
可変の箇所は * で対応できます。

<html app='chrome.exe' title='メルカリ - *' />
 <webctrl tag='H1' />

夜遅くにありがとうございます。
3時間近く悩んでいた思うので、教えて頂けてスッキリしました。
ありがとうございました。

1 Like

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.