データスクレイピングでの任意のHTML要素の取得について

データスクレイピングで質問です。

データスクレイピングで表示されている文字列やURLだけでなく、input領域のidなどの非表示要素を取得することは可能でしょうか?

※可変idの入力エリアを持つ表をデータスクレイピングで取得し、データを担当者に記入させた後、idをセレクタとして入力エリアにデータを入力という運用を考えております。
よろしくお願いいたします。

こんにちは

DataScraping時に表全体ではなく各列毎に設定したとき、プレビュー画面時にデータ定義を参照すると以下のような感じになっているかと思います。
この時以下のcolumn要素中のattr属性値を変更することにより、対象の任意の属性値を取得できるかと思います。

20190708-1

1 Like

ありがとうございます。
以下の指定で1つ目は取得できました。

※inputタグのname要素を取得する場合(見出しは「****」)

<column exact='1' name='****' attr='name'>
	<webctrl tag='input'/>
</column>

ただ、2列目の要素の取得が取れませんした。(いうのを忘れていましたが、列は
複数あります。)
自動生成されるidxをまねて指定してみたのですが、無視されるようです。
いろいろすいません。

こんにちは

2列目でも動作自体は同じはずですが..
当該要素の指定がうまくいっていない可能性はないでしょうか?

もう少し具体的な情報を提示いただくとコメントできるかもしれません。

1 Like

ご確認ありがとうございました。
以下のような指定で行っております。(一部マスクをかけています)
1列目、2列目は表中の文字列を、3列目、4列目はname要素を取得しようとています。
inputが指定されているタグにidxで列順序等を指定してましたが、無視されるようです。

<extract>
	<row exact='1'>
		<webctrl tag='tr'/>
	</row>
	<column exact='1' name='見出し1' attr='text'>
		<webctrl tag='tr'/>
		<webctrl tag='td' class='xxxx' idx='1'/>
	</column>
	<column exact='1' name='見出し2' attr='text'>
		<webctrl tag='tr'/>
		<webctrl tag='td' class='xxxx' idx='2'/>
	</column>
    	<column exact='1' name='ID1' attr='name'>
	</column>
    <column exact='1' name='ID2' attr='name'>
		<webctrl tag='input' />
	</column>
</extract>

よろしくお願いいたします。

こんにちは

元のHTMLが分かりませんので、完全に手探りですが4列目なら以下のような感じでしょうか?tag='td’部分のclassの値が他と異なるこの部分のidxの値は4から変える必要があると思います。

<column exact='1' name='ID2' attr='name'>
		<webctrl tag='tr'/>
		<webctrl tag='td' class='xxxx' idx='4'/>
                <webctrl tag='input' idx='1'/>
</column>
1 Like

ご確認ありがとうございます。
以下の通りで行けました。

idxは出現順にしました。(1,2,4,5列目(4,5列目のみ記載)を取得するようにしています)

<column exact='1' name='ID1' attr='name'>
        <webctrl tag='tr'/>
    	<webctrl tag='td' class='XXXX' idx='4'/>
        <webctrl tag='input'/>
</column>
<column exact='1' name='ID2' attr='name'>
    	<webctrl tag='tr'/>
    	<webctrl tag='td' class='XXXX' idx='5'/>
       <webctrl tag='input'/>
</column>

どこかにこのデータ定義の文法の掲載はないでしょうか?
(探したがありませんでした。探し方が悪い可能性が高いですが)

ありがとうございました。

こんにちは

整理されたドキュメントがなさそうなので結構手探りでやっています :slightly_frowning_face:

1 Like

ご確認ありがとうございました。
やはりないのですね。。。

今回は助かりました!!