Extract Structured Data 로 데이터를 페이지별로 뽑는데 자꾸 1페이지데이터 밑에 1페이지+2페이지 데이터가 붙습니다

<extract>
	<row exact='1'>
		<webctrl tag='tr' />
	</row>
	<column exact='1' name='번호' attr='text'>
		<webctrl tag='tr' />
		<webctrl tag='td' idx='1' />
	</column>
	<column exact='1' name='작성일' attr='text'>
		<webctrl tag='tr' />
		<webctrl tag='td' idx='5' />
	</column>
	<column exact='1' name='제목' attr='text'>
		<webctrl tag='tr' />
		<webctrl tag='td' idx='2' />
	</column>
	<column exact='1' name='URL' attr='href'>
		<webctrl tag='tr' />
		<webctrl tag='td' idx='2' />
		<webctrl tag='a' idx='1' />
	</column>
</extract>

이게 페이지 데이터 추출 XML이고 홈페이지는 https://overseas.mofa.go.kr/vn-ko/brd/m_2203/list.do?&multi_itm_seq=0&page= 여기서 데이터를 뽑습니다.
페이지이동은 WHILE 반복문으로 반복해서 하고있는데 WHILE 안에다가 넣고 +1 하면서 페이지 이동까지는 잘 가는데 데이터는 자꾸 밑으로 붙어서 나옵니다 ㅠㅠ 해결방법이 있을까요

Hi! Welcome to community!

사이트에서 추출하려는 페이지 수를 알 수 있습니까?

Regards,
NaNi

1 Like

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.