데이터스크래핑 관련 문의

안녕하세요.
데이터스크래핑을 하는데 결과에 대해 질문드립니다.
현재 데이터스크래핑을 한 후 데이터테이블에 저장한 뒤 엑셀로 출력하는 중입니다.

  1. 네이버 쇼핑에서 A 상품목록을 수집 -> 결과 : 매우 정상
  2. A 상품목록을 수집하는데 만든 XML로 B 상품목록을 수집 -> 뒤죽박죽
  • 수집하는 항목은 상품명, 가격, 리뷰수, 찜하기, 구매수 이런것들인데 상품명, 가격은 항상 같은 위치에 있어 잘 나오지만 리뷰수, 찜하기 등 가변적 위치에 있는 것들은 엉망으로 나오더라구요. 혹시 해결방법이 있습니까…?

HtmlAgilityPack을 한번 사용해보세요.

네이버 쇼핑몰의 검색 리스트에 상품,가격,리뷰등의 class 값은 항상 동일하게 유지됩니다.
이것을 xpath을 잘 지정하면 이속성을 이용하여 스크래핑을 한다면 원하는 결과를 얻을수 있습니다.

아래 링크 참고사헤요.
AgilityPack을 이용한 웹 크롤링 - Ask in Your Language / Korea RPA 개발자를 위한 공간 - UiPath Community Forum

감사합니다. 샘플보고 공부해보겠습니다

샘플로 간단히 만든겁니다.
참고하세요.
네이버쇼핑.xaml (7.1 KB)

1 Like

패키지 찾느라 고생했는데 감사합니다 참고하겠습니다