웹데이터 추출에서 패턴인식 안되는 문제

아래 웹페이지에서 우선 두 개의 데이터를 추출하여 두 개의 칼럼을 갖는 테이블을 얻으려고 합니다.

Studio (버전 2021.4.4) , 최신 디자인 환경 사용체크 상태에서, ‘테이블 추출’ 도구를 이용했구요. 2개의 문제가 있습니다.

  1. 국문용어와 영문용어를 일단 두 개의 칼럼으로 추출하고 싶은 건데요.
    LA갈비(LA galbi) - Marinated Grilled Ribs 이런 식으로요. 우선은요…

그런데 첫번째 데이터(LA갈비(LA galbi)) 를 첫번째 칼럼에 추가 후(10개항 선택) 두번째 데이터(Marinated Grilled Ribs )를 추가하면 10개항이 아닌 11개항(Total:700/1page가 불필요하게 선택됨, 선택에서 제외할 수 없는지…)이 선택되면서 패턴인식안된다는 메시지창이 떠요.

2… 또 하나의 문제는 페이지 하단의 다음페이지 버튼을 누르면 1페이지에서 2페이지로 가는 것이 아니고 6페이지로 가는 문제입니다. 다행히 url 끝을 보면 pagenum=1 처럼되어 있어서 변수로 하고 '+1’씩 반복하면 되지 않을까 생각을 해보는 데 맞는 방향인지 모르겠습니다. 아니면 url링크를 아래처럼 70개를 엑셀에 넣어놓고 하나씩 불러와 추출작업을 반복하는 작업도 가능해보이는데 어떻게 할까요?
http://www.lampcook.com/food/food_dic_global.php?search_mode=0&alpha_no=0&big_no=0&sql_one=&pagenum=1

http://www.lampcook.com/food/food_dic_global.php?search_mode=0&alpha_no=0&big_no=0&sql_one=&pagenum=70

도움을 좀 받을 수 있을까요?

결국 국문용어 추출과 영문용어 추출을 별도로 수행하여 합치는 방법을 조언받고 해보고 있습니다.

‘다음’ 버튼이 원하는 방법으로 동작하지 않아 위 url 주소를 엑셀파일에 넣고 불러와 'open browser’의 변수(var_url)로 전달하는 방법을 시도 중입니다.

그런데 url 의 순서대로 페이지는 잘 열어주고 있는데 데이터 스크래핑을 하려니 해당 페이지로 접근하는 방법을 모르겠습니다. '현재 구성설정으로 새 브라우저 세션을 '열면 빈 페이지가 열립니다.한식메뉴사전3.zip (953.3 KB)

프로젝트 파일을 올리니 보시고 도움주신다면 감사하겠습니다.

해당 페이지로 접근해 스크래핑하는 방법을 찾았습니다. open browser 액티비티 속성창에서 출력 브라우저 변수를 선언하고 스크래핑을 위해 붙는 attach browser 액티비티의 입력 브라우저 변수에 위 변수를 할당하면 해당 페이지 작업이 가능해집니다.

This topic was automatically closed 3 days after the last reply. New replies are no longer allowed.