불특정한 다수의 text 특정 문자 추출 방법

안녕하세요 과제 하다가 도움이 필요해서 왔습니다 ㅜㅜ
현재 네이버 기사에서 기자명만 추출해서 엑셀로 뽑아야하는데요


현재 텍스트를 추출해서 메모장에 썼을때 이렇습니다 이런 규칙이 없는 기사 50개에서
기자명만 뽑아야하는 현재 추출한 텍스트를 엔터 기준으로 쪼개놓은 상태입니다
그 후에 어떻게 해야할지 모르겠습니다 ㅜㅜㅜㅜ 도와주세요
list로 담아서 또 추출해야하는건지… 50개의 기사에서 기자명이 전부 다른 위치에 있어서
어떻게 뽑아내야할지 모르겠어요

Hello @jbag27385
For extracting data bot need a specific details like Name is written after the "Reporter Name- " or after Reporter name there is Some identification. without that you can not extract specific Word.

예를 들어 이 기사는(문자열),
엔터를 기준으로 배열이나 리스트로 값을 지정한 후에
for 문으로 조회하면서 '입력’과 '기자’라는 단어가 모두 contain 하는 문장 값에서
substring 이나 matches 같은 정규표현식으로 값을 추출하면 좋을 것 같네요. 하나의 예시입니다
아마 각각의 신문사 별 방법을 다르게 해야할 것 같은데, switch 로 분류후에 로직을 만들어야 할 것 같습니다. 홧팅입니다~!

안녕하세요 ? 위의 예제와 비슷한 경우인데 질문이 있습니다
저는 나라장터의 공사 공고문에서 공사기간을 추출해서 엑셀파일에 넣는 작업을 하고자 합니다
엑셀파일의필드구조는 공고번호, 공사명, 공사개시일, 공사기간이라고 가정하고
1)공고 번호를 기준으로 나라장터의 공고문을 읽어 옵니다.
2)나라장터의 공고문은 데이터 테이블로 되어 있지는 않고 그냥 플레인 텍스트로 이루어져 있습니다
따라서 공고문 페이지의 내용중에서 예를 들어 공사기간 7개월 또는 공사기간 400일 이라고 표기되어 있을 경우 상기 7개월 또는 400일을 받아와서
3저의 엑셀파일의 공사기간 필드에 넣어 주면됩니다.
이와 같은 기능을 수행하기 위해서는 어떻게 해야 하는지 도움을 주시면 감사하겠습니다