N사 XX맛집 리스트의 크롤링 작업 의뢰합니다.
N사 크롤링에 대한 규칙이 바뀌었는지 다른 변동사항이 생겼는지 몇일 전부터 크롤링 방법을 바꿔가며 해봐도 안되길래 의뢰를 통해 해결하려 합니다.
원하는 크롤링
- XX 맛집 (여분필드 1)
- 많이찾는, 요즘뜨는, 저장많은, 리뷰많은 (여분필드 2)
- 1위부터 100위까지
- Basic게시판에 여분필드를 사용하여 하루 1번~10번 정도 크롤링하려고 합니다.
예제과정
"부산맛집"의 "많이찾는" 1위부터 100위까지 업체명을 "|"로 구별하여 wr_wontent에 등록합니다. (만약 300위까지 가능하다면 더욱 좋습니다)
이때 wr_subject는 오늘 날짜를 "2024-03-22" 식으로 넣습니다. (이 부분은 안하셔도 됩니다.)
"저장많은"의 경우에는 각 업체의 저장 숫자를 "업체명@저장수"식으로 반영합니다.
"리뷰많은"의 경우에는 각 업체의 리뷰 숫자를 "업체명@방문자리뷰숫자/블로그리뷰숫자"식으로 반영합니다.
기존에는
위의 response나 preview에서 업체명, 저장숫자, 방문자리뷰, 블로그리뷰 모두를 볼 수 있는데 문제는 이녀석을 가져올 때 네이버에서 막아버리는건지 다른 함수를 사용해야 하는지 그 값을 가져오는게 안되네요.
고수님들의 많은 의견 부탁드립니다.
아래 참고이미지는 "저장많은"과 "리뷰많은"의 경우에서 가져와야할 값을 빨간 박스로 표시해두었습니다.

|
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기
댓글 1개