네이버 맛집 파싱 의뢰합니다.
https://m.place.naver.com/restaurant/list?query=부산맛집&entry=ple&rank=저장많은
위 페이지에서 각각 query는 "XX맛집"으로 rank는 "많이찾는,요즘뜨는,저장많은,리뷰많은" 이렇게 네가지입니다.
같은 지역에 대해 rank 값에 따라 네개를 파싱하게 되는 형식입니다.
https://api.place.naver.com/graphql
위의 json 값을 파싱해서 1위부터 100위까지 뽑아오면 됩니다.
이 작업을 몇번 의뢰해서 진행했었는데 이번에 또 네이버의 파싱 방식이 바뀌었는지 막혀버려 다시 의뢰드립니다.
원하는 파싱내용은 아래와 같습니다.
많이찾는, 요즘뜨는의 경우에는 "식당명(name)"만 가져오면 되고
저장많은 경우에는 "저장수(saveCount)"
리뷰많은 경우에는 "방문자리뷰숫자(visitorReviewCount)", "블로그카페리뷰숫자(blogCafeReviewCount)"
를 가져와야 합니다.
그리고 원하는 방식은 아래와 같습니다.
게시판 형식으로 매일 수동으로 글쓰기를 통해 파싱할 계획입니다. 하루 최대 20번 정도 진행할 듯 합니다.
제목에는 그날의 날짜를 2004-08-27 형식으로
내용에는 각각의 파싱값을 "|"로 나눠서 들어가면 됩니다.
이때 저장많은의 경우에는 식당이름@저장숫자$|식당이름@저장숫자$|식당이름@저장숫자$|
리뷰많은의 경우에는 식당이름@블로그카페리뷰숫자/방문자리뷰숫자$|식당이름@블로그카페리뷰숫자/방문자리뷰숫자$|
이런 형식으로 들어가면 좋겠습니다.
마지막으로 게시판에서 query 값은 $board['bo_1']에 rank 값은 $board['bo_2']에서 조정할 수 있으면 됩니다.
만약 https://api.place.naver.com/graphql 대신 다른 방식으로 같은 값을 가져올 수 있어도 상관 없습니다.
이 파싱의 목적이 오랫동안 유지하면서 계속 파싱할 수 있는거라 더 좋은 방식이 있다면 언제나 좋습니다.
고수님들의 좋은 참여 부탁드립니다.
감사합니다.
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기
댓글 2개
sir화원 균이입니다
openapi.naver.com에서는 방문자리뷰숫자, 블로그카페리뷰숫자 등이 나오지않는군요
rank=저장많은 <--이렇게 주소창에 넣었을 때 다음처럼 266,000이상 이라는
저장수가 나오기는 하지만 내용 상세보기를 해도 정확한 저장수는 나오지 않는군요
톤쇼우 광안점돈가스
영업 종료별점4.55리뷰 999+ 저장수 266,000+
================================
테스트를 좀 더 해보고 작업 가능하면 메일 드리겠습니다
https://m.place.naver.com/restaurant/list?query=부산맛집&entry=ple&rank=저장많은 의 경우 개발자도구 > network 에서 https://api.place.naver.com/graphql 를 파싱하면 스샷과 같은 값이 나오는데 여기서 name, saveCount, visitorReviewCount, blogCafeReviewCount 값을 가져와야 합니다.
이전 작업에서는 잘 가져와졌는데 한달전쯤부터 가져오질 못해 의뢰를 맡기게 되었습니다.