크롤링 & 게시판 작성 작업 의뢰합니다.

코시국에 모두 수고 많으십니다.

의뢰하고자 하는 내용은 크게 두가지입니다.

1. 해당 URL 크롤링
2. 크롤링 내용 중 특정 내용(class)만 게시판에 작성

해당 URL은 아래와 같습니다.

- 저장많은
https://m.place.naver.com/restaurant/list?query=%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91&rank=%EC%A0%80%EC%9E%A5%EB%A7%8E%EC%9D%80&x=126.9783880&y=37.5666100&deviceType=pc&entry=pll&level=top

- 리뷰많은
https://m.place.naver.com/restaurant/list?query=%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91&rank=%EB%A6%AC%EB%B7%B0%EB%A7%8E%EC%9D%80&x=126.9783880&y=37.5666100&deviceType=pc&entry=pll&level=top

- 많이찾는
https://m.place.naver.com/restaurant/list?query=%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91&rank=%EB%A7%8E%EC%9D%B4%EC%B0%BE%EB%8A%94&x=126.9783880&y=37.5666100&deviceType=pc&entry=pll&level=top

- 요즘뜨는
https://m.place.naver.com/restaurant/list?query=%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91&rank=%EC%9A%94%EC%A6%98%EB%9C%A8%EB%8A%94&x=126.9783880&y=37.5666100&deviceType=pc&entry=pll&level=top

- TV에나온
https://m.place.naver.com/restaurant/list?query=%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91&rank=TV%EC%97%90%EB%82%98%EC%98%A8&x=126.9783880&y=37.5666100&deviceType=pc&entry=pll&level=top

쿼리 값 중 "%ED%8F%89%EC%B0%BD%EB%A7%9B%EC%A7%91"은 키워드이고 예시에서는 "평창맛집"을 검색해보았습니다.

여기서 각 url의 rank 값에 따라 다섯가지로 나뉩니다.

뒤의 x,y,deviceType 등은 무시해도 되는 값입니다.

제가 먼저 흔히 많이하는 방법으로 파싱해보았으나 해당 url은 스크립트 값을 나중에 받아 뿌려주는 형태(?)처럼 진행되다보니 빈 값만 출력되네요.

다른 방법으로 크롤링(파싱)이 가능하신 분께서 도움주셨으면 좋겠습니다.

해당 url에서 업체명, 리뷰갯수와 같은 특정 class값을 50위(또는 100위)까지 게시글 하나에 "|"같은 부호로 나눠서 작성할 수 있으면 됩니다.

크롤링은 각 url마다 일 1~3회 정도 돌릴 예정이라 ip가 블럭되는 등의 패널티는 없을 것 같습니다.

관심 보여주신 모든 분들 감사합니다.

|

댓글 8개

Web Browser Service를 이용하면 가능할 듯합니다.
크롤링은 수동으로 하나요? 아니면 크론 등으로 자동으로 주기적으로 처리하나요?
수동입니다. 글쓰기 클릭시 작동할 수 있으면 됩니다.
write_update.head.skin.php 에서 값을 넘겨주면 될 것 같습니다.
참고로 전 mac을 사용하고 있습니다.
네이버 등등의 크롤링은 class 등의 이름 가지고 하기 때문에
제가 작업하고 나서, 이 class 이름이 바뀌면 크로링이 안 되는 점을 감안해 주시기 바랍니다.
Web Browser Service는 네이버 페이지를 요청하면 3~5초 정도 시간이 걸립니다. 이 점도 감안하시기 바랍니다.

그리고 네이버 URL은 입력하는 방식인가요?

예상 작업비는 20만원입니다.
class명이 변경되면 제가 찾아서 다시 수정할 수 있게끔만 가능하면 좋겠습니다.
그리고 url은 직접 입력보다는 urlencode 등을 통해 wr_1을 이용하는게 더 편할 것 같습니다.
따라서 class 명이나 url 부분은 작업 완료 후 네이버측의 변경시 제가 수정 가능할 수 있으면 좋겠습니다.
작업비용은 입금은 어떻게 하시는게 편하시겠습니까?
댓글로 불편하시면 전화나 톡 주셔도 됩니다. (0lO-62O7-6232)
비용이 많지 않으면
작업 후에 청구합니다.

https://phantomjscloud.com/
여기 가입하시고 키값을 알려 주세요.
하루 500건까지는 무료입니다.

class명 등은
환경 설정 또는 게시판 설정 여분 컬럼에 입력하는 것으로 하겠습니다.

한 가지 더 확인할 것이
글쓰기에서 네이버 크롤링을 하면
글쓰기 완료 페이지(view)가 늦게 뜨거나
네트웍 등등의 문제로 크롤링이 실패하면 글쓰기가 안 되거나 할 수 있습니다.

혹시 네이트온이 있으면 친구추가 부탁합니다.
rolojy@nate.com
입니다. 메일 주셔도 됩니다.
우선 네이트온 친추가 안되네요. ID가 검색되지 않습니다.
아니면 moowabo @ nate.com 친추해주셔도 됩니다.

api값은 ak-f14ny-rb9pv-k8110-qmtmc-wbz7z 입니다.

그리고 글쓰기가 안되는 경우에는 alert 후 글쓰기 페이지로 돌아가게 되나요 아니면 빈 값으로 글쓰기 작성이 되나요?
어차피 글쓰기 작성자는 전담자 한명이 진행하므로 둘 중 어느 경우라도 상관은 없을 것 같습니다.
안녕하세요
메일드리겠습니다
균이님 안녕하세요. 메일 잘 받았습니다.
현재 먼저 견적주신 분과 진행을 시작하게 되었습니다.
혹시 진행중 작업이 불가능해지는 경우가 발생하면 바로 연락드리겠습니다.
신경써 주셔서 감사합니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

제작의뢰

SIR은 제작의뢰에 일체 관여하지 않습니다. SIR을 사칭하는 경우가 있으니 주의하세요. 

+
번호 제목 글쓴이 날짜 조회
20567 1주 전 조회 487
20566 2주 전 조회 495
20565 3주 전 조회 542
20564 3주 전 조회 566
20563 3주 전 조회 569
20562 4주 전 조회 454
20561 4주 전 조회 392
20560 4주 전 조회 390
20559 1개월 전 조회 410
20558 1개월 전 조회 385
20557 1개월 전 조회 457
20556 1개월 전 조회 420
20555 1개월 전 조회 443
20554 1개월 전 조회 534
20553 1개월 전 조회 488
20552 1개월 전 조회 472
20551 1개월 전 조회 401
20550 1개월 전 조회 452
20549 1개월 전 조회 367
20548 1개월 전 조회 458
20547 1개월 전 조회 439
20546 1개월 전 조회 384
20545 1개월 전 조회 391
20544 1개월 전 조회 468
20543 1개월 전 조회 474
20542 1개월 전 조회 396
20541 1개월 전 조회 358
20540 1개월 전 조회 446
20539 1개월 전 조회 497
20538 1개월 전 조회 395
🐛 버그신고