php 로 한 네이버 카페의 회원들 아이디를 추출
이게 가능한 이야기인가요??
불가능할거같은데..;
웹 크롤러와 비슷한 원리인가요?
|
댓글을 작성하시려면 로그인이 필요합니다.
로그인
프로그램
태그 필터 (최대 3개)
전체
개발자
소스
기타
mysql
팁자료실
javascript
php
linux
flash
정규표현식
jquery
node.js
mobile
웹서버
os
프로그램
강좌
썸네일
이미지관련
도로명주소
그누보드5
기획자
견적서
계약서
기획서
마케팅
제안서
seo
통계
서식
통계자료
퍼블리셔
html
css
반응형
웹접근성
퍼블리싱
표준화
반응형웹
홈페이지기초
부트스트랩
angularjs
포럼
스크린리더
센스리더
개발자톡
개발자팁
퍼블리셔톡
퍼블리셔팁
기획자톡
기획자팁
프로그램강좌
퍼블리싱강좌
댓글 10개
php로 제작됬고요..
원리는 간단합니다.
Snoopy Class 나 CURL 로 파싱을 우선합니다.
네이버 카페측에서는 프레임을 이용하니깐 프레임 원본주소을 추출하고
페이지가 1페이지부터 999페이지 까지 파싱이 가능합니다.
전체게시물 보기시 소스보기하면 아이디가 나옵니다. 게시물 닉네임 옆에 그걸 정규식이나 explode로 짤라서 추출합니다.
그리고 뒤에@naver.com 붙이면 끝입니다.
이걸 이용해서 999~1페이지까지 돌아가면서 추출하게 합니다.
크론을 써도되고 안써도되고 딜레이 주기는 1페이지 마다 4초로 하시면될거같구요.
웹 크롤러 랑은 관계가 없는거같구요
위 방법처럼하면 어떤 카페든 추출이 가능합니다.
꼼수을 사용해서 카페api 이용해서 원하는 키워드의 카페을 추출하고
그 카페 고유번호 추출후 모든 카페의 회원 추출이 완료되면 종료하게 할수있습니다.
역시 php에선 아직 제가 부족한거 같습니다 ㅠㅠ
좋은 정보 감사합니다!
php 로 저렇게 해놓고 계속 리플래시 시켜놓으면 하루에 대략 10만개 이상추출가능합니다.
제가 3일간거진 50만개 추출됬더군요
거기서 stmp 지메일로 이메일 대량으로도 뿌리구있구요..
이메일 뿌릴예정이시면 이렇게하셔도 될껍니다.
메일을 보내기엔 좀 스팸같은 느낌이 들지 않을까요..;-;
메일 보낼지 말지 여부는 일단 추출을 해보고..
하여튼 좋은 정보 감사합니다ㅎ
난 대단한 뭔가 있는줄 알고 경이의 눈으로 보고 있었는데..
좋은 정보 감사합니다.