1

php 로 한 네이버 카페의 회원들 아이디를 추출

· 12년 전 · 3824 · 10
이게 가능한 이야기인가요??

불가능할거같은데..;
웹 크롤러와 비슷한 원리인가요?
|

댓글 10개

제가 그렇게하는데요???
제가 제작한게 하나있는데
php로 제작됬고요..

원리는 간단합니다.
Snoopy Class 나 CURL 로 파싱을 우선합니다.
네이버 카페측에서는 프레임을 이용하니깐 프레임 원본주소을 추출하고
페이지가 1페이지부터 999페이지 까지 파싱이 가능합니다.

전체게시물 보기시 소스보기하면 아이디가 나옵니다. 게시물 닉네임 옆에 그걸 정규식이나 explode로 짤라서 추출합니다.
그리고 뒤에@naver.com 붙이면 끝입니다.

이걸 이용해서 999~1페이지까지 돌아가면서 추출하게 합니다.
크론을 써도되고 안써도되고 딜레이 주기는 1페이지 마다 4초로 하시면될거같구요.


웹 크롤러 랑은 관계가 없는거같구요
위 방법처럼하면 어떤 카페든 추출이 가능합니다.

꼼수을 사용해서 카페api 이용해서 원하는 키워드의 카페을 추출하고
그 카페 고유번호 추출후 모든 카페의 회원 추출이 완료되면 종료하게 할수있습니다.
헐 이게 또 이렇게 하면 될수도 있겠네요..

역시 php에선 아직 제가 부족한거 같습니다 ㅠㅠ
좋은 정보 감사합니다!
만약에 막히시는 부분있으시면 말씀해주세요^^..
php 로 저렇게 해놓고 계속 리플래시 시켜놓으면 하루에 대략 10만개 이상추출가능합니다.
제가 3일간거진 50만개 추출됬더군요

거기서 stmp 지메일로 이메일 대량으로도 뿌리구있구요..
이메일 뿌릴예정이시면 이렇게하셔도 될껍니다.
한번 추출만 해보려구요 ㅋㅋ

메일을 보내기엔 좀 스팸같은 느낌이 들지 않을까요..;-;
메일 보낼지 말지 여부는 일단 추출을 해보고..

하여튼 좋은 정보 감사합니다ㅎ
ㅎㅎ 스팸같은 느낌 아니라 당연히 스팸이죠 ^^
앗 그러네요 ㅋㅋㅋㅋㅋ
아... 단순 파싱이었군요..
난 대단한 뭔가 있는줄 알고 경이의 눈으로 보고 있었는데..
좋은 정보 감사합니다.
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

태그 필터 (최대 3개) 전체 개발자 소스 기타 mysql 팁자료실 javascript php linux flash 정규표현식 jquery node.js mobile 웹서버 os 프로그램 강좌 썸네일 이미지관련 도로명주소 그누보드5 기획자 견적서 계약서 기획서 마케팅 제안서 seo 통계 서식 통계자료 퍼블리셔 html css 반응형 웹접근성 퍼블리싱 표준화 반응형웹 홈페이지기초 부트스트랩 angularjs 포럼 스크린리더 센스리더 개발자톡 개발자팁 퍼블리셔톡 퍼블리셔팁 기획자톡 기획자팁 프로그램강좌 퍼블리싱강좌
+
제목 글쓴이 날짜 조회
11년 전 조회 2,906
11년 전 조회 2,093
11년 전 조회 1,475
11년 전 조회 1,808
11년 전 조회 1,475
11년 전 조회 3,493
11년 전 조회 2,477
11년 전 조회 1,463
11년 전 조회 1,610
11년 전 조회 1,949
11년 전 조회 1,596
11년 전 조회 1,658
11년 전 조회 1,638
11년 전 조회 1,561
12년 전 조회 1,492
12년 전 조회 1,620
12년 전 조회 1,602
12년 전 조회 1,527
12년 전 조회 3,879
12년 전 조회 2,020
12년 전 조회 1,293
12년 전 조회 1,356
12년 전 조회 2,894
12년 전 조회 1,965
12년 전 조회 1,612
12년 전 조회 1,384
12년 전 조회 1,757
12년 전 조회 1,336
12년 전 조회 2,311
12년 전 조회 1,786
12년 전 조회 1,209
12년 전 조회 1,524
12년 전 조회 2,482
12년 전 조회 2,364
12년 전 조회 1,869
12년 전 조회 1,317
12년 전 조회 1,908
12년 전 조회 1,277
12년 전 조회 3,291
12년 전 조회 2,095
12년 전 조회 2,227
12년 전 조회 1,364
12년 전 조회 1,185
12년 전 조회 3,380
12년 전 조회 1,664
12년 전 조회 1,142
12년 전 조회 3,243
12년 전 조회 1,248
12년 전 조회 2,908
12년 전 조회 3,825
12년 전 조회 2,242
12년 전 조회 1,411
12년 전 조회 1,111
12년 전 조회 1,443
12년 전 조회 1,583
12년 전 조회 1,288
12년 전 조회 4,363
12년 전 조회 1,205
12년 전 조회 1,244
12년 전 조회 1,185
12년 전 조회 5,373
12년 전 조회 1,313
12년 전 조회 1,659
12년 전 조회 1,452
12년 전 조회 1,362
12년 전 조회 2,268
12년 전 조회 2,066
12년 전 조회 1,310
12년 전 조회 1,833
12년 전 조회 1,653
12년 전 조회 1,398
12년 전 조회 1,298
12년 전 조회 1,985
12년 전 조회 1,680
12년 전 조회 2,243
12년 전 조회 3,303
12년 전 조회 1,230
12년 전 조회 1,480
12년 전 조회 1,418
12년 전 조회 4,035
12년 전 조회 1,697
12년 전 조회 1,955
12년 전 조회 1,580
12년 전 조회 1,260
12년 전 조회 1,408
12년 전 조회 2,115
12년 전 조회 1,306
12년 전 조회 1,341
12년 전 조회 2,710
12년 전 조회 1,920
12년 전 조회 1,801
12년 전 조회 1,868
12년 전 조회 1,526
12년 전 조회 1,622
12년 전 조회 1,549
12년 전 조회 1,986
12년 전 조회 1,221
12년 전 조회 1,304
12년 전 조회 1,366
12년 전 조회 1,942