o

그누보드로된 사이트 웹크롤링 로직

php로 웹크롤링 하기엔 사실 좀 적절하진 않습니다.

3개 파일로 구성되어져 있으며
list_crawling.php 는 리스트상 각 게싯물 정보들을 가져옵니다.
view_craling.php 는 본문내용을 가져옵니다.
view_file_crawling.php는 본문내용의 파일을 로컬로 다운받고 자기 서버에 해당글을 등록처리하게 됩니다.

이 로직을 토대로 본문부분 크로링 패턴은 조금 변경해서 사용하셔야 합니다.

첨부파일

simple_html_dom.php (61.8 KB) 277회 2016-06-22 00:29
list_crawling.php (3.8 KB) 114회 2016-06-22 00:29
view_crawling.php (7.5 KB) 26회 2016-06-22 00:29
view_file_crawling.php (6.4 KB) 50회 2016-06-22 00:29
|

댓글 3개

자료 감사합니다.
간단하게 사용법도 알수 있을까요?
간단한 예시라도 부탁드립니다.
자료 고맙습니다.
자료 감사합니다.
댓글을 작성하시려면 로그인이 필요합니다.

그누보드5 팁자료실

+
제목 글쓴이 날짜 조회
9년 전 조회 7,828
9년 전 조회 1만
9년 전 조회 6,305
9년 전 조회 1.2만
9년 전 조회 2.1만
9년 전 조회 1.2만
9년 전 조회 1만
9년 전 조회 6,243
9년 전 조회 1.2만
9년 전 조회 7,450
9년 전 조회 7,975
9년 전 조회 1.7만
9년 전 조회 8,128
9년 전 조회 8,892
9년 전 조회 9,434
9년 전 조회 7,088
9년 전 조회 1.8만
9년 전 조회 9,725
9년 전 조회 7,528
9년 전 조회 8,985
9년 전 조회 6,846
9년 전 조회 1.8만
9년 전 조회 1.9만
9년 전 조회 9,528
9년 전 조회 7,777
9년 전 조회 2.3만
9년 전 조회 7,198
9년 전 조회 9,643
9년 전 조회 7,790
9년 전 조회 7,211