o

그누보드로된 사이트 웹크롤링 로직

php로 웹크롤링 하기엔 사실 좀 적절하진 않습니다.

3개 파일로 구성되어져 있으며
list_crawling.php 는 리스트상 각 게싯물 정보들을 가져옵니다.
view_craling.php 는 본문내용을 가져옵니다.
view_file_crawling.php는 본문내용의 파일을 로컬로 다운받고 자기 서버에 해당글을 등록처리하게 됩니다.

이 로직을 토대로 본문부분 크로링 패턴은 조금 변경해서 사용하셔야 합니다.

첨부파일

simple_html_dom.php (61.8 KB) 277회 2016-06-22 00:29
list_crawling.php (3.8 KB) 114회 2016-06-22 00:29
view_crawling.php (7.5 KB) 26회 2016-06-22 00:29
view_file_crawling.php (6.4 KB) 50회 2016-06-22 00:29
|

댓글 3개

자료 감사합니다.
간단하게 사용법도 알수 있을까요?
간단한 예시라도 부탁드립니다.
자료 고맙습니다.
자료 감사합니다.
댓글을 작성하시려면 로그인이 필요합니다.

그누보드5 팁자료실

+
제목 글쓴이 날짜 조회
9년 전 조회 7,745
9년 전 조회 1만
9년 전 조회 6,238
9년 전 조회 1.2만
9년 전 조회 2만
9년 전 조회 1.2만
9년 전 조회 1만
9년 전 조회 6,160
9년 전 조회 1.2만
9년 전 조회 7,387
9년 전 조회 7,887
9년 전 조회 1.7만
9년 전 조회 8,060
9년 전 조회 8,809
9년 전 조회 9,362
9년 전 조회 7,025
9년 전 조회 1.8만
9년 전 조회 9,645
9년 전 조회 7,449
9년 전 조회 8,896
9년 전 조회 6,781
9년 전 조회 1.8만
9년 전 조회 1.9만
9년 전 조회 9,455
9년 전 조회 7,719
9년 전 조회 2.3만
9년 전 조회 7,134
9년 전 조회 9,558
9년 전 조회 7,723
9년 전 조회 7,141