그누보드로된 사이트 웹크롤링 로직 > 그누보드5 팁자료실

그누보드5 팁자료실

그누보드로된 사이트 웹크롤링 로직 정보

그누보드로된 사이트 웹크롤링 로직

첨부파일

simple_html_dom.php (61.8K) 277회 다운로드 2016-06-22 00:29:38
list_crawling.php (3.8K) 114회 다운로드 2016-06-22 00:29:38
view_crawling.php (7.5K) 25회 다운로드 2016-06-22 00:29:38
view_file_crawling.php (6.4K) 50회 다운로드 2016-06-22 00:29:38

본문

php로 웹크롤링 하기엔 사실 좀 적절하진 않습니다.

3개 파일로 구성되어져 있으며
list_crawling.php 는 리스트상 각 게싯물 정보들을 가져옵니다.
view_craling.php 는 본문내용을 가져옵니다.
view_file_crawling.php는 본문내용의 파일을 로컬로 다운받고 자기 서버에 해당글을 등록처리하게 됩니다.

이 로직을 토대로 본문부분 크로링 패턴은 조금 변경해서 사용하셔야 합니다.
추천
4
  • 복사

댓글 3개

© SIRSOFT
현재 페이지 제일 처음으로