그누보드로된 사이트 웹크롤링 로직 > 그누보드5 팁자료실

그누보드5 팁자료실

그누보드로된 사이트 웹크롤링 로직 정보

그누보드로된 사이트 웹크롤링 로직

첨부파일

simple_html_dom.php (61.8K) 265회 다운로드 2016-06-22 00:29:38
list_crawling.php (3.8K) 112회 다운로드 2016-06-22 00:29:38
view_crawling.php (7.5K) 24회 다운로드 2016-06-22 00:29:38
view_file_crawling.php (6.4K) 49회 다운로드 2016-06-22 00:29:38

본문

php로 웹크롤링 하기엔 사실 좀 적절하진 않습니다.

3개 파일로 구성되어져 있으며
list_crawling.php 는 리스트상 각 게싯물 정보들을 가져옵니다.
view_craling.php 는 본문내용을 가져옵니다.
view_file_crawling.php는 본문내용의 파일을 로컬로 다운받고 자기 서버에 해당글을 등록처리하게 됩니다.

이 로직을 토대로 본문부분 크로링 패턴은 조금 변경해서 사용하셔야 합니다.
추천
4

댓글 3개

전체 2,431 |RSS
그누보드5 팁자료실 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT