2026, 새로운 도약을 시작합니다.

그누보드로된 사이트 웹크롤링 로직

php로 웹크롤링 하기엔 사실 좀 적절하진 않습니다.

3개 파일로 구성되어져 있으며
list_crawling.php 는 리스트상 각 게싯물 정보들을 가져옵니다.
view_craling.php 는 본문내용을 가져옵니다.
view_file_crawling.php는 본문내용의 파일을 로컬로 다운받고 자기 서버에 해당글을 등록처리하게 됩니다.

이 로직을 토대로 본문부분 크로링 패턴은 조금 변경해서 사용하셔야 합니다.

첨부파일

simple_html_dom.php (61.8 KB) 277회 2016-06-22 00:29
list_crawling.php (3.8 KB) 114회 2016-06-22 00:29
view_crawling.php (7.5 KB) 26회 2016-06-22 00:29
view_file_crawling.php (6.4 KB) 50회 2016-06-22 00:29
|

댓글 3개

자료 감사합니다.
간단하게 사용법도 알수 있을까요?
간단한 예시라도 부탁드립니다.
자료 고맙습니다.
자료 감사합니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

그누보드5 팁자료실

번호 제목 글쓴이 날짜 조회
공지 3년 전 조회 4,597
2741 3일 전 조회 99
2740 4일 전 조회 96
2739 1주 전 조회 206
2738 1주 전 조회 209
2737 1주 전 조회 174
2736 1주 전 조회 276
2735 3주 전 조회 278
2734 3주 전 조회 259
2733 1개월 전 조회 262
2732 1개월 전 조회 300
2731 1개월 전 조회 264
2730 1개월 전 조회 222
2729 1개월 전 조회 350
2728 1개월 전 조회 244
2727 1개월 전 조회 419
2726 1개월 전 조회 253
2725 1개월 전 조회 326
2724 1개월 전 조회 357
2723 1개월 전 조회 265
2722 1개월 전 조회 298
2721 1개월 전 조회 211
2720 2개월 전 조회 304
2719 2개월 전 조회 307
2718 2개월 전 조회 200
2717 2개월 전 조회 335
2716 2개월 전 조회 202
2715 2개월 전 조회 311
2714 2개월 전 조회 271
2713 2개월 전 조회 374
2712 2개월 전 조회 289
🐛 버그신고