파싱 예제입니다.
사용자가 직접 에디터를 통해 올린 글이라 규칙 잡기가 쉽지 않지만
대략 샘플 소스 같이 한다면
거의 대부분 가져올수 있습니다.
ps) 공부용입니다.
대상 페이지가 문제 된다면 삭제하도록 하겠습니다.
첨부파일
|
댓글을 작성하시려면 로그인이 필요합니다.
로그인
프로그램
태그 필터 (최대 3개)
전체
개발자
소스
기타
mysql
팁자료실
javascript
php
linux
flash
정규표현식
jquery
node.js
mobile
웹서버
os
프로그램
강좌
썸네일
이미지관련
도로명주소
그누보드5
기획자
견적서
계약서
기획서
마케팅
제안서
seo
통계
서식
통계자료
퍼블리셔
html
css
반응형
웹접근성
퍼블리싱
표준화
반응형웹
홈페이지기초
부트스트랩
angularjs
포럼
스크린리더
센스리더
개발자톡
개발자팁
퍼블리셔톡
퍼블리셔팁
기획자톡
기획자팁
프로그램강좌
퍼블리싱강좌
댓글 11개
기분 좋게, 좋아요 부탁합니다 ^^
http://sourceforge.net/projects/snoopy/
Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/manual.htm
Snoopy로 긁어와서 HTML DOM Parser 로 접근하면 jquery로 요소에 접근하듯이 개별 요소를 가져오기 쉽더라구요.
어려운 정규표현식 안써도 되서 너무 좋더라구요. ㅎㅎ
스누피는 기본이 1.0 통신이고 경우에 따라 안되는 경우도 제법 있습니다.
조금 많이 손봐야 할 경우가 제법있고
스누피보다는 curl 을 쓰는게 났습니다.
HTML DOM Parser 는 좋긴 한데
대량 처리하기에는 리소스를 많이 잡아 먹습니다.
그냥 쓰기에는 좋습니다. ㅎㅎ
그리고 위 예제 페이지는
사용자가 에디터에서 직접 입력한 내용들이라 매우 불규칙합니다.
HTML DOM Parser 를 써도 제대로 가져오기 어려운 내용입니다.
그냥 위 예제는 심심풀이 땅콩용입니다 ㅎㅎ
거의 안쓰다가 최근에야 잠깐 만져본거라 자세히는 몰라서요~ ㅎㅎㅎ
네이버비공개카페글을 가져오려고하는데요 카페는본인이 주인장으로되있구요.
위방법으로하니 로그인페이지가나오고 진행이안되서요
fwrite($fp 이부분에 뭘넣어줘야하는지요?
로그인을 처리하고 쿠키를 따로 저장하는 부분도 있어야 합니다.
여기서 다룰 내용은 아니구요......