사용자가 직접 에디터를 통해 올린 글이라 규칙 잡기가 쉽지 않지만
대략 샘플 소스 같이 한다면
거의 대부분 가져올수 있습니다.
ps) 공부용입니다.
대상 페이지가 문제 된다면 삭제하도록 하겠습니다.
이 게시물을 신고 하시겠습니까?신고사유를 선택해주세요.
댓글을 작성하시려면 로그인이 필요합니다.
댓글 11개
기분 좋게, 좋아요 부탁합니다 ^^
http://sourceforge.net/projects/snoopy/
Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/manual.htm
Snoopy로 긁어와서 HTML DOM Parser 로 접근하면 jquery로 요소에 접근하듯이 개별 요소를 가져오기 쉽더라구요.
어려운 정규표현식 안써도 되서 너무 좋더라구요. ㅎㅎ
스누피는 기본이 1.0 통신이고 경우에 따라 안되는 경우도 제법 있습니다.
조금 많이 손봐야 할 경우가 제법있고
스누피보다는 curl 을 쓰는게 났습니다.
HTML DOM Parser 는 좋긴 한데
대량 처리하기에는 리소스를 많이 잡아 먹습니다.
그냥 쓰기에는 좋습니다. ㅎㅎ
그리고 위 예제 페이지는
사용자가 에디터에서 직접 입력한 내용들이라 매우 불규칙합니다.
HTML DOM Parser 를 써도 제대로 가져오기 어려운 내용입니다.
그냥 위 예제는 심심풀이 땅콩용입니다 ㅎㅎ
거의 안쓰다가 최근에야 잠깐 만져본거라 자세히는 몰라서요~ ㅎㅎㅎ
네이버비공개카페글을 가져오려고하는데요 카페는본인이 주인장으로되있구요.
위방법으로하니 로그인페이지가나오고 진행이안되서요
fwrite($fp 이부분에 뭘넣어줘야하는지요?
로그인을 처리하고 쿠키를 따로 저장하는 부분도 있어야 합니다.
여기서 다룰 내용은 아니구요......