파싱 예제입니다.

사용자가 직접 에디터를 통해 올린 글이라 규칙 잡기가 쉽지 않지만 

대략 샘플 소스 같이 한다면

거의 대부분 가져올수 있습니다.

 

ps) 공부용입니다. 

대상 페이지가 문제 된다면 삭제하도록 하겠습니다.

첨부파일

test2.php (1.8 KB) 183회 2015-11-12 22:20
|

댓글 11개

보셔서 도움이 되시면
기분 좋게, 좋아요 부탁합니다 ^^
보기전에 우선 좋아요 부터 해드립니다 ㅎ
ㅎㅎ 고맙습니다.
링크는 오해의 소지가 있는거 같아서 제거하였습니다.
Snoopy 클래스
http://sourceforge.net/projects/snoopy/

Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/manual.htm

Snoopy로 긁어와서 HTML DOM Parser 로 접근하면 jquery로 요소에 접근하듯이 개별 요소를 가져오기 쉽더라구요.
어려운 정규표현식 안써도 되서 너무 좋더라구요. ㅎㅎ
네에 그렇게 해도 되죠

스누피는 기본이 1.0 통신이고 경우에 따라 안되는 경우도 제법 있습니다.
조금 많이 손봐야 할 경우가 제법있고

스누피보다는 curl 을 쓰는게 났습니다.

HTML DOM Parser 는 좋긴 한데
대량 처리하기에는 리소스를 많이 잡아 먹습니다.
그냥 쓰기에는 좋습니다. ㅎㅎ

그리고 위 예제 페이지는
사용자가 에디터에서 직접 입력한 내용들이라 매우 불규칙합니다.
HTML DOM Parser 를 써도 제대로 가져오기 어려운 내용입니다.

그냥 위 예제는 심심풀이 땅콩용입니다 ㅎㅎ
아... 그렇군요... 또 그런 문제가 숨겨져 있군요...
거의 안쓰다가 최근에야 잠깐 만져본거라 자세히는 몰라서요~ ㅎㅎㅎ
좋은글 감사함니다.
질문좀하나드려도될가요 답을못찾아서요..
네이버비공개카페글을 가져오려고하는데요 카페는본인이 주인장으로되있구요.
위방법으로하니 로그인페이지가나오고 진행이안되서요
fwrite($fp 이부분에 뭘넣어줘야하는지요?
네 그런 경우라면
로그인을 처리하고 쿠키를 따로 저장하는 부분도 있어야 합니다.
여기서 다룰 내용은 아니구요......
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

+
제목 글쓴이 날짜 조회
10년 전 조회 1,853
10년 전 조회 1,711
10년 전 조회 1,682
10년 전 조회 1,632
10년 전 조회 1,728
10년 전 조회 1,479
10년 전 조회 1,566
10년 전 조회 1,774
10년 전 조회 1,594
10년 전 조회 1,555
10년 전 조회 1,548
10년 전 조회 1,561
10년 전 조회 1,590
10년 전 조회 1,577
10년 전 조회 1,598
10년 전 조회 1,555
10년 전 조회 1,724
10년 전 조회 1,520
10년 전 조회 1,547
10년 전 조회 1,661
10년 전 조회 2,341
10년 전 조회 1,609
10년 전 조회 1,595
10년 전 조회 1,663
10년 전 조회 1,570
10년 전 조회 1,760
10년 전 조회 1,669
10년 전 조회 1,581
10년 전 조회 1,565
10년 전 조회 1,598
10년 전 조회 1,612
10년 전 조회 1,535
10년 전 조회 1,482
10년 전 조회 1,471
10년 전 조회 1,499
10년 전 조회 1,910
10년 전 조회 1,525
10년 전 조회 1,637
10년 전 조회 1,571
10년 전 조회 1,808
10년 전 조회 1,631
10년 전 조회 1,538
10년 전 조회 1,572
10년 전 조회 1,602
10년 전 조회 1,729
10년 전 조회 1,664
10년 전 조회 1,556
10년 전 조회 1,588
10년 전 조회 2,548
10년 전 조회 2,422
10년 전 조회 1,969
10년 전 조회 2,545
10년 전 조회 1,621
10년 전 조회 2,020
10년 전 조회 2,243
10년 전 조회 1,763
10년 전 조회 1,699
10년 전 조회 1,665
10년 전 조회 1,534
10년 전 조회 1,696
10년 전 조회 1,703
10년 전 조회 2,222
10년 전 조회 1,635
10년 전 조회 1,725
10년 전 조회 1,702
10년 전 조회 2,618
10년 전 조회 1,759
10년 전 조회 1,642
10년 전 조회 1,735
10년 전 조회 1,759
10년 전 조회 1,830
10년 전 조회 1,633
10년 전 조회 1,722
10년 전 조회 2,059
10년 전 조회 2,004
10년 전 조회 1,979
10년 전 조회 1,530
10년 전 조회 1,624
10년 전 조회 1,585
10년 전 조회 1,549
10년 전 조회 1,773
10년 전 조회 1,546
10년 전 조회 1,858
10년 전 조회 1,533
10년 전 조회 1,859
10년 전 조회 1,564
10년 전 조회 1,794
10년 전 조회 2,384
10년 전 조회 1,700
10년 전 조회 1,761
10년 전 조회 1,622
10년 전 조회 2,675
10년 전 조회 2,294
10년 전 조회 1,900
10년 전 조회 1,826
10년 전 조회 1,633
10년 전 조회 1,779
10년 전 조회 2,448
10년 전 조회 2,489
10년 전 조회 3,141