파싱 예제입니다.

사용자가 직접 에디터를 통해 올린 글이라 규칙 잡기가 쉽지 않지만 

대략 샘플 소스 같이 한다면

거의 대부분 가져올수 있습니다.

 

ps) 공부용입니다. 

대상 페이지가 문제 된다면 삭제하도록 하겠습니다.

첨부파일

test2.php (1.8 KB) 183회 2015-11-12 22:20
|

댓글 11개

보셔서 도움이 되시면
기분 좋게, 좋아요 부탁합니다 ^^
보기전에 우선 좋아요 부터 해드립니다 ㅎ
ㅎㅎ 고맙습니다.
링크는 오해의 소지가 있는거 같아서 제거하였습니다.
Snoopy 클래스
http://sourceforge.net/projects/snoopy/

Simple HTML DOM Parser
http://simplehtmldom.sourceforge.net/manual.htm

Snoopy로 긁어와서 HTML DOM Parser 로 접근하면 jquery로 요소에 접근하듯이 개별 요소를 가져오기 쉽더라구요.
어려운 정규표현식 안써도 되서 너무 좋더라구요. ㅎㅎ
네에 그렇게 해도 되죠

스누피는 기본이 1.0 통신이고 경우에 따라 안되는 경우도 제법 있습니다.
조금 많이 손봐야 할 경우가 제법있고

스누피보다는 curl 을 쓰는게 났습니다.

HTML DOM Parser 는 좋긴 한데
대량 처리하기에는 리소스를 많이 잡아 먹습니다.
그냥 쓰기에는 좋습니다. ㅎㅎ

그리고 위 예제 페이지는
사용자가 에디터에서 직접 입력한 내용들이라 매우 불규칙합니다.
HTML DOM Parser 를 써도 제대로 가져오기 어려운 내용입니다.

그냥 위 예제는 심심풀이 땅콩용입니다 ㅎㅎ
아... 그렇군요... 또 그런 문제가 숨겨져 있군요...
거의 안쓰다가 최근에야 잠깐 만져본거라 자세히는 몰라서요~ ㅎㅎㅎ
좋은글 감사함니다.
질문좀하나드려도될가요 답을못찾아서요..
네이버비공개카페글을 가져오려고하는데요 카페는본인이 주인장으로되있구요.
위방법으로하니 로그인페이지가나오고 진행이안되서요
fwrite($fp 이부분에 뭘넣어줘야하는지요?
네 그런 경우라면
로그인을 처리하고 쿠키를 따로 저장하는 부분도 있어야 합니다.
여기서 다룰 내용은 아니구요......
댓글을 작성하시려면 로그인이 필요합니다. 로그인

프로그램

+
제목 글쓴이 날짜 조회
10년 전 조회 837
10년 전 조회 670
10년 전 조회 599
10년 전 조회 588
10년 전 조회 685
10년 전 조회 458
10년 전 조회 493
10년 전 조회 711
10년 전 조회 539
10년 전 조회 499
10년 전 조회 489
10년 전 조회 499
10년 전 조회 503
10년 전 조회 481
10년 전 조회 495
10년 전 조회 522
10년 전 조회 614
10년 전 조회 456
10년 전 조회 478
10년 전 조회 560
10년 전 조회 1,312
10년 전 조회 516
10년 전 조회 508
10년 전 조회 642
10년 전 조회 526
10년 전 조회 706
10년 전 조회 630
10년 전 조회 511
10년 전 조회 514
10년 전 조회 569
10년 전 조회 564
10년 전 조회 455
10년 전 조회 453
10년 전 조회 410
10년 전 조회 464
10년 전 조회 862
10년 전 조회 463
10년 전 조회 581
10년 전 조회 495
10년 전 조회 697
10년 전 조회 511
10년 전 조회 429
10년 전 조회 477
10년 전 조회 494
10년 전 조회 625
10년 전 조회 560
10년 전 조회 411
10년 전 조회 483
10년 전 조회 1,435
10년 전 조회 1,335
10년 전 조회 866
10년 전 조회 1,481
10년 전 조회 524
10년 전 조회 967
10년 전 조회 1,171
10년 전 조회 614
10년 전 조회 585
10년 전 조회 576
10년 전 조회 426
10년 전 조회 598
10년 전 조회 603
10년 전 조회 1,133
10년 전 조회 541
10년 전 조회 613
10년 전 조회 584
10년 전 조회 1,513
10년 전 조회 615
10년 전 조회 480
10년 전 조회 632
10년 전 조회 643
10년 전 조회 723
10년 전 조회 511
10년 전 조회 576
10년 전 조회 971
10년 전 조회 905
10년 전 조회 888
10년 전 조회 432
10년 전 조회 531
10년 전 조회 524
10년 전 조회 460
10년 전 조회 729
10년 전 조회 458
10년 전 조회 794
10년 전 조회 460
10년 전 조회 759
10년 전 조회 456
10년 전 조회 683
10년 전 조회 1,244
10년 전 조회 567
10년 전 조회 596
10년 전 조회 435
10년 전 조회 1,523
10년 전 조회 1,147
10년 전 조회 746
10년 전 조회 700
10년 전 조회 509
10년 전 조회 626
10년 전 조회 1,296
10년 전 조회 1,327
10년 전 조회 2,003
🐛 버그신고