snoopy 이용하여 특정 url의 정보를 크롤링했습니다.

snoopy 이용하여 특정 url의 정보를 크롤링했습니다.

QA

snoopy 이용하여 특정 url의 정보를 크롤링했습니다.

본문

 

아래와 같이  파싱을 통해 원하는 정보를 추출했는데요

이 부분을 파일로 저장하려면???

 

어떻게 해야할까요??

 

<?
include "../lib/Snoopy/Snoopy.class.php";


$snoopy  = new Snoopy; //스누피를 생성해줍시다

$login   = 'https://aaab.co.kr/bbs/login_check.php';
$url     = 'https://aaab.co.kr/bbs/board.php?bo_table=info&wr_id=1121';

 

//로그인 정보를 저장할 배열 auth를 만듭니다
//배열의 key는 해당 폼에서 넘겨줄 name이 되겠습니다
$auth['mb_id'] = 'alphaG';
$auth['mb_password']  = '6heonc';


$snoopy->submit($login,$auth); //스누피의 submit함수로 폼정보를 넘겨줍시다
$snoopy->setcookies(); //로그인에 관련하여 쿠키를 사용하는 경우가 있으니 쿠키정보를 저장해둡니다
$snoopy->fetch($url); //스누피의 fetch함수로 웹페이지를 긁어볼까요?


//echo $snoopy->results; //결과는 $snoopy->results에 저장되어 있습니다


preg_match('~<div\sclass="view-content">(.*?)<div\sclass="clear">~is', $snoopy->results, $text); //preg_match 정규식을 사용해서 필요한 요소만을 추출해보도록 하죠


echo $text[1]; //이제 결과를 보면...?

?>

이 질문에 댓글 쓰기 :

답변 1

답변을 작성하시기 전에 로그인 해주세요.
전체 529
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT