snoopy 이용하여 특정 url의 정보를 크롤링했습니다.
본문
아래와 같이 파싱을 통해 원하는 정보를 추출했는데요
이 부분을 파일로 저장하려면???
어떻게 해야할까요??
<?
include "../lib/Snoopy/Snoopy.class.php";
$snoopy = new Snoopy; //스누피를 생성해줍시다
$login = 'https://aaab.co.kr/bbs/login_check.php';
$url = 'https://aaab.co.kr/bbs/board.php?bo_table=info&wr_id=1121';
//로그인 정보를 저장할 배열 auth를 만듭니다
//배열의 key는 해당 폼에서 넘겨줄 name이 되겠습니다
$auth['mb_id'] = 'alphaG';
$auth['mb_password'] = '6heonc';
$snoopy->submit($login,$auth); //스누피의 submit함수로 폼정보를 넘겨줍시다
$snoopy->setcookies(); //로그인에 관련하여 쿠키를 사용하는 경우가 있으니 쿠키정보를 저장해둡니다
$snoopy->fetch($url); //스누피의 fetch함수로 웹페이지를 긁어볼까요?
//echo $snoopy->results; //결과는 $snoopy->results에 저장되어 있습니다
preg_match('~<div\sclass="view-content">(.*?)<div\sclass="clear">~is', $snoopy->results, $text); //preg_match 정규식을 사용해서 필요한 요소만을 추출해보도록 하죠
echo $text[1]; //이제 결과를 보면...?
?>