curl 을 이용해서 파싱을 해보는 중입니다
본문
안녕하세요~ 즐거운 추석 되세요.
아래 주소는 접속이 아주 잘 되는데요.
https://m.cafe.naver.com/ca-fe/web/cafes/m2school/articles/2981883?useCafeId=false&query=공무원
컬을 쓰면 당연히 화면이 보일줄 알았는데 안나와서 아주 당혹스럽습니다.... ㅠ
고수님의 고견 부탁드립니다...
$url = 'https://m.cafe.naver.com/ca-fe/web/cafes/m2school/articles/2981883?useCafeId=false&query=공무원';
$agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Whale/2.8.107.16 Safari/537.36';
$refer = 'https://www.naver.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_REFERER, $refer);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_MAXREDIRS, 10); //최대 리다이렉트 횟수
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER , 0);
$output = curl_exec($ch);
curl_close($ch);
$html =new simple_html_dom(); //돔 객체 생성
$html->load($output, true, false )
echo $html;
답변 2
상단에 그누보드의 공통파일
common.php가 인클루드 되게 하시고
보통은 다른파일들이 _common.php 를 인클루드한것을 참고하시면..되구요
print_r2($html);
로 찍어보시는게 좀더 편하게 잘 보여집니다.
var_dump($html) 해보시면 됩니다.
simple_html_dom() 의 결과는 dom tree 객체입니다.
아마 최상이 root인 body객체나 html일걸로 생각됩니다.
답변을 작성하시기 전에 로그인 해주세요.