웹 소스 긁어오기

<?
function open_url($url)
{
if (preg_match('/^(https?)\:\/\/([^\/]+)(.*)/', $url, $pregs))
{
$host = $pregs[2];
$port = ($pregs[1] == 'http' ? 80 : 443);
$suburl = $pregs[3];
if (!$suburl) $suburl = '/';
if ($fp = fsockopen($host, $port, $errno, $errstr, 10))
{
fputs($fp, "GET {$suburl} HTTP/1.0\r\n");
fputs($fp, "Host: {$host}\r\n");
fputs($fp, "User-Agnet: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1)\r\n");
fputs($fp, "\r\n");
while (!feof($fp))
{
// $temp .= iconv('UTF-8', 'CP949', fgets($fp, 512)); // UTF-8
$temp .= fgets($fp, 512);
}
fclose($fp);
$arr = explode("\r\n\r\n", $temp, 2);
if (count($arr) < 2) return;
return array(
'header'=>$arr[0],
'body'=>$arr[1]
);
}
}
}

print_r(open_url('http://sir.co.kr/'));
?>

첨부파일

open_url.php (867 bytes) 62회 2012-09-04 13:37
|

댓글 14개

크롤러인가요?
사람을 지칭하시는건가요 아니면 기능의 역할을 지칭하시는건가요? ㅎㅎ
올려두고 물어보신다면 ;;
구글에서 크롤러를 검색해보세요 :)
기능이 비슷한지 해서 물어본 내용입니다.
기능은 웹사이트 코드를 긁어오는 것이니 당연히 비슷하죠.
이 코드를 수정해서 크롤러로 사용이 가능할수도 있겠지만, 저는 그런 의도로 올린건 아닙니다.
그리고 '크롤러'라고 하셔서 '크롤링 하는 사람'을 지칭하셨던 것인지
'크롤러 기능'을 지칭한 것인지를 여쭌것이지요 :D
어떻게 사용하는건가요~?
제가 만든 open_url 함수를 추가하시고 호출하시면 됩니다.
반환값은 긁어오기에 성공하면 header와 body를 인덱스로 갖는 배열이 반환되고, 실패시엔 아무것도 반환되지 않습니다.
header 에는 http 헤더가, body에는 http 내용이 들어갑니다
때론 유용하게 사용되겠네요 ^^
감사합니다~ ^^
소스만 가지고오는
네 웹소스 긁어오는 프로그램입니다 ^^
파싱이..스누피도 있고..^^;;
중요한건 소스를 어떻게 컨트롤하느냐겠지요ㅎㅎㅎ
태그 날리는것도 한몫할것이고..
한마디로 정규식을 배워야 요것을 매우 유용하게 사용할수있을것이다..이런거지요
맞는 말씀이지요 ㅎㅎ
좋은 소스네요 ㅋㅋ
유용한 정보 감사합니다
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

태그 필터 (최대 3개) 전체 개발자 소스 기타 mysql 팁자료실 javascript php linux flash 정규표현식 jquery node.js mobile 웹서버 os 프로그램 강좌 썸네일 이미지관련 도로명주소 그누보드5 기획자 견적서 계약서 기획서 마케팅 제안서 seo 통계 서식 통계자료 퍼블리셔 html css 반응형 웹접근성 퍼블리싱 표준화 반응형웹 홈페이지기초 부트스트랩 angularjs 포럼 스크린리더 센스리더 개발자톡 개발자팁 퍼블리셔톡 퍼블리셔팁 기획자톡 기획자팁 프로그램강좌 퍼블리싱강좌
+
제목 글쓴이 날짜 조회
13년 전 조회 1,818
13년 전 조회 2,230
13년 전 조회 1,790
13년 전 조회 1,844
13년 전 조회 2,179
13년 전 조회 1,962
13년 전 조회 2,575
13년 전 조회 2,024
13년 전 조회 1,578
13년 전 조회 2,188
13년 전 조회 5,523
13년 전 조회 1,867
13년 전 조회 2,385
13년 전 조회 3,998
13년 전 조회 2,590
13년 전 조회 2,944
13년 전 조회 2,559
13년 전 조회 3,220
13년 전 조회 2,643
13년 전 조회 2,231
13년 전 조회 1,696
13년 전 조회 1.5만
13년 전 조회 2,485
13년 전 조회 4,606
13년 전 조회 2,256
13년 전 조회 1,703
13년 전 조회 1,857
13년 전 조회 1,698
13년 전 조회 1,864
13년 전 조회 5,631
13년 전 조회 7,403
13년 전 조회 2,108
13년 전 조회 5,982
13년 전 조회 2,234
13년 전 조회 1,793
13년 전 조회 1,942
13년 전 조회 1,765
13년 전 조회 1,679
13년 전 조회 1,924
13년 전 조회 2,016
13년 전 조회 1,749
13년 전 조회 1,805
13년 전 조회 2,255
13년 전 조회 8,824
13년 전 조회 4,026
13년 전 조회 1,722
13년 전 조회 2,306
13년 전 조회 2,236
13년 전 조회 2,334
13년 전 조회 6,258
13년 전 조회 1,729
13년 전 조회 2,230
13년 전 조회 3,696
13년 전 조회 3,326
13년 전 조회 2,974
13년 전 조회 3,160
13년 전 조회 4,085
13년 전 조회 1,743
13년 전 조회 3,268
13년 전 조회 2,473
13년 전 조회 4,397
13년 전 조회 4,496
13년 전 조회 2,232
13년 전 조회 5,312
13년 전 조회 2,392
13년 전 조회 2,573
13년 전 조회 3,008
13년 전 조회 2,972
13년 전 조회 2,018
13년 전 조회 2,210
13년 전 조회 4,114
13년 전 조회 2,184
13년 전 조회 2,681
13년 전 조회 3,506
13년 전 조회 3,283
13년 전 조회 2,012
13년 전 조회 2,662
13년 전 조회 4,964
13년 전 조회 2,298
13년 전 조회 2,744
13년 전 조회 2,238
13년 전 조회 2,441
13년 전 조회 2,909
13년 전 조회 1,976
13년 전 조회 2,907
13년 전 조회 2,557
13년 전 조회 2,102
13년 전 조회 1.1만
13년 전 조회 2,216
13년 전 조회 2,061
13년 전 조회 2,181
13년 전 조회 2,899
13년 전 조회 2,280
13년 전 조회 2,375
13년 전 조회 2,035
13년 전 조회 1,874
13년 전 조회 6,024
13년 전 조회 2,283
13년 전 조회 2,355
13년 전 조회 2,137