다른홈페이지 메인 이미지와 제목 가져오기

다른홈페이지 메인 이미지와 제목 가져오기

QA

다른홈페이지 메인 이미지와 제목 가져오기

본문

  <meta http-equiv="content-type" content="text/html; charset=utf-8" />
    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1" />
    <meta name="keywords" content="sasssd" />
    <meta name="Description" content="f3333" />
    <meta property="fb:app_id" content="118793551515130" />
    <meta property="og:title" content="eagle" />
    <meta property="og:type" content="website"/>
    <meta property="og:image" content="//218160428_480x270.jpg?655" />
    <meta property="og:site_name" content="at"/>

 

다름 홈페이지 메인의 웹페이지 소스보기하니까 위처럼 나오는데요

제홈페이지 DB 에     <meta property="og:title" content="eagle" /> 의 eagle 부분과

 <meta property="og:image" content="//218160428_480x270.jpg?655" />

218160428_480x270.jpg?655 을 가져와서 저장 하는 소스는 

크롤링 이라고하던데요 

예제 소스나 참고할수있는 사이트좀 알려주세요

이 질문에 댓글 쓰기 :

답변 4

php에서 제공하는 여러 함수나 오픈소스로 된 class 를 찾아보시면

크롤링 및 파싱에 관련한 여러 소스들이 나오실겁니다.

결국 원하는 부분만 가져오게하려면

정규식으로 원하는 div나 meta태그를 걸러내셔야합니다.

위의 질문은 메타태그를 가져오고 싶어하시니

특정 페이지를 크롤링 하시어 한줄마다 읽어들이면서 메타태그를 열때와

닫을때를 정규식으로 구분하시어 배열에 담습니다.

그 이후 해당 배열을 순환하며 원하는 메타태그를 찾을시

특정 content 부분을 또 가져와서 특정 변수에 넣어 사용하셔야 합니다.

답변을 작성하시기 전에 로그인 해주세요.
전체 123,510
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT