html 파싱 질문드려요

html 파싱 질문드려요

QA

html 파싱 질문드려요

본문

html 파싱후에 

    //이미지 태그의 src 추출

    $iup->addPattern('/<img[^>]*src=["\']?([^>"\']+)["\']?[^>]*>/');

    

    //소스에 존재하지 않는 패턴의 결과를 보여주기 위한것(아무것도 안나옴)

    $iup->addPattern('/ddd/');

    

    //a 태그의 텍스트 내용을 추출한다

    $iup->addPattern('/<a\s[^>]*>([^<]+)<\/a>/');

 

    이런 식으로 클래스를 이용하여 정규식을 사용해서 배열형식으로 저장하고 있습니다.

 

    질문은 meta 프로퍼티의 og:image content 값을 얻고 싶은데 정규식을 어떻게 사용해야 할까요 ㅠㅠ

이 질문에 댓글 쓰기 :

답변 1

오픈그래프도 메타이므로 여러가지 방법이 있을거 같습니다.

예시첨부합니다.

 

meta[@property='og:image']

<meta property="og:image" content="(.*?)" \/> 

/og:image"\s*content="([^"]+)"/ 

 

 

기타예제

http://www.rubular.com/r/YY70uaGPLE 

 

답변을 작성하시기 전에 로그인 해주세요.
전체 21
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT