html 파싱 질문드려요 채택완료

html 파싱후에 

    //이미지 태그의 src 추출

    $iup->addPattern('/<img[^>]*src=["\']?([^>"\']+)["\']?[^>]*>/');

    

    //소스에 존재하지 않는 패턴의 결과를 보여주기 위한것(아무것도 안나옴)

    $iup->addPattern('/ddd/');

    

    //a 태그의 텍스트 내용을 추출한다

    $iup->addPattern('/<a\s[^>]*>([^<]+)<\/a>/');

 

    이런 식으로 클래스를 이용하여 정규식을 사용해서 배열형식으로 저장하고 있습니다.

 

    질문은 meta 프로퍼티의 og:image content 값을 얻고 싶은데 정규식을 어떻게 사용해야 할까요 ㅠㅠ

답변 1개

채택된 답변
+20 포인트

오픈그래프도 메타이므로 여러가지 방법이 있을거 같습니다.

예시첨부합니다.

 

meta[@property='og:image']

<meta property="og:image" content="(.*?)" \/> 

/og:image"\s*content="([^"]+)"/ 

 

 

기타예제

http://www.rubular.com/r/YY70uaGPLE 

 

로그인 후 평가할 수 있습니다

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인
🐛 버그신고