html 파싱 질문드려요
본문
html 파싱후에
//이미지 태그의 src 추출
$iup->addPattern('/<img[^>]*src=["\']?([^>"\']+)["\']?[^>]*>/');
//소스에 존재하지 않는 패턴의 결과를 보여주기 위한것(아무것도 안나옴)
$iup->addPattern('/ddd/');
//a 태그의 텍스트 내용을 추출한다
$iup->addPattern('/<a\s[^>]*>([^<]+)<\/a>/');
이런 식으로 클래스를 이용하여 정규식을 사용해서 배열형식으로 저장하고 있습니다.
질문은 meta 프로퍼티의 og:image content 값을 얻고 싶은데 정규식을 어떻게 사용해야 할까요 ㅠㅠ
답변 1
오픈그래프도 메타이므로 여러가지 방법이 있을거 같습니다.
예시첨부합니다.
meta[@property='og:image']
<meta property="og:image" content="(.*?)" \/>
/og:image"\s*content="([^"]+)"/
기타예제
http://www.rubular.com/r/YY70uaGPLE
답변을 작성하시기 전에 로그인 해주세요.