리자

정규식 질문드립니다.

html 코드내에서,
링크를 세부분으로 나누어 추출하려고 합니다.
다음과 같은 html 내용이 있을때,
**************************************************************
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net"  />
**************************************************************

1. <a 혹은 <area 태그 내용
  (예: <a target=_blank href='http://www.naver.com'> )
2. 1내용중 href의 내용
  (href내용은 큰따옴표 혹은 작은따옴표로 감싸지거나 그냥 링크만 있을수도..)
3. <a 혹은 <area 의 텍스트내용
  (위 html의 첫째줄에서는 네이버, 둘째줄에서는 공백이 되겠네요.)

이 세 내용을 preg_match_all 함수와 정규식을 이용해 추출하고자 하는데,
정규식 작성이 잘 되지 않네요..

고수님들의 조언 부탁드립니다.
[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]
|

댓글 3개

내공이 부족해서 preg_match_all 은 못하겠네요.

<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;

preg_match("/(\<a[^\>]*\>)/i", $s, $match1);
preg_match("/href\=[\"\']?([^\"\'\s\>]+)/i", $match1[1], $match2);
preg_match("/\<a[^\>]*\>(.*)\<\/a/i", $s, $match3);
?>
<textarea rows=10 cols=100><?print_r($match1)?></textarea>
<textarea rows=10 cols=100><?print_r($match2)?></textarea>
<textarea rows=10 cols=100><?print_r($match3)?></textarea>
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;

preg_match_all("`<\s*(a[^>\s]*)[^>]* href\s*=\s*([^\s>]+)[^>]*(>(.+)</\s*\\1\s*>|/>)`is", $s, $match);

//print_r($match);


if (is_array($match[1])){

foreach($match[1] as $k => $v){

$text1 .= "$v , ";//태그들
$text2 .= str_replace(array("'", '"'), '', $match[2][$k]) . " , ";//링크들
$text3 .= trim($match[4][$k]) . " , ";//링크에 걸린 텍스트
}
}

echo "본문내의 태그들은? ==> $text1 <br>";
echo "본문내의 링크들은? ==> $text2 <br>";
echo "본문내의 링크에 걸린 텍스트는? ==> $text3 <br>";
?>

결과값
본문내의 태그들은? ==> a , area ,
본문내의 링크들은? ==> http://www.naver.com , http://www.daum.net ,
본문내의 링크에 걸린 텍스트는? ==> 네이버 , ,

요런 정도 하면 되지 않을 까요
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

+
제목 글쓴이 날짜 조회
17년 전 조회 2,370
17년 전 조회 1,638
17년 전 조회 3,211
17년 전 조회 3,075
17년 전 조회 3,051
17년 전 조회 3,919
17년 전 조회 2,594
17년 전 조회 2,414
17년 전 조회 2,664
17년 전 조회 2,901
17년 전 조회 2,618
17년 전 조회 1,460
17년 전 조회 1,904
17년 전 조회 1,496
17년 전 조회 1,921
17년 전 조회 2,519
17년 전 조회 8,701
17년 전 조회 3,162
17년 전 조회 4,249
17년 전 조회 1,987
17년 전 조회 3,666
17년 전 조회 1,559
17년 전 조회 1,391
17년 전 조회 2,331
17년 전 조회 1,323
17년 전 조회 1,637
17년 전 조회 1,472
17년 전 조회 2,539
17년 전 조회 1,506
17년 전 조회 1,097
17년 전 조회 1,232
17년 전 조회 3,105
17년 전 조회 2,169
17년 전 조회 1,978
17년 전 조회 1,222
17년 전 조회 2,455
17년 전 조회 1,174
17년 전 조회 1,134
17년 전 조회 1,383
17년 전 조회 2,747
17년 전 조회 2,399
17년 전 조회 2,487
17년 전 조회 1,188
17년 전 조회 1,304
17년 전 조회 3,249
17년 전 조회 2,834
17년 전 조회 4,105
17년 전 조회 2,268
17년 전 조회 2,361
17년 전 조회 1,414
17년 전 조회 2,533
17년 전 조회 2,220
17년 전 조회 2,974
17년 전 조회 2,485
17년 전 조회 1,645
17년 전 조회 2,437
17년 전 조회 1,596
17년 전 조회 1,182
17년 전 조회 2,243
17년 전 조회 2,889
17년 전 조회 4,065
17년 전 조회 3,153
17년 전 조회 1,419
17년 전 조회 1,708
17년 전 조회 2,249
17년 전 조회 1,555
17년 전 조회 1,731
17년 전 조회 2,722
17년 전 조회 2,149
17년 전 조회 1,802
17년 전 조회 4,204
17년 전 조회 3,053
17년 전 조회 1,446
17년 전 조회 3,574
17년 전 조회 2,806
17년 전 조회 2,082
17년 전 조회 1,304
17년 전 조회 2,339
17년 전 조회 2,074
17년 전 조회 1,990
17년 전 조회 1,936
17년 전 조회 1,184
17년 전 조회 1,889
17년 전 조회 2,942
17년 전 조회 1,441
17년 전 조회 1,683
17년 전 조회 1,367
17년 전 조회 1,613
17년 전 조회 1,585
17년 전 조회 1,457
17년 전 조회 2,570
17년 전 조회 2,334
17년 전 조회 2,113
17년 전 조회 1,422
17년 전 조회 2,440
17년 전 조회 4,261
17년 전 조회 2,745
17년 전 조회 1,671
17년 전 조회 1,861
17년 전 조회 3,239
🐛 버그신고