크롤링 정규식 관련

크롤링 정규식 관련

QA

크롤링 정규식 관련

답변 1

본문

1번
<div class="na-item">
<a href="/bbs/board.php?bo_table=bbs02&wr_id=9018" class="na-subject">
<span class="na-icon na-new"></span> 제목aaaaaaaaaaaaaaa </a>
</div>


2번
<div class="na-item">
<a href="/bbs/board.php?bo_table=bbs02&wr_id=9017" class="na-subject">
제목 bbbbbbbbbbbbbbbb </a>
</div>


크롤링 정규식 만들라고 하는 데 위에 게시판 1번 2번이 혼합되어 있네요..

1번은 <span class="na-icon na-new"></span> 들어있고 2번은 없고요

 

~<div\sclass"na=item">.+?<a\shref="(.+?)".+?</span>(.+?)</a>~isx
1번용은 이렇게 게시판주소와 제목 뽑아내는거 만들었는데 

 

정규식 or  if 의 개념 자체를 몰라서 2번과 같이 크롤링 할수 있게 정규식 짜는 

방법을 모르겠네요

 

 

이 질문에 댓글 쓰기 :

답변 1

답변을 작성하시기 전에 로그인 해주세요.
QA 내용 검색
질문등록
전체 27
© SIRSOFT
현재 페이지 제일 처음으로