크롤링 정규식 관련

크롤링 정규식 관련

QA

크롤링 정규식 관련

본문

1번
<div class="na-item">
<a href="/bbs/board.php?bo_table=bbs02&wr_id=9018" class="na-subject">
<span class="na-icon na-new"></span> 제목aaaaaaaaaaaaaaa </a>
</div>


2번
<div class="na-item">
<a href="/bbs/board.php?bo_table=bbs02&wr_id=9017" class="na-subject">
제목 bbbbbbbbbbbbbbbb </a>
</div>


크롤링 정규식 만들라고 하는 데 위에 게시판 1번 2번이 혼합되어 있네요..

1번은 <span class="na-icon na-new"></span> 들어있고 2번은 없고요

 

~<div\sclass"na=item">.+?<a\shref="(.+?)".+?</span>(.+?)</a>~isx
1번용은 이렇게 게시판주소와 제목 뽑아내는거 만들었는데 

 

정규식 or  if 의 개념 자체를 몰라서 2번과 같이 크롤링 할수 있게 정규식 짜는 

방법을 모르겠네요

 

 

이 질문에 댓글 쓰기 :

답변 1

답변을 작성하시기 전에 로그인 해주세요.
전체 123,129 | RSS
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT