파싱 정규식 작성 질문

파싱 정규식 작성 질문

QA

파싱 정규식 작성 질문

본문

안녕하세요. 정규식 작성 질문이있어 글 남깁니다.

 

예를 들어 본문내용이

 

이미지

광고

광고

버튼

 

이런식일때 

 

광고를 제외하고

이미지, 글, 버튼만 추출하고싶어서

 

이미지태그와 글태그 사이를 그냥 .+?로 해서 넘어가고, 같은 방식으로 글태그와 버튼태그사이에 .+?로 넘기고 이미지, 글, 버튼에 해당하는 것들은 선택되도록 ( ) 쳐놨는데

 

막상 로컬호스트에서 테스트를 해보니 맨처음 이미지만 나타나고 나머지 아랫부분은 파싱이되지 않습니다.

 

본문 내용 중간중간만 발췌하는 식으로 정규식 작성하는방법좀 알려주시면 감사하겠습니다.

 

만약 글로만 적어 질문이 어렵다면 정규식을 올려서 다시 질문하겠습니다.. 감사합니다! 

 

이 질문에 댓글 쓰기 :

답변 2

일단 해당 샘플 소스와 정규식을 보여주세요 ^^

 

설명보니 간단히 해결한 문제는 아닙니다.
님이 쓰신 정규식은 이치에는 맞게 보이지만 두번째 () 오기 전에 나머지가 매치 되어 버리는 형국이네요..

제가 보기에는 정규식으로 한방에 걸러내기 보다 태그 전부를 걸러낸뒤에 조건문으로 분기하지 않는 한 힘들것으로 보입니다.

일전에 비슷한 문제로 글 올리신분도 닫힘 태그와 열림태그까지 묶어서 가져 오려 했으나 우리가 생각하듯 제대로 된 쌍의 태그를 분리해내기도 히드니 "< ~~ >" 랑 내용을 따로 분리하신뒤에 처리하시는게 그나마 디버깅및 이후 처리가 편해 보입니다.

답변을 작성하시기 전에 로그인 해주세요.
전체 61,263
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT