파싱기 정규식 질문있습니다.
본문
혹시 단이나 문자 공백 띄어쓰기 상관없이
전체를 선택하는 정규식이 있을까요?
.+ 이건 단락이 틀려지면 안먹고
\s+ 이건 공백이죠..
<div>
<div>
<잡다한소스들>
<span>가나다라</span>
</잡다한소스들>
</div>
</div>
이런 상태일때 붉게 표시된 <div> 부터 </div> 를 모두 긁어오고 싶습니다.
답변 1
정규식으로만 하면 줄넘김 문자로 인해서 파싱에 어려움이 생길겁니다.
preg_replace 문으로 \r \n \r\n 문자를 제거후에 정규식을 사용하면 될것 같네요.
ps) 자바나 python 이라면, 그냥 dom 에서 selector 를 사용하면 되는데, php에서는 정규식으로만 파싱을 해야 하니 좀 불편합니다.
답변을 작성하시기 전에 로그인 해주세요.