안녕하세요~ 파싱(parsing) 관련 문의좀 드려봅니다. > 그누4 질문답변

그누4 질문답변

그누보드4 관련 질문은 QA 로 이전됩니다. QA 그누보드4 바로가기
기존 게시물은 열람만 가능합니다.

안녕하세요~ 파싱(parsing) 관련 문의좀 드려봅니다. 정보

안녕하세요~ 파싱(parsing) 관련 문의좀 드려봅니다.

본문

파싱 고수님들께 문의좀 드립니다.
xml 파싱기능은 이런저런 스킨에 있는 것을 응용하여 DB 저장하기 까지의 구조를
대충 알게 되었습니다.

헌대 html 파싱도 비슷한것 같아 도전하는 중에 많이 막히게 되는군요
내용은 네이X 지식쇼핑 상품DB html 파일을 뽑아오는건데요

html 페이지 규약이 대략 아래와 같습니다.

&lt;&lt;<BEGIN>&gt;&gt;
&lt;&lt;<MAPID>&gt;&gt;4LSELFAA0017561
&lt;&lt;<PNAME>&gt;&gt;B199레더크로스백
&lt;&lt;<PRICE>&gt;&gt;49500
&lt;&lt;<CATE1>&gt;&gt;가방
&lt;&lt;<CATE2>&gt;&gt;
.....
&lt;&lt;<FTEND>&gt;&gt;

궁금한점은 xml 같은경우 <aa></aa> 와같이 끝나면
'aa'에 대한 값을 파싱하면 간단하게 해결이 되는데

위와같이 시작만 있고 </XX> 같이 닫힘이 없어 파싱할 방법을 모르겠습니다.
이럴경우 <MAPID> 에대한 값 4LSELFAA0017561 를 어떤 방식으로 파싱해야하는지
고수님들께 문의좀 드려봅니다. 꾸뻑...

댓글 전체

답변 감사드립니다. 말씀해주신 함수 검색해서 쭉봐보았는데..
정규식은 역시 어려운거 같군요 @.@
기초가 없어 막힘이 태산과 같아요 ..

역시 멀고도 험한길이군요...
아 무식하면,,, 손발이 고생한다능 ㅎㅎ
답변 감사합니다. 해결이 않될듯 ^^
전체 66,554 |RSS
그누4 질문답변 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1402호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT