안녕하세요~ 파싱(parsing) 관련 문의좀 드려봅니다. 정보
안녕하세요~ 파싱(parsing) 관련 문의좀 드려봅니다.
본문
파싱 고수님들께 문의좀 드립니다.
xml 파싱기능은 이런저런 스킨에 있는 것을 응용하여 DB 저장하기 까지의 구조를
대충 알게 되었습니다.
헌대 html 파싱도 비슷한것 같아 도전하는 중에 많이 막히게 되는군요
내용은 네이X 지식쇼핑 상품DB html 파일을 뽑아오는건데요
html 페이지 규약이 대략 아래와 같습니다.
<<<BEGIN>>>
<<<MAPID>>>4LSELFAA0017561
<<<PNAME>>>B199레더크로스백
<<<PRICE>>>49500
<<<CATE1>>>가방
<<<CATE2>>>
.....
<<<FTEND>>>
궁금한점은 xml 같은경우 <aa></aa> 와같이 끝나면
'aa'에 대한 값을 파싱하면 간단하게 해결이 되는데
위와같이 시작만 있고 </XX> 같이 닫힘이 없어 파싱할 방법을 모르겠습니다.
이럴경우 <MAPID> 에대한 값 4LSELFAA0017561 를 어떤 방식으로 파싱해야하는지
고수님들께 문의좀 드려봅니다. 꾸뻑...
xml 파싱기능은 이런저런 스킨에 있는 것을 응용하여 DB 저장하기 까지의 구조를
대충 알게 되었습니다.
헌대 html 파싱도 비슷한것 같아 도전하는 중에 많이 막히게 되는군요
내용은 네이X 지식쇼핑 상품DB html 파일을 뽑아오는건데요
html 페이지 규약이 대략 아래와 같습니다.
<<<BEGIN>>>
<<<MAPID>>>4LSELFAA0017561
<<<PNAME>>>B199레더크로스백
<<<PRICE>>>49500
<<<CATE1>>>가방
<<<CATE2>>>
.....
<<<FTEND>>>
궁금한점은 xml 같은경우 <aa></aa> 와같이 끝나면
'aa'에 대한 값을 파싱하면 간단하게 해결이 되는데
위와같이 시작만 있고 </XX> 같이 닫힘이 없어 파싱할 방법을 모르겠습니다.
이럴경우 <MAPID> 에대한 값 4LSELFAA0017561 를 어떤 방식으로 파싱해야하는지
고수님들께 문의좀 드려봅니다. 꾸뻑...
댓글 전체
정규식을 익혀야 합니다
그 다음 preg_match(), preg_match_all() 함수를 이용합니다
그 다음 preg_match(), preg_match_all() 함수를 이용합니다

답변 감사드립니다. 말씀해주신 함수 검색해서 쭉봐보았는데..
정규식은 역시 어려운거 같군요 @.@
기초가 없어 막힘이 태산과 같아요 ..
역시 멀고도 험한길이군요...
아 무식하면,,, 손발이 고생한다능 ㅎㅎ
답변 감사합니다. 해결이 않될듯 ^^
정규식은 역시 어려운거 같군요 @.@
기초가 없어 막힘이 태산과 같아요 ..
역시 멀고도 험한길이군요...
아 무식하면,,, 손발이 고생한다능 ㅎㅎ
답변 감사합니다. 해결이 않될듯 ^^