파싱을 공부중인데... 질문입니다.

파싱을 공부중인데... 질문입니다.

QA

파싱을 공부중인데... 질문입니다.

본문

Snoopy.class라는 플러그인을 이용하여 파싱에 대해 공부를 하고있는 학생입니다.. 

그런데 공부중 막히는 부분이 있어 질문드립니다.

 

구조가 일정한 table을 파싱하는건 문제가 없었는데...

 

1번째 tr

<tr class="content_tr_list content_tr_list_even" s="<span style="color:#aaa;text-decoration:line-through;">1000</span><span style="color:red">→</span><span>500</span>" t="500">

 

2번째 tr

<tr class="content_tr_list content_tr_list_even" s="<span style="color:#aaa;text-decoration:line-through;">1400</span><span style="color:red">→</span><span>700</span>" t="700">

 

 

이런식으로 불규칙하네요;;

 

제가 하려고하는건 이 tr을 기준으로 tr안에 있는 내용을 배열에 담고싶은데..

 

$data[$i] 가 tr을 기준으로 나눈거고

$data[$i][$j] 가 tr에 있는 td를 기준으로 나눈건데;; td도 저런식으로 불규칙하네요;;

이런 불규칙한 tr, td는 explode로 나눌 수 없는건가요?? ㅠ

 

 

이 질문에 댓글 쓰기 :

답변 2

저는 파싱 할 때 snoopy를 써본적이 없어서 어떤 원리인지 정확하게 모르는데요

 

 

curl 이용하거든요

 

 

정규식을 이용해서 파싱하면 되요.

 

파싱은 정규식 없으면 하기 힘들어요.  아니면 정규식 비스므레하게 함수를 만들면 되고요

 

 

잘살아보자님 말씀대로 파싱을 하게 되면, 정규식 함수가 상당 수 사용되는것 같습니다.

현재 올려주신 내용에 대한 값은 다르나 일정한 규칙이 있기 때문에

저런 규칙을 사용하여 배열을 만들고, 그 안에서 가공을 하시면 보다 편리하게 파싱을 하실 수 있을것 같습니다.

답변을 작성하시기 전에 로그인 해주세요.
전체 2
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT