파싱 관련 질문

매출이 오르면 내리는 수수료! 지금 수수료센터에서 전자결제(PG)수수료 비교견적 신청해 보세요!
파싱 관련 질문

QA

파싱 관련 질문

본문

simple html dom 공부하고 있는데 파싱 관련해서 질문 드립니다. 

 

1. 게시판 리스트 파싱할 때 리스트에 페이지 번호가 

 

<button type="button" onclick="Page(1)" >1</button>

 

이런 형식으로 되어 있는데 1페이지, 2페이지...쭉쭉 파싱이 가능한가요?? 

 

2. 리스트에는 이미지가 하나 밖에 없는데 view 상세 페이지 들어가면 여러 이미지가 있는데 

이런경우도 파싱이 가능한가요??

 

이 질문에 댓글 쓰기 :

답변 2

아래의 내용도 참고를 해보세요~

 

1. 리스트

 

<?php
include('simple_html_dom.php');

// 기본 URL 설정
$base_url = "http://example.com/list.php?page=";
$page = 1;

while(true) {
    $url = $base_url . $page;
    $html = file_get_html($url);

    // 페이지가 존재하지 않으면 종료
    if (!$html) break;

    // 게시물 리스트를 파싱
    foreach($html->find('.post') as $post) {
        $title = $post->find('h2', 0)->plaintext;
        echo "Page {$page}: {$title}\n";
    }

    // 다음 페이지로 이동
    $page++;
}
?>
 

 

2. 상세 이미지

 

<?php
include('simple_html_dom.php');

$list_url = "http://example.com/list.php";
$html = file_get_html($list_url);

// 상세 페이지 URL 추출
$post_urls = [];
foreach($html->find('a.post-link') as $element) {
    $post_urls[] = $element->href;
}

foreach($post_urls as $post_url) {
    $html = file_get_html($post_url);

    // 상세 페이지에서 이미지 URL 추출
    foreach($html->find('div.post-content img') as $img) {
        $image_url = $img->src;
        echo "Image in {$post_url}: {$image_url}\n";
    }
}
?>
 

 

 

 

답변을 작성하시기 전에 로그인 해주세요.
전체 0
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT