독립된 단일 페이지들을 크롤링해 하나로 취합하는 방법 아시는 분 있나요?
본문
게시판 크롤링 해보려고 RSS를 사용하다 계속 30개만 노출이 되길래 이유를 찾아보니,
단방향 바인딩 형식으로 RSS 버튼을 누르면 게시판 데이터를 넣는 구조 같아 보였습니다.
왜냐하면 각 페이지의 RSS 버튼을 눌러서 확인하니 페이지 넘버와 라우팅 이름이 같았습니다.
그래서 각 페이지 뒤에 붙는 페이지 이름을 각각 크롤링하여 하나로 취합하면 되겠지 싶어서
엑셀에 링크를 넣어 봤는데 문서 자체 대한 코드만 인식이 되어 제가 생각한 대로 되지 않더라구요..
정말이지 아무리 url 넣어도 최근 30개만 인식이 되니 약올리는 것 같고 미치고 팔짝 뛸 노릇입니다.
엑셀에 제가 잘못 입력했던 건지..
좀 더 간편한 방법은 없는 지..
조언 부탁드립니다..
답변을 작성하시기 전에 로그인 해주세요.