동영상 크롤링/파싱
본문
안녕하세요.
크롤러를 이용해 이미지를 수집할때
(1)해당 이미지를 서버에 다운로드
(2)서버에 저장하지 않고 수집
옵션이 있는데 (1) 옵션을 선택하면 해당 이미지가 제 서버를 차지하면서 게시글에 보여집니다.
그럼 동영상을 크롤링 하게 되면 어떻게 되는건가요?
서버에 저장되고 그누보드에 포함되어있는 jwplayer를 통해 보여지게되나요?
이미지처럼 수집하려고 하니 동영상은 잘 안되어서 작동 원리가 궁금해 글 남겨봅니다!
감사합니다!
답변 1
본문에서 해당내용은 이미지에만 해당됩니다.
이미지의 경우에만,
(1) 을 선택한 경우에는, 이미지를 다운로드한 뒤 경로가 로컬경로로 변경됩니다.
(2) 를 선택한 경우에는, 이미지를 다운로드하지 않고 경로도 해당 사이트의 경로 그대로입니다.
동영상의 경우에는, 위의 사항대로 진행되지 않습니다.
기본적으로는 (2) 의 옵션으로 진행될 가능성이 큽니다.
본문의 html 태그로 구성되어 있다면, 해당 html 태그 그대로만 가져오는 식으로 되고,
태그 자체로 플레이가 될 가능성이 있을지?까지는 잘 모르겠지만..
여하튼.. 영상태그여부를 판단하여 어떤 처리까지는 되어있지 않기 때문에..
필요한 경우에는 영상태그에 대한 파싱 및 그에 따른 처리를 추가해야 될 수 있지 않을까 합니다.
답변을 작성하시기 전에 로그인 해주세요.