크롤링 관련 코딩 문제

크롤링 관련 코딩 문제

QA

크롤링 관련 코딩 문제

본문

2015196407_1543718161.9223.png

크롤링 도움받아서 만들어봤는데

기존에는 크롤링할 주소창에 url 주소 하나 밖에 못 넣고, (크롤링 시작하기) 버튼을 url 

하나 넣을때마다 매번 눌러야 했습니다.

이러한 불편함 때문에 여러 url을 넣고 자동으로 30초 간격으로

크롤링 할 수 있게 소스를 짜봤습니다.

 

 

http://google.com/1000231

http://google.com/1000232

http://google.com/1000233

http://google.com/1000234

http://google.com/1000235

 

이렇게 여러 url 을 한번에 넣고 

(크롤링 시작하기) 즉 submit 버튼을 실행하면

 

http://google.com/1000231 (크롤링 시작하기) 

          `

          `

        30초후

http://google.com/1000232 (크롤링 시작하기)

          `

          `

        30초후

http://google.com/1000233 (크롤링 시작하기)

 

 

이렇게 시간간격을 두고 url이 넘어가면서 submit 버튼이 실행되게 만들었는데

 

 

2015196407_1543718345.9538.png

 

1. $ex_url = preg_split('/\r\n|[\r\n]/', $crawling url); 로 url을 각각 하나씩 나누고

 

2. for 문을 써서 url 하나씩 돌리게 만들었는데 문제는 처음 url 1개만 돌고 멈추네요.

 

 

 

2015196407_1543718437.2681.png

 

뒤부분은 sleep 넣어서 간격 30초로 조정 했습니다.

 

 

**핵심적인 문제는 처음 url 1개만 돌고 멈추는 것인데

어디에서 문제인지 잘 모르겠는데 경험 많으신 분들 조언좀 부탁드립니다.

 

혹시 제이쿼리나 자바 소스 추가해서 할수 있으면 알려주시면 감사하겠습니다.

이 질문에 댓글 쓰기 :

답변 2

평정심님 말씀에 추가하면요.

항상 작업 전 이전페이지에서 넘어오는 변수가 어떻게 넘어오는지 확인을 먼저 하셔야 합니다.

즉 print_r($_POST) 로 이전 페이지에서 넘어온 값을 확인하셔야 합니다.

그 다음 print_r($_POST['crawling_url']) 해 보세요. 어떻게 값이 찍히는지...

값이 어떻게 찍히느냐에 따라 그 아래 프로그램이 제대로 된건지 무슨 문제가 있는지 확인이 가능합니다.

답변을 작성하시기 전에 로그인 해주세요.
전체 60
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT