파싱으로 돌린 블로그 3일째 > 자유게시판

자유게시판

파싱으로 돌린 블로그 3일째 정보

파싱으로 돌린 블로그 3일째

본문


프로그램으로 자동으로 펌질해온

글이 벌써 1300개 정도가 되었습니다.

방문자는 3일만에  하루 300명씩 되네요

다음 검색에만 rss 등록 되었구요 네이버는 4주 후에 검토해준다네요 ㅠ.ㅠ


문제는 하드공간이 벌써 3기가 입니다.

이미지까지 마구 내 서버로 긁어오다보니 하루에 1기가씩

하드공간이 마구 차네요. SSD로 서버 돌리다가 보니 저장공간도 모자르고

일반 호스팅으론 어림도 없을거 같고.. 트래픽보단 하드용량이 올라가는듯한...ㅋㅋㅋ


저는 걸그룹을 좋아합니다.

그래서 걸그룹 관련글 마구마구 퍼옵니다.

ㅋㅋㅋㅋㅋ 갠적으론 일베 걸그룹 게시판 파싱해오고 싶은데

그쪽은 버러지가 많아서.....


이글 보시는 여러분 자기 홈페이지좀 소개해주세요~ㅋㅋ


추천
0

댓글 21개

전 14498개정도 되네요 ㅎㅎㅎ
어떻게 파싱하는데 1300개뿐이 안될까여 ㅡㅡ;;
아고 제가 아는 분같아보이는데....
어느정도 돌리셧나요?ㅋㅋㅋ
대량 파싱하시는듯 하시네요 사이트 주소좀 알려주세요..ㅎㅎ
하드용량은 어떻게 해결하시나요 ㅠㅠ
개드립, 이토, 오유 정도에서만 파싱하구 있네요
하드용량이라... ㅎㅎㅎ 자체서버 사용하지 않습니다. ^^
몇개를 지정해서 한번에 파싱해야 하지않을까여 ^^
놀랍습니다!!ㅋㅋ 근데 이미지 퍼오는데 하드용량이나 서버회선 문제가 있어서  ㅡ.ㅡ; 그렇게 대량으로 안될거 같네요;; 전 허접 프로그래밍은 못하는 그냥 서버관리자라서 1시간에 만오천건은 어려울거 같네요...ㅎㅎ
이미지 자체를 퍼오니 당연히 용량이 들겠죠  그냥 링크만 퍼오시면 그런일없을 실것 같네요 서버 자체에도 무리가 안가고요 또한 이미지 저작권이 있으니 이미지를 다퍼오는건 좀...........
그냥 이미지 없이 그냥 파싱 하면 실제 서비스 하긴 내용이 이상해지구.. 이미지 무단링크 하면 무단링크 방지기능 때문에 엑박 생기는데가 많네요
부끄럽지만 파싱해서 실서비스에 사용중입니다..ㅠㅠ
크롤봇을 좀 볼려본 1인으로서 ㅎㅎ 이미지까지 몽땅 다 퍼오는걸로 해서 하루정도돌리면 30만개 정도 퍼옵니다! 지금은 귀찮아서 안하지만. 이왕 긁을거 좀더 공격적으로 긁으세요. ㅎㅎ
펌 컨텐츠를 위주로 구성하면
어차피 구글에는 노출도 되지 않을뿐더러....
몇페이지 뒤에 보이겠죠. 몇 페이지 뒤까지 사람들이 들어갈지도 의문이고요.
아직 네이버는 원문을 찾아주는 검색엔진이 부족하지만.......
네이버 블로그가 우선 노출되니 이것도 패스.
다음은 조금 강화하는 추세입니다.
펌 컨텐츠로 승부해봐야 아무 소용없습니다.
더군다나 애드센스는 금방 짤리진 않습니다.
클릭이 쭈욱 쌓이다가..
아싸 이제 100달러 넘었다. 지급신청해야지.
하면 지급보류......뜨죠 ㅋㅋㅋㅋ
저도 크롤링에 관심은 있는데 실제로 본적은 없네요~~ 어떤방법을 이용하시나요? 관련자료를 볼수 있는곳이 있을까요?^^
백프로 php로 만들었습니다. domdocment를 explode 활용하면 될듯합니다.  자료는 별로 없네요.. 구글링에서 많이 나오긴 해요~
추가적으로 말씀드리면 글퍼서 블로그에 올리시면 그냥 키워드잡고 글하나 쓰는것보다 못합니다.
그시간에 프로그램 관련한 글을 진실성있게 몇개 쓰는게 더 방문자 많아요
전체 199,626 |RSS
자유게시판 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1402호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT