파싱으로 돌린 블로그 3일째 정보
파싱으로 돌린 블로그 3일째본문
프로그램으로 자동으로 펌질해온
글이 벌써 1300개 정도가 되었습니다.
방문자는 3일만에 하루 300명씩 되네요
다음 검색에만 rss 등록 되었구요 네이버는 4주 후에 검토해준다네요 ㅠ.ㅠ
문제는 하드공간이 벌써 3기가 입니다.
이미지까지 마구 내 서버로 긁어오다보니 하루에 1기가씩
하드공간이 마구 차네요. SSD로 서버 돌리다가 보니 저장공간도 모자르고
일반 호스팅으론 어림도 없을거 같고.. 트래픽보단 하드용량이 올라가는듯한...ㅋㅋㅋ
저는 걸그룹을 좋아합니다.
그래서 걸그룹 관련글 마구마구 퍼옵니다.
ㅋㅋㅋㅋㅋ 갠적으론 일베 걸그룹 게시판 파싱해오고 싶은데
그쪽은 버러지가 많아서.....
이글 보시는 여러분 자기 홈페이지좀 소개해주세요~ㅋㅋ
추천
0
0
댓글 21개

전 14498개정도 되네요 ㅎㅎㅎ
어떻게 파싱하는데 1300개뿐이 안될까여 ㅡㅡ;;
아고 제가 아는 분같아보이는데....
어떻게 파싱하는데 1300개뿐이 안될까여 ㅡㅡ;;
아고 제가 아는 분같아보이는데....
어느정도 돌리셧나요?ㅋㅋㅋ
대량 파싱하시는듯 하시네요 사이트 주소좀 알려주세요..ㅎㅎ
하드용량은 어떻게 해결하시나요 ㅠㅠ
개드립, 이토, 오유 정도에서만 파싱하구 있네요
대량 파싱하시는듯 하시네요 사이트 주소좀 알려주세요..ㅎㅎ
하드용량은 어떻게 해결하시나요 ㅠㅠ
개드립, 이토, 오유 정도에서만 파싱하구 있네요

하드용량이라... ㅎㅎㅎ 자체서버 사용하지 않습니다. ^^
몇개를 지정해서 한번에 파싱해야 하지않을까여 ^^
몇개를 지정해서 한번에 파싱해야 하지않을까여 ^^
방식이 궁금하네요....ㅋㅋㅋㅋ
근데 퍼올만한 사이트가 잘생각이 안나요 ㅎㅎㅎ
근데 퍼올만한 사이트가 잘생각이 안나요 ㅎㅎㅎ

어느정도 돌렸냐고요 1시간두 안됩니다. 10분만에 그정도는 파싱 하지않을까여
놀랍습니다!!ㅋㅋ 근데 이미지 퍼오는데 하드용량이나 서버회선 문제가 있어서 ㅡ.ㅡ; 그렇게 대량으로 안될거 같네요;; 전 허접 프로그래밍은 못하는 그냥 서버관리자라서 1시간에 만오천건은 어려울거 같네요...ㅎㅎ

이미지 자체를 퍼오니 당연히 용량이 들겠죠 그냥 링크만 퍼오시면 그런일없을 실것 같네요 서버 자체에도 무리가 안가고요 또한 이미지 저작권이 있으니 이미지를 다퍼오는건 좀...........
그냥 이미지 없이 그냥 파싱 하면 실제 서비스 하긴 내용이 이상해지구.. 이미지 무단링크 하면 무단링크 방지기능 때문에 엑박 생기는데가 많네요
부끄럽지만 파싱해서 실서비스에 사용중입니다..ㅠㅠ
부끄럽지만 파싱해서 실서비스에 사용중입니다..ㅠㅠ

네이버는 좀 까딸스럽게 할겁니다. ^^

크롤봇을 좀 볼려본 1인으로서 ㅎㅎ 이미지까지 몽땅 다 퍼오는걸로 해서 하루정도돌리면 30만개 정도 퍼옵니다! 지금은 귀찮아서 안하지만. 이왕 긁을거 좀더 공격적으로 긁으세요. ㅎㅎ
ㅎㅎㅎㅎ하드용량 해결이 관건 입니다...ㅋㅋㅋㅋ
그런데 유머 자료 같은거 파싱해볼만한 좋은 사이트 있나요?
그런데 유머 자료 같은거 파싱해볼만한 좋은 사이트 있나요?

퍼오고 블로그에 등록하실때 삭제 되는 방식으로 하시면되잖아요 ㅎㅎ

펌 컨텐츠를 위주로 구성하면
어차피 구글에는 노출도 되지 않을뿐더러....
몇페이지 뒤에 보이겠죠. 몇 페이지 뒤까지 사람들이 들어갈지도 의문이고요.
아직 네이버는 원문을 찾아주는 검색엔진이 부족하지만.......
네이버 블로그가 우선 노출되니 이것도 패스.
다음은 조금 강화하는 추세입니다.
펌 컨텐츠로 승부해봐야 아무 소용없습니다.
더군다나 애드센스는 금방 짤리진 않습니다.
클릭이 쭈욱 쌓이다가..
아싸 이제 100달러 넘었다. 지급신청해야지.
하면 지급보류......뜨죠 ㅋㅋㅋㅋ
어차피 구글에는 노출도 되지 않을뿐더러....
몇페이지 뒤에 보이겠죠. 몇 페이지 뒤까지 사람들이 들어갈지도 의문이고요.
아직 네이버는 원문을 찾아주는 검색엔진이 부족하지만.......
네이버 블로그가 우선 노출되니 이것도 패스.
다음은 조금 강화하는 추세입니다.
펌 컨텐츠로 승부해봐야 아무 소용없습니다.
더군다나 애드센스는 금방 짤리진 않습니다.
클릭이 쭈욱 쌓이다가..
아싸 이제 100달러 넘었다. 지급신청해야지.
하면 지급보류......뜨죠 ㅋㅋㅋㅋ
문제입니다..ㅋㅋ
저도 크롤링에 관심은 있는데 실제로 본적은 없네요~~ 어떤방법을 이용하시나요? 관련자료를 볼수 있는곳이 있을까요?^^
백프로 php로 만들었습니다. domdocment를 explode 활용하면 될듯합니다. 자료는 별로 없네요.. 구글링에서 많이 나오긴 해요~

추가적으로 말씀드리면 글퍼서 블로그에 올리시면 그냥 키워드잡고 글하나 쓰는것보다 못합니다.
그시간에 프로그램 관련한 글을 진실성있게 몇개 쓰는게 더 방문자 많아요
그시간에 프로그램 관련한 글을 진실성있게 몇개 쓰는게 더 방문자 많아요

좋은 글 입니당
저도 용량이 문제네요...20기가 가상서버인데.. 어느세 4기가...ㅜㅜ
저도 용량이 문제네요...20기가 가상서버인데.. 어느세 4기가...ㅜㅜ

... 저희 싸이트는 블로그 데이터 개당 10000~30000에 사왔는데
저작권 문제 있지 않나요?? -ㅅ-);;
저작권 문제 있지 않나요?? -ㅅ-);;