이건 좀 심하지 않나요? > 이십년전오늘

이십년전오늘

20년전의 흑역사를 꺼내보자 ㅋ

이건 좀 심하지 않나요? 정보

기타 이건 좀 심하지 않나요?

본문

작업중인 사이트에 접속해서 방문자 카운터를 보는순간 기겁을 했습니다.
어제의 방문자가 무려 67명입니다.
있을수가 없는 일이기에 로그를 살펴보니 일반적인 접속을 제외하고 모두 야후의 아이피입니다.
하루종일 아이피를 바꿔가며 접속을 했는데 왜 이런식으로 접속을 했는지 알수가 없네요.
 
혹시 이유를 아시는 분 있으신가요?
처음 겪는 일이라 어이가 없을뿐이네요.
 
---------------------------------------------------------------------------
 
NetRange:   68.142.192.0 - 68.142.255.255
OrgName:    Inktomi Corporation
OrgID:      INKT
Address:    701 First Ave
City:       Sunnyvale
StateProv:  CA
PostalCode: 94089
Country:    US
NetRange:   68.142.192.0 - 68.142.255.255
CIDR:       68.142.192.0/18
NetName:    INKTOMI-BLK-4
NetHandle:  NET-68-142-192-0-1
Parent:     NET-68-0-0-0-0
NetType:    Direct Allocation
NameServer: NS1.YAHOO.COM
NameServer: NS2.YAHOO.COM
NameServer: NS3.YAHOO.COM
NameServer: NS4.YAHOO.COM
NameServer: NS5.YAHOO.COM
Comment:    For general abuse contact http://help.yahoo.com/help/us/ysearch/slurp/
RegDate:    2004-03-24
Updated:    2005-02-18
 
68.142.251.201  Robot Robot 2005-07-29 13:54:32
68.142.249.169  Robot Robot 2005-07-29 13:53:58
68.142.249.86  Robot Robot 2005-07-29 13:53:46
68.142.250.88  Robot Robot 2005-07-29 13:53:40
68.142.251.182  Robot Robot 2005-07-29 13:53:25
68.142.251.172  Robot Robot 2005-07-29 13:53:19
68.142.249.167  Robot Robot 2005-07-29 13:53:11
68.142.251.78  Robot Robot 2005-07-29 13:53:04
68.142.250.100  Robot Robot 2005-07-29 13:52:54
68.142.250.43  Robot Robot 2005-07-29 13:52:48
68.142.251.38  Robot Robot 2005-07-29 13:52:30
68.142.250.61  Robot Robot 2005-07-29 13:51:11
68.142.250.90  Robot Robot 2005-07-29 13:50:31
68.142.249.69  Robot Robot 2005-07-29 13:50:13
68.142.250.160  Robot Robot 2005-07-29 13:49:19
66.249.65.171  Robot Robot 2005-07-29 03:23:39
68.142.250.24  Robot Robot 2005-07-29 13:59:40
68.142.251.74  Robot Robot 2005-07-29 13:59:05
68.142.250.48  Robot Robot 2005-07-29 13:58:51
68.142.250.180  Robot Robot 2005-07-29 13:58:40
68.142.250.114  Robot Robot 2005-07-29 13:58:37
68.142.249.77  Robot Robot 2005-07-29 13:58:34
68.142.251.112  Robot Robot 2005-07-29 13:58:25
68.142.250.174  Robot Robot 2005-07-29 13:58:19
68.142.250.105  Robot Robot 2005-07-29 13:57:48
68.142.250.77  Robot Robot 2005-07-29 13:57:14
68.142.250.126  Robot Robot 2005-07-29 13:56:48
68.142.250.133  Robot Robot 2005-07-29 13:55:42
68.142.250.91  Robot Robot 2005-07-29 13:55:22
68.142.249.114  Robot Robot 2005-07-29 13:55:18
68.142.250.83  Robot Robot 2005-07-29 13:55:05
68.142.251.56  Robot Robot 2005-07-29 14:06:39
68.142.249.127  Robot Robot 2005-07-29 14:06:30
68.142.249.153  Robot Robot 2005-07-29 14:05:50
68.142.249.21  Robot Robot 2005-07-29 14:05:02
68.142.251.209  Robot Robot 2005-07-29 14:04:13
68.142.251.99  Robot Robot 2005-07-29 14:04:13
68.142.249.193  Robot Robot 2005-07-29 14:03:06
68.142.250.62  Robot Robot 2005-07-29 14:02:53
68.142.249.22  Robot Robot 2005-07-29 14:02:33
68.142.250.56  Robot Robot 2005-07-29 14:01:50
68.142.249.11  Robot Robot 2005-07-29 14:01:48
68.142.250.135  Robot Robot 2005-07-29 14:01:28
68.142.249.13  Robot Robot 2005-07-29 14:01:20
68.142.249.201  Robot Robot 2005-07-29 14:01:14
68.142.249.14  Robot Robot 2005-07-29 14:00:58
68.142.251.88  Robot Robot 2005-07-29 21:12:20
68.142.250.179  Robot Robot 2005-07-29 21:05:09
68.142.249.183  Robot Robot 2005-07-29 20:27:10
68.142.251.40  Robot Robot 2005-07-29 20:15:41
68.142.251.151  Robot Robot 2005-07-29 20:12:52
68.142.251.51  Robot Robot 2005-07-29 20:12:09
68.142.251.15  Robot Robot 2005-07-29 20:09:01
68.142.250.40  Robot Robot 2005-07-29 20:05:57
68.142.249.90  Robot Robot 2005-07-29 19:52:45
68.142.249.102  Robot Robot 2005-07-29 19:40:56
68.142.249.160  Robot Robot 2005-07-29 17:05:14
68.142.251.175  Robot Robot 2005-07-29 16:08:10
68.142.249.185  Robot Robot 2005-07-29 15:58:00
68.142.249.35  Robot Robot 2005-07-29 14:07:42

댓글 전체

처음부터 끝까지 세어 봤습니다.
60카운트네요...(에구... 성격 나옵니다)


<생각할 수 있는 상황 몇 가지>
-. 홈페이지가 외부로 링크되어 있음.
  (특정 게시물, 특정 이미지 등...)
-. 낚시질 하는 로봇들이 관련내용에
  입맛 다시며 몰려옴.
-. 최근 검색엔진에 등록을 했거나,
  링크(주소)를 등록시킨 적이 있음.
-. 특정 자료로 인해, 기존 방문자들의 방문이
  상당했다면, 로봇들은 그 정보(기록)를 토대로
  재차 방문해서 링크를 점검(?!)했음.
-. 야후의 자료를 홈페이지에서 링크하고 있을 수 있음.

-. 기타 등등...

<생각할 수 있는 처리방법 몇 가지>
-. 최소한 며칠정도 추이를 살피다가 블럭할지 오픈할지를 고민할 필요.
-. 홈페이지내 아주 깊숙한 부분까지 끌어가는 경우를 확인할 수 있다면,
  마땅히 블럭을 결정해야 함.

<블럭할만한 참조 내용 몇 가지>
  개인적인 이메일 주소나 전화번호가 기재된 영역 또는 게시물.
  일반적인 사용자들이 찾아볼 수 없으며, 공개를 원치 않는 정보까지 끌어가는 경우.
  특정영역에만 머물러 있거나 끌어가는 경우 등.


-. 궁시렁... 궁시렁...
 한동안 koreawisenut이라는 녀석이 너무 깊숙이 공개를 원치 않는 내용까지 끌어가더군요.
 한 두번은 '방문자나 늘리자'라는 심정으로, '그냥 미끼를 던진다' 셈치고 내버려둔 적이 있습니다.
 헐... 그런데 왠걸...
 어쩜 그리도 깔끔하게 싸그리 긁어가는지...
 제게 있어서 koreawisenut은 차단대상 1호 입니다.
 한동안 좀 괜찮나 싶더니, 최근에는 아이피를 변경해서 또 들어오더군요.

 이런 경우는 별수 있나요?
 특정 대역폭의 아이피를 전부 막는 수 밖에는...


<추신>
 예전에 'root'님께서 그 부분을 말씀하신 적이 있습니다.
 메인이 아닌, 특정영역 또는 그 내부 깊숙한 내용이나 링크까지 끌어가는 경우는,
 홈페이지 관리자의 입장이라면, 마땅히 점검하고 차단해야 한다고...

 처음에는 '뭐 그러려니' 했었는데, 최근에는 충분히 공감하는 내용입니다.
 참... 네이버에서는 홈페이지 리뉴얼 일시/ 스크린샷 까지 가져 가더군요.
 숭악한 넘들...

참... sir에서도 하단에 기재하는 아이피가 놀고 있는 영역과 끌어가는 내용을 점검해서,
적절한 방법을 선택해야 하지 않을까 생각드네요.

뉴욕에서 오고 있다고 보여지는 바로 요놈 --->  66.♡.66.5 (따라쟁이)
-. 브라우저 두개 띄우고 현재 접속자 한번 확인해 보세요.
-. 코멘트 또는 신규게시물 작성 후 살펴보세요
  특징이 있더구만요. 그누보드 카테고리 쪽은 잘 안가는 편인데,
  커뮤니티, 특히 자유게시판에 대한 반응은 어찌나 빠르던지...
나스카님의 글을 읽으면서 해당내용에 대하여 곰곰히 생각을 해봤습니다.

-. 홈페이지가 외부로 링크되어 있음.
  (특정 게시물, 특정 이미지 등...)
---> 외부로 링크가 되었다면 해당 url에서의 접근이 있을텐데 아직까지는 그런 접근은 없습니다.

-. 낚시질 하는 로봇들이 관련내용에 입맛 다시며 몰려옴.
---> 접근하는 로봇들이 몇개가 있는데 모두 북미지역이라는 공통점이 있습니다.
국내엔진의 접근은 아직까지는 없었기에 해당이 안될것 같은데요.

-. 최근 검색엔진에 등록을 했거나, 링크(주소)를 등록시킨 적이 있음.
---> 검색엔진 등록을 아직은 한군데도 신청하지는 않았습니다. SIR에 잠깐 url을 직접 게시판에 옮긴적이 한번 있군요.

-. 특정 자료로 인해, 기존 방문자들의 방문이 상당했다면, 로봇들은 그 정보(기록)를 토대로 재차 방문해서 링크를 점검(?!)했음.
---> SIR에 등록된 제 프로필을 보고  직접 접근은 하더군요. 이게 로봇들에게 영향을 줄까요?

-. 야후의 자료를 홈페이지에서 링크하고 있을 수 있음.
---> 야후를 비롯한 타 사이트의 자료가 등록된 것은 없습니다.

-. 기타 등등...
---> ^^

도매인탓인지 http://domainsdb.net 에서 가끔 누군가가 제 도매인 등록여부를 확인하는것 같습니다.
여기서 들어오는게 꾸준하게 체크가 되는군요.
이런것은 후이즈 검색결과를 바탕으로 링크를 클릭하는것과 같아서 별로 신경을 쓰지는 않습니다만 이번에 들어온 야후는 앞으로 잘 체크를 해봐야 하겠습니다.

참, 나스카님 저녁은 드셨습니까?
^^
아래에 아꽈님이 등록했다는 첫눈에 방문했더니..
아래와 같은 내용이있네요../...참고자료로 읽어보세요..


방법 1. 웹로봇 배제 표준(Robot Exclusion Standard)에 의한 방법

- 웹로봇의 수집과 검색노출을 원치 않는 경우, 우선 해당 웹페이지가 위치한 최상위 디렉토리에 아래의 내용이 포함된 robots.txt 파일을 저장하시기 바랍니다. 
User-Agent:*
Disallow:/ 

만약 웹로봇이 방문한 이후에 robots.txt 의 로봇배제관련 표준이 적용되었다면, 검색결과에 적용되기까지는 다소 시간이 걸릴 수 있습니다. 자세한 로봇배제에 대한 표준은 www.robotstxt.org 를 통해 알 수 있습니다. 

- 특정한 페이지에 대해 웹로봇의 색인이나 링크분석을 막고 싶은 때는 경우에 따라 아래와 같은 메타태그를 HTML 문서의 <HEAD> 부분에 추가하시면 됩니다. 

웹페이지를 검색결과에 노출하고 싶지 않을 때
<META NAME="robots" CONTENT="noindex"> 
 

웹페이지 내에 포함된 링크를 따르는 수집도 막고 싶을 때 <META NAME="robots" CONTENT="noindex, nofollow">
참고자료로 활용해야 하겠습니다.
개인적으로 꽤 심각하게 생각해야 할 상황인것 같습니다.
사이트에 불필요한 허위 방문자 카운트가 증가하는건 별로 반갑지가 않네요.
^^
전체 12,288
이십년전오늘 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1402호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT