인공지능 AI봇 금지하기 (robots.txt) [kiss] > 자유게시판

자유게시판

인공지능 AI봇 금지하기 (robots.txt) [kiss] 정보

인공지능 AI봇 금지하기 (robots.txt) [kiss]

본문

오랜만이죠? 한동안 바빴습니다. 

 

 

 

  1  

인공지능 AI봇이 인기를 얻으면서 검색엔진을 통한 유입이 줄어듭니다. 

챗봇에서 내용을 읽어버리니까 사이트를 방문하지 않는 거죠.

그런데 자신만의 고유의 내용이 있을 경우엔 무단으로 퍼가기 금지도 필요할 것 같습니다.

 

 

 

  2  

그래서 인공지능 AI봇이 마구 퍼가는 것을 금지하는 robots.txt를 적어 봅니다. 

(단, - 검색엔진에서 과거에 이미 퍼 간 것으로 AI를 돌리면 소용 없음.)

(단, - 검색엔진 봇과 AI 크롤러 봇을 함께 쓰는 경우엔 검색엔진 유입이 줄어들 수도 있음. 네이버, 카카오, 구글, 빙 주의 + 아래 봇 이름과 비교해서 참고)

(참고로 네이버 검색엔진 Yeti, 다음넷 검색엔진 Daumoa, 구글 검색엔진 Googlebot, 빙 검색엔진 Bingbot입니다.)

 

 

 

  3  

많이 알려진 인공지능 AI 크롤러를 싸그리 모았습니다. 마지막의 Disallow: / 빼먹지 마세요. (이게 핵심)

 

User-agent: CLOVA
User-agent: KakaoBot
User-agent: Gemini
User-agent: Google-Extended
User-agent: Copilot
User-agent: Claude
User-agent: Perplexity
User-agent: GPTBot
User-agent: ChatGPT-User
User-agent: Applebot-Extended
User-agent: Bing AI
User-agent: DeepL
User-agent: Character.AI
User-agent: Quora
User-agent: DialoGPT
User-agent: Otter
User-agent: Socratic
User-agent: Writesonic
User-agent: CopyAI
User-agent: Jasper
User-agent: ELSA
User-agent: Codium
User-agent: TabNine
User-agent: Vaiv
User-agent: Bagoodex
User-agent: YouChat
User-agent: iAsk
User-agent: Komo
User-agent: Hix
User-agent: ThinkAny
User-agent: Brave
User-agent: Lilys
User-agent: Sidetrade Indexer Bot
User-agent: CCBot
User-agent: AI-Bot-Name
Disallow: /

 

 

추천
6

베스트댓글

 안녕하세요 반대 의견으로 들리셨다면 죄송합니다. 생각해보니 공유차 올리신글인데..초를 친거 같습니다. 죄송합니다..근 1년동안 막을만큼 막아봤지만 ai전성시대에..썹다 몇번 당하고 앞으로 어떻게 될까라는 생각에 ..robots.txt 적어둔다고 지키는 애들이 별로 없다는것과.. 그런면에서 agent라도 밝히는 애들은 양지쪽 애들 아닌가 싶었습니다.. 재넨 그래도 양심이 있는 애들인데..라는 생각에..본의 아니게 제 댓글로 언짢으셨다면 죄송합니다.. 최근 고민중인거에 대한 글이라 작성자의 의도를 생각하지 않고 댓을 달았습니다.. 저도 현상황이 이상하고 피해를 보고 있고.. 역발상으로 방어용AI 없나 찾고 다닙니다.. 또한 절망적인건 엊그제 ai붙힌 크롤링 프로그램이 github에서 핫하던데..꽤 퍼질것 같던데 진짜 니꺼내꺼 없는 세상이 올려나...두렵습니다..

 

최근 이슈가 되는 부분이죠 웹개발에 있어 seo만 관리하는 직업도 있는데 앞으로 시대가 바뀌면 검색기반이 ai로 검색시장이 주도할 것인데 seo처럼 ai가 우리 사이트를 안내할 것인데 그걸 왜 막아? vs 안내는 개뿔 학습용이니 가져가지 마....

댓글 6개

감사합니다. 역시 믿고보는 키스님~

 

                                                                    ( ̄▽ ̄)"        b

searchGPT 난 gpt 기반 검색엔진이 조만간 사용자가 늘어날것으로 예상됩니다.

 

기존 구글검색의 경우도 먼저 색인된 업체들이 가중치를 많이 받는것으로 알고 있습니다.

 

서버에 부하가 없다면, 가급적 허용하는것을 추천드립니다.

(사실 엄청 긁어가고 있어서 서버에 부하가 일부 늘어나고 있습니다. -_-)

막는게 능사가 아니라는 점을 얘기드리고 싶어 답변 남겼습니다. 

최근 이슈가 되는 부분이죠 웹개발에 있어 seo만 관리하는 직업도 있는데 앞으로 시대가 바뀌면 검색기반이 ai로 검색시장이 주도할 것인데 seo처럼 ai가 우리 사이트를 안내할 것인데 그걸 왜 막아? vs 안내는 개뿔 학습용이니 가져가지 마....

위의 두 분께서 오해가 있으신 거 같아서 설명글 추가합니다. 

 

현재 수많은 AI가 있지만 검색엔진 AI는 손에 꼽을 정도입니다. 

그마저도 링크를 통해 유입에 도움이 되는 구조는 더 적습니다. 

 

A 검색엔진 AI가 지금도 도움이 된다고 생각한다면 그것만 Allow: / 해 놓으면 됩니다.

다른 검색엔진 AI가 더 발전해서 진짜 도움이 되기 시작하면 그때 Allow: / 로 바꿔도 됩니다. 

 

링크 연결도 없이 문장만 가져가서 사용해 버리는 AI가 현재 절대다수임에도

나중에 발전한 검색엔진 AI가 도움이 될 것이라고 확신하면서

링크 연결도 없이 문장만 가져가서 사용해 버리는 AI한테 모든 정보를 지금 다 공개할 필요는 없습니다. 

 

이 글의 맨 처음 1번에서 서론을 꺼냈듯이

진 밥과 꼬들 밥 사이에 찰진 밥도 있으니, 밥도 되지 않은 상태에서 진 밥이냐 꼬들 밥이냐만 가지고 고민할 필요는 없다고 봅니다.

어차피 진 밥을 한 것인지 꼬들 밥을 할 것인지는 우리가 아니라 AI 회사가 정하니까요.

 안녕하세요 반대 의견으로 들리셨다면 죄송합니다. 생각해보니 공유차 올리신글인데..초를 친거 같습니다. 죄송합니다..근 1년동안 막을만큼 막아봤지만 ai전성시대에..썹다 몇번 당하고 앞으로 어떻게 될까라는 생각에 ..robots.txt 적어둔다고 지키는 애들이 별로 없다는것과.. 그런면에서 agent라도 밝히는 애들은 양지쪽 애들 아닌가 싶었습니다.. 재넨 그래도 양심이 있는 애들인데..라는 생각에..본의 아니게 제 댓글로 언짢으셨다면 죄송합니다.. 최근 고민중인거에 대한 글이라 작성자의 의도를 생각하지 않고 댓을 달았습니다.. 저도 현상황이 이상하고 피해를 보고 있고.. 역발상으로 방어용AI 없나 찾고 다닙니다.. 또한 절망적인건 엊그제 ai붙힌 크롤링 프로그램이 github에서 핫하던데..꽤 퍼질것 같던데 진짜 니꺼내꺼 없는 세상이 올려나...두렵습니다..

 

@ifelse 

죄송이라니요, 절대 그렇지 않습니다. 이렇게 서로 다른 의견에 대해 자신의 고민을 주고 받는 거지요. 오히려 제가 죄송해 집니다. 

 

사실 저는 일부러 저런 것을 여기저기 뿌리고 다닐 겁니다. 사람들이 당연히 AI가 못 긁어가게 해야 한다는 생각을 가지게 하고 싶긴 합니다. 

 

논문으로 비유를 하자면....

검색엔진은 "인용"이지만, 문장형 AI은 "표절"입니다. 논문을 쓸 때도 우리는 사실을 밝히고 사용하면 인용이고, 숨기고 사용하면 표절임을 알고 있습니다. 

 

뭐.. 저 하나 이런다고 세상이 편들어 주지도 않겠지만, 악당이 10명이라도 1만 명이 아니라고 하면 결국은 마음대로 못하게 된다는 것을 믿습니다.

전체 198,301 |RSS
자유게시판 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT