image replacement vs black hat techniques > 퍼블리셔팁

퍼블리셔팁

퍼블리싱과 관련된 유용한 정보를 공유하세요.
질문은 상단의 QA에서 해주시기 바랍니다.

image replacement vs black hat techniques 정보

HTML image replacement vs black hat techniques

본문

제가 http://sir.co.kr/bbs/board.php?bo_table=pg_html&wr_id=13053 에서 언급한 이미지 대체 기술이 black hat techniques 의 일종으로 구글 검색에서 패널티를 받는다는 cshop 님의 말씀 때문에 나름대로 찾아보고 돌머리를 굴려봤습니다.

cshop 님이 언급하신 black hat techniques 에 대한 내용 :
http://websearch.about.com/od/seononos/a/spamseo.htm

구글에서 image replacement(이하 IR) 가 패널티를 받는가?에 대한 블로거들의 의견 :
http://www.seomoz.org/ugc/cloaking-vs-image-replacement-hiding-text-is-not-a-bad-thing
http://mezzoblue.com/archives/2008/05/05/image_replac/

아마도 cshop님은 IR 를 invisible text 로 간주할 것이다라고 생각하셔서 말씀해주신 것 같은데,
제가 wr_id 13053 에 언급한 내용의 마크업은 구글 봇이 긁어갈 때 heading 내용을 정확하게 긁어갈 수 있습니다.

위 블로거들의 의견에 보시면 IR, img alt tag, meta tag 3개 모두 비슷한 검색결과를 보여준다고 써있습니다.
(블로거들의 의견을 절대시하는 것은 아닙니다.)
For example, I’ve often wondered if the potential to abuse image replacement and load invisible text with keywords was akin to, say, the potential to stuff keywords into the alt text of img elements, or even into meta tags. '''''The net result seems similar in all three cases'''''


일단 저도 처음에는 확신이 들지 않아서 이러한 웹접근성을 고려한 기법이 구글 검색에서 패널티를 받을 수 있느냐? 에 대해 웹접근성 연구소 자문서비스에 질의를 남겼고, 웹접근성 기법 중 하나이지 정석은 아니라는 답변을 들었습니다.

그렇다면 왜 이런 IR 기법을 사용할까요? 나름의 해답을 설명하자면 다음과 같습니다.

1. css sprite 를 활용하여 HTTP 요청을 줄이고자 하는 경우
: 이 경우 background 에 이미지가 들어가게 되고, 만약 이것이 <hn> 과 같은 heading 일 경우에는 당연히 대체텍스트가 제공되어야 합니다.
(1) 이미지 비활성화, css 활성화 혹은 이미지, css 모두 비활성화인 경우를 대비해서
(2) 텍스트 전용 브라우저를 위해서

2. css 혹은 웹폰트만으로 표현하기 어려운 typography 를 표현하기 위해
: 이 경우에는 alt tag 를 사용해서 대체텍스트를 제공하는 것이 정석입니다.
: 하지만 이 방법은 이미지를 통해서만 alt tag 에 접근할 수 있는 단점이 있습니다.
: lynx 와 같은 텍스트 전용 웹브라우저에서 img 를 어떻게 표현하는지 정확히 알 수는 없지만, (어떤 검색 결과에서 노란색 팁으로 표현된다는 것을 언뜻 본 것 같습니다.) 문서의 구조나 맥락을 정확하게 표현하기 위해 IR 기법을 사용하는 것 같습니다.


IR 가 구글 패널티를 받는다는 댓글을 보고 처음엔 멘붕이 왔다가, 그럴리가 있나... 하는 생각이 들어서 계속 찾아본 결과,
IR 와 black hat techniques 는 그 성격이 다른 것이라는 결론을 내렸습니다.

완벽하게 설명할 정도로 이해한 것은 아니어서 글 내용이 부족할 수 있을 거 같습니다.

그래서 태클, 지적, 보완 대환영입니다.
추천
0

댓글 7개

장문이라, 여러 reference 를 남기셔서 다 읽어보지는 않았는데, 제가 사용하는 방법과는 성격이 다른 내용 같습니다.

저의 이미지 대체 text 기법이란 이런 것 입니다.

저는 div 안에 li 가 div 전체를 차지하게 만든후 (그래서 div 전체가 clickable 되게 만든후) div 의 background 에 로고 이미지를 넣고, li 에는 대체 텍스트를 넣어 줍니다.  그리고 li indent 를 뭐 -999999999 이렇게 왕창 넣어서 li 에 text 가 사람눈에는 보이지 않게 하는데요, (이렇게 하면 사람눈에는 안보이고 봇만 text 를 긁어 가지요.)

이게 저만의 로고를 만드는 방법입니다.  그냥 생각해보니 이런식으로 로고를 만들수 있겠다 싶어 해보니까 되길레 쭉 이렇게 합니다.  좀 이상한?/ 특이한 방법인데, 나중에 알고보니 저 말고도 다른 사람들도 이렇게 하는 사람들이 가끔 있더라구요.

이때 단순하게 대체 text 를 넣는게 아니라, 봇들에게 페이지가 잘 노출이 되도록 관련어 text 를 엄청 집어 넣어 줍니다.  이러면 페이지가 관련어를 검색했을때 아주 잘 뜹니다.  그 관련 단어들을 검색창에서 치면 항상 구글 검색에 5번째 안쯤으로 (첫번째로 뜨는 경우도 많고), 제 페이지가 뜨더라구요.) 

그런데 이런짓을 하면 구글로 부터 무시무시한 페널티를 먹을 수 있다는 글을 보고 잠깐 mention 을 한건데, 아마 제가 이 방법에 관해 잘못 설명을 드린 관계로 communication 이 좀 잘못 된 것 같습니다.

제가 언급한건 이 내용에 관해서 였습니다.
네, 이 내용을 저의 마크업에 댓글 달아주셔서 제가 한동안 헤맸던 겁니다. 그럼 번지수가 틀렸었던 거라고 이해하면 되겠네요. 라고 댓글을 달았었는데 글을 다시 찬찬히 읽어보니,

제가 쓴 <h1><span></span>heading</h1> 은 <div><span></span>alter text</div>도 가능하게 합니다. 즉 cshop 님이 쓰는 방법이라는 <div><ul><li>alter text</li></ul></div> 혹은 ul 이 생략된 <div><li>alter text</li></div> 는 저의 마크업과 큰 차이가 없는데요? 음 점점 미궁으로 빠져듭니다...
헐.......

그렇네요... 자세히 안봤었는데.... 단지 <h1> 과 <div> 의 차이일 뿐... 별 차이가 없는 것 같은데요???  .... 헐.....

단순히 대체 text 를 넣는 저 방법이 (관련 검색어를 왕창 넣는게 아닌, 진짜로 대체 text 만 넣는 경우) SEO 를 abuse 하는거라고 구글에서 생각한다면, 이건 좀 심각한 문제 같습니다.

사람들을 속이는건 속이는건데...

속이는건 부인할 수 없는 사실이긴 합니다.

왜냐하면 bot 이 보는거랑, 사람이 눈으로 보는거랑 다르긴 다르죠.... 악의는 없는건데.....

훔....

이거 점점 저도 혼란스러워 지네요.... ㅠㅠ
cshop 님이 주셨던 링크인데, http://webmasters.stackexchange.com/questions/30276/does-google-penalize-changed-h1-tags

여기에 보면 'Tina Bell Vance'라는 분이 'Google spiders aren't looking in your css files to find out whether you've changed your paragraph tag typeface from Arial to Courier-- they're too busy sifting through markup to get at those keywords in the content.' 라고 댓글을 달았죠.
CSS 스타일링을 어떻게 했는지까지 살펴보기엔 구글봇이 너무 바쁘다는 내용인 거 같은데 제가 잘못 이해한 건가요?
그리고 black hat techniques 는 글자색과 배경색이 같거나 (키워드 글자 처리를), 검색어만 포함된 대문페이지(doorway)를 제공하는 경우 등인 거 같은데요.
저도 나름 바빠서 이 topic 은 그만 생각하렵니다. ㅠㅠㅠㅠㅠ
결론지어 드립니다.

이 문제의 발단은 구글의 Matt Cutts 가 이런 발언을 하며 시작되었습니다.

"I don’t recommend that people use CSS to hide text."  구글에서 언급한 얘기기 때문에 많은 developer 들이 우려하기 시작했고, 사태가 심각해지자

구글의 Matt Cutts 는 이걸 더 상세하게 설명했습니다.

If you’re straight-out using CSS to hide text, don’t be surprised if that is called spam. I’m not saying that mouseovers or DHTML text or have-a-logo-but-also-have-text is spam; I answered that last one at a conference when I said “imagine how it would look to a visitor, a competitor, or someone checking out a spam report. If you show your company’s name and it’s Expo Markers instead of an Expo Markers logo, you should be fine. If the text you decide to show is ‘Expo Markers cheap online discount buy online Expo Markers sale …’ then I would be more cautious, because that can look bad.”

결론적으로 보면 결국 구글에서는 악의적으로 text 를 숨기고, 여기에 스팸을 하면, (관련 검색어를 수백개 집어 넣는 방식:blackhat) 이걸 잡아낸다는 얘기 입니다.  하지만 그냥 순수하게 로고 대체 text 를 집어 넣는거라면 괜찮다, 이 얘기 입니다.

블로거들이 얼마든지 자신의 개인적 견해를 밝힐 순 있지만, 별로 reliable 한 건 아니고, 구글의 policy 가 어떤지를 알아보려면 구글이 이 문제에 관해 어떤 입장을 표명했는지 살펴봐야 정확한 결론을 내릴 수 있겠지요.

http://www.456bereastreet.com/archive/200510/google_seo_and_using_css_to_hide_text/


구글의 현재 공식입장은 이렇습니다.

http://support.google.com/webmasters/bin/answer.py?hl=en&answer=66353

css 로 text 를 숨길경우, 그리고 그 방법이 악의적인 경우, 영구적으로 짤라버린다.

If your site is perceived to contain hidden text and links that are deceptive in intent, your site may be removed from the Google index, and will not appear in search results pages.
전체 30
퍼블리셔팁 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT