검색엔진 스팸이란 무엇인가?

검색엔진 스팸이란 무엇인가?

부정한 방법으로 검색엔진의 알고리즘을 공략해 검색 결과의 상위에 오르는 것을 「검색엔진 스팸」이라고 합니다. 이 스패밍에 관련된 문제는 사이트 웹마스터라면 반드시 이해하고 있어야 하겠습니다.


검색엔진 스팸의 정의

안타깝게도 「어떤 것이 스팸이고 어떤 것이 스팸이 아닌가」에 대해서는 각각 검색엔진의 내부 기준에 따라 판단되는 것으로, 페널티의 발동이나 그 조건이 일정하지 않습니다. 따라서 관리자는 「의심받을 만한 짓은 하지 않는다」 라는 생각으로 임할 수 밖에 없습니다. 하지만 일반적으로 알려져 있는 스팸에 대한 정의도 있고 그것을 지침으로 활용하는 것도 가능합니다. 검색엔진 스팸에 대해서 가장 잘 쓰여진 정의는 다음과 같습니다.


검색엔진 스팸에 해당하는 것

로봇형 검색엔진의 적합도를 계산하는 능력에 영향을 끼치는 모든 인위적인 시도

검색엔진 스팸에 해당하지 않는 것

검색엔진이 존재하지 않는다고 해도 똑같이 계속 실행되는 것, 또는 검색엔진이 실행하는 것을 허가하는 것


위의 정의에서 말한 「검색엔진 스팸에 해당하는 것」 은 다소 극단적인 의미이기 때문에, 이것만으로 정의를 내리기에는 무리가 있습니다. 검색엔진은 웹 페이지 내외의 모든 요소로부터 적합도를 계산하기 때문에, 웹페이지는 그 자체가 로봇형 검색 엔진의 적합도를 계산하는 능력에 영향을 끼치는 인위적인 시도의 집합이기 때문입니다. 그러나 「검색엔진 스팸에 해당하지 않는 것」 중에서 말하고 있는, 「검색엔진이 존재하지 않는다고 해도 계속 시행되는 것」 이라는 정의는 상당히 시사하는 것이 많습니다.

예를 들어, 숨겨진 텍스트나 숨겨진 링크 등은 열람자에게 보여주는 것이 목적이 아닌, 로봇형 검색 엔진의 로봇이 처리하는 것만을 목적으로 하여 키워드를 배치하는 테크닉입니다. 이러한 테크닉은 검색엔진이 존재하지 않는 경우에는 당연히 계속 사용되는 일이 없기 때문에, 명확하게 스팸이라고 단정지을 수 있습니다.

스팸과 페널티

악질의 검색엔진 스팸 행위가 발각된 경우, 그러한 행위를 한 페이지는 로봇형 검색엔진으로부터 페널티를 받게 됩니다. 각 검색엔진은, 각각의 독자적인 기준을 세워 스팸 사이트를 자동적으로 판별하여 해당 되는 사이트에 페널티를 부과합니다. 스팸에 대한 페널티란 구체적으로는 아래와 같은 것들입니다.


1. 검색 결과에서 제외

그다지 심하지 않은 스팸 행위인 경우의 조치로, 단순히 검색결과 리스트의 상위에 표시되지 않게 된다. 최하위 부근까지 표시 순위를 떨어뜨리거나, 완만히 표시 순위를 떨어뜨리는 것도 있다.

2. 데이터 베이스에서 말소

심한 스팸 행위를 한 경우, 이후 크롤러로부터 크롤 대상 리스트로부터 제외되어 데이터 베이스로부터 완전히 삭제된다. 페이지나 디렉토리 단위로 삭제되는 경우도 있고 도메인 자체가 삭제되는 경우도 있다.


단, 현 시점에서는 명확히 스팸으로 판정되어 페널티를 받고 있는 케이스는 좀처럼 보기 힘듭니다. 예외적인 경우를 제외하고서는 스팸 행위에 의한 상위표시는 불가능해지고 있기 때문에, 웹 마스터의 입장에서 보면 필요 이상으로 스팸 판정을 무서워할 필요가 없어졌다는 의미에서 바람직하다고 볼 수 있습니다.

또, 운이 나쁘게 페널티를 받은 경우에도 Google 가이드라인 위반 페널티의 해제방법에 따라 작업을 진행하면 대부분의 모든 페널티는 해제가 가능합니다. 이런 점에서 봤을 때도, 현재로써는 스팸에 대해서 크게 신경질적으로 대응 할 필요는 없다고 할 수 있습니다.

스팸 행위의 구체적인 예

Google 웹마스터를 위한 가이드 라인에는 「품질에 관한 가이드라인」 에는 구체적인 예가 몇 가지 있습니다. 개별 항목들에 해당하는 것은 스팸이라고 봐도 될 것입니다. 이것에 대해서는 아래에 정리해 보았습니다.


1. 나쁜 의도를 가진 링크 조직에 참가하지 않는다

  • 링크 인기도나 검색순위를 조직적으로 상승시키려는 계획에 참가하지 않는다.
  • 과도한 상호 링크를 하지 않는다.
  • 유료 링크를 구입하거나 판매하지 않는다.
  • 조직적으로 링크를 가지고 있는 사이트(Link Farm 참가 사이트나 유료 링크 판매 사이트)에 링크하지 않는다.

2. 숨겨진 텍스트, 숨겨진 링크를 사용하지 않는다

  • 유저에게는 보여주지 않고, 검색엔진에서만 읽을 수 있도록 의도하는 텍스트나 링크는 배치하지 않는다.
  • 배경과 같은 색의 텍스트나 링크를 사용하지 않는다.
  • 작은 영상이나 하이픈 등의 기호로 링크를 설정하지 않는다.
  • 영상으로 덮여진 area나 표시 area 외에 대량의 텍스트를 작성하지 않는다.

3. 클로킹 수법을 쓰지 않는다

  • UA나 IP로 판별되어 유저에게 보여지는 내용과 다른 내용의 페이지를 검색엔진 로봇에 대해서 표시하지 않는다.

4. 자바스크립트를 정상적으로 활용한다

  • 실제 JavaScript의 동작과는 다른 내용을 noscript 요소 안에 작성하지 않는다.
  • 유저를 검색 결과에 표시된 페이지와는 다른 페이지에 Redirect 할 목적으로 자바스크립트를 사용하지 않는다.

5. Doorway page를 사용하지 않는다

  • 별도의 페이지에 리다이렉트를 목적으로 특정 키워드나 문구에만 최적화된, 내용이 없는 페이지를 작성하지 않는다.

6. 키워드를 가득 채우지 않는다

  • 리스트나 단락 안에서 특정 키워드를 과도하게 반복하여 사용하지 않는다.
  • 숨겨진 텍스트 안에 키워드를 가득 채워 넣지 않는다.
  • 메타 타이틀/디스크립션/키워드나 이미지 대체 텍스트 안에 키워드를 가득 채워 넣지 않는다.

7. 중복된 내용의 페이지를 공개하지 않는다

  • 검색엔진의 순위를 조작할 목적으로 같거나 비슷한 내용을 가진 페이지를 복수의 도메인・서브 도메인으로 공개하지 않는다.
  • 완전히 같은 내용으로 키워드만 다른 페이지를 공개하지 않는다.

8. 기타 사항

  • 인쇄용 버전이나 모바일용 버전을 준비하는 것은 문제가 없지만, 정규화나 robots.txt 등으로 블록하는 것이 좋다.
  • 사이트의 구조나 도메인을 변경한 경우에는 301 리다이렉트를 사용한다.
  • 유사한 페이지가 여러 개일 경우에는 하나로 모으거나, 각각의 페이지에 고유 정보를 추가 하는 것이 좋다.
  • 콘텐츠를 신디케이션할 경우에는 원본 링크를 포함한다.

위는 위반 시 Google이 페널티를 적용할 가능성이 있다고 공표하고 있는 것이지만 실제로 대부분은 주의 할 필요조차 없이 정상적으로 운영하면 문제가 되지 않을 일이라고 하겠습니다.

스팸의 보고

검색엔진 스팸은, 모든 인터넷 유저에게 손해를 입히는 매우 좋지 않은 행위입니다. 검색 결과가 부당하게 조작되면 검색 사이트의 운영자에게 있어서도 검색엔진의 유저에게 있어서도 해로운 것입니다. 이와 같은 검색엔진 스팸을 발견 한 경우에는, 검색 사이트에 스팸 사이트를 보고 할 수 있습니다.

  • Google – 웹 마스터 툴 스팸 레포트
  • bing – 전자 메일 서포트

다음 콘텐츠도 참조하시면 좋습니다

SEO란 무엇인가? 그 의미와 사고방식
Google은 부자연스러운 링크의 문제점을 해결할 수 있는가?

 

Comments

comments


답글 남기기

이메일 주소는 공개되지 않습니다.

4 × 1 =