로봇형 검색엔진의 의미

로봇형 검색엔진의 의미

일반적으로 단순히 검색엔진이라 부르는 경우는 이 [로봇형 검색엔진]를 의미하며 사용자가 원하는 키워드와 일치하는 내용을 가진 웹페이지를 찾아내는 검색 서비스입니다.


인덱스 전체에 대한 전문(全文) 검색을 하는 검색엔진

로봇형 검색엔진(단순히 [검색엔진]이라고 하면 이것을 말합니다)이란 사용자가 원하는 키워드와 일치하는 내용을 포함한 웹페이지를 찾아내는 검색 서비스입니다. 현재 가장 주류의 검색 서비스죠. 검색엔진은 작성한 인덱스(데이터베이스)에 격납된 웹페이지 전문을 대상으로 키워드와 일치하는 내용을 가진 모든 웹페이지를 찾아 내고 나열합니다. 검색엔진의 대표적인 것에는 Google, Bing 등이 있습니다. 또한 많은 포털 사이트에서 이들 엔진을 이용한 검색을 가능하게 하고 있습니다.

로봇의 순회에 따른 방대한 정보량

검색엔진 크롤러와 스파이더라고 불리는 로봇(프로그램)이 웹페이지를 자동으로 순회하여 정보를 수집하고 인덱스에 저장합니다. 이 때 크롤러가 순회하는 것은 등록 신청 된 웹페이지뿐만 아닙니다. 순회한 웹페이지에 기재된 링크 정보를 차례로 따라가서 모든 웹페이지를 순회하며 정보를 수집합니다. 따라서 원칙적으로는 링크로 연결된 전세계 모든 웹페이지를 대상으로 검색을 할 수 있습니다. 검색엔진은 웹사이트 단위가 아닌 개별 페이지의 정보를 수집합니다. 따라서 디렉토리에 등록되기 어려운 다음과 같은 정보도 검색 할 수 있습니다.

대부분의 사람들에게 필요 없다고 생각되는 사소한 정보라도 찾아낼 수 있다.

잘 알려지지 않은 웹사이트의 정보라도 찾을 수 있다.

전혀 정보가 정리 되어있지 않은 페이지 중에서도 유용한 정보를 알아낼 수 있다.

검색엔진 크롤러는 정기적으로 순회를 하기 위해서 신선한 정보를 검색 할 수 있다.

검색 노이즈가 많다는 결점

로봇형 검색엔진의 결점으로 검색 노이즈가 많음을 들수 있습니다. 검색 노이즈란 검색자가 의도하지 않은 웹페이지가 검색 결과에 섞여 버리는 상태를 말합니다.

키워드의 종류에 따라 매우 많은 웹페이지가 히트하기 위해 필요한 정보를 찾아 내는 것이 어려운 경우가 있다.

기본적으로 키워드와 일치하는 정보를 포함한 Web 페이지를 찾아 내기만 하기 때문에 검색 결과가 사용자가 원하는 정보를 포함하고 있다고 할 수는 없다.

그러나 이러한 단점도 알고리즘의 고도화에 따라 점차 극복되고 있으며, 적어도 일반적인 단어를 사용하여 검색에서 상위에 관해서는 분명 노이즈라고 생각되어지는 것이 표시되는 경우는 드물게 되었습니다.

Comments

comments


댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다

14 + eight =