크롤의 움직임과 UA명

크롤의 움직임과 UA명
인터넷 이곳 저곳을 순회하면서 웹페이지의 내용을 수집하는 프로그램 즉, 크롤러(스파이더, 봇, 로봇이라고도 합니다)의 움직임과 주요 UA명에 대해서 설명하겠습니다. 웹 상에서 자동으로 돌며 정보를 수집하는 크롤러 크롤러(스파이더)란, 검색엔진이 웹페이지의 내용을 수집하기 위해 이용하는 프로그램을 말합니다. 검색엔진은 등록 신청된 URL를 기본으로 웹페이지내에 포함된 링크정보(href속성값으로 지정된 URL)을 쫓으면서 WWW상의 여러 종류의 웹페이지 정보를 수집합니다. 정보를 수집한다는 것은 검색엔진에 있어서 ...

HTML Parse와 구조해석

HTML Parse와 구조해석
HTML Parse란  HTML 문법 규칙에 따른 문자열을, 해당 문법을 바탕으로 단어의  의미나 구조를 분석하는 것을 의미합니다. 이렇게 HTML Parse를 행하는 프로그램을 일컬어 HTML Parser라고 말합니다. HTML Parser에 의한 HTML 구조의 파악 검색엔진은 웹페이지 내 쓰여진 정보를 근거로 크롤링을 합니다. 그를 위해서는 웹페이지에 기술한 HTML소스를 분석할 필요가 있습니다. 이 HTML의 분석 작업을 HTML Parse라고 하며, 그것을 ...

고품질 콘텐츠란 어떤 것인가?

고품질 콘텐츠란 어떤 것인가?
검색 엔진은 반복해서「고품질 콘텐츠를 평가한다」라는 것을 전달하고 있습니다. 이 페이지에서는 검색 엔진이 양질의 콘텐츠로 평가하는 콘텐츠는 어떤 것인가를 고찰하고 그 조건을 보기 쉽게 정리하였습니다. 관계구조에 따른 콘텐츠 품질의 평가 딱 잘라서 결론부터 말하자면, SEO에 있어서 질이 높은 콘텐츠란「이용자가 다른 사람에게 공유하고 싶은 콘텐츠」라는 점에 집중되어 있습니다. 이 기사에서는 그것을 실현 하는 콘텐츠란 어떤 것인가를 생각할 ...

입소문의 기점은 기업 내부에 있다

입소문의 기점은 기업 내부에 있다
‘입소문이 어떻게 발생하는가?’라는 주제는 소셜미디어의 영향력이 높아진 현대 사회에서 많은 마케터의 과제이기도 할 것입니다. 본문에서는 입소문의 발생에 대해서 새로운 시점을 소개함과 동시에, 기업 내부를 입소문의 발생원으로 하기 위한 의식고양과 환경 만들기에 대해 언급하고자 합니다. 입소문의 기점은 어디인가 마케팅에서의 입소문의 역할은 타깃이 되는 사람들의 커뮤니티 내에서 사람들의 긍정적인 화제를 녹여서 확대시켜 결과적으로 제품이나 서비스의 판매를 촉진한다는 ...

콘텐츠란? 그 의미와 정의

콘텐츠란? 그 의미와 정의
제작이나 출판이라는 맥락에서 콘텐츠란 「교양, 또는 오락에 속하는 저작물로 수신자의 맥락에 따라 가치가 있는 정보나 경험을 제공하는 것」 을 의미 합니다. 「콘텐츠」 라는 말은 애매한 의미로 사용되는 경향이 많아 불필요한 오해나 충돌을 일으키지 쉽지만, 정의를 제대로 알고 관계자 간의 공통적인 인식을 가지는 것이 중요합니다. 교양, 또는 오락을 제공하는 저작물 현재 우리가 사용하고 있는 「콘텐츠」 라는 ...

검색엔진 스팸이란 무엇인가?

검색엔진 스팸이란 무엇인가?
부정한 방법으로 검색엔진의 알고리즘을 공략해 검색 결과의 상위에 오르는 것을 「검색엔진 스팸」이라고 합니다. 이 스패밍에 관련된 문제는 사이트 웹마스터라면 반드시 이해하고 있어야 하겠습니다. 검색엔진 스팸의 정의 안타깝게도 「어떤 것이 스팸이고 어떤 것이 스팸이 아닌가」에 대해서는 각각 검색엔진의 내부 기준에 따라 판단되는 것으로, 페널티의 발동이나 그 조건이 일정하지 않습니다. 따라서 관리자는 「의심받을 만한 짓은 하지 않는다」 ...

유저 경험을 개선하려면 사이트 속도부터 높여야 한다

유저 경험을 개선하려면 사이트 속도부터 높여야 한다
사이트 속도는 서버의 반응속도, 페이지나 그 구성요소의 처리 속도,  브라우저에 의한 화면 렌더링 속도 등에 의해 결정됩니다. 이 사이트 속도를 개선하는 것은  SEO에도 중요하지만, 보다 근본적으로는 유저 경험에 폭넓게 영향을 미치게 되므로 반드시 관리가 필요합니다. 구글이 사이트의 속도를 랭킹 지표로 차용한 이유 2010년 봄, 구글이 사이트의 속도를 랭킹에 포함시켰다는 것을 발표하고 나서 상당한 시간이 흘렀지만, ...

크롤러와 인덱서의 제어

크롤러와 인덱서의 제어
사이트 운영자가 크롤러와 인덱서를 제어하는 지시를 내려, 검색결과에 표시된다고 해도 검색자에게 있어 큰 가치를 제공하지 않는 페이지나 파일에 대해 사전에 검색결과에 표시되지 않도록 할 수 있습니다. 이것은 검색자의 체험을 방해하지 않는 것은 물론, 검색엔진으로부터 저평가를 받지 않도록 하기 위한 대책입니다. 크롤러과 인덱서를 제어하는 이유 크롤러의 제어란, 특정 URL을 크롤러로부터 차단하거나 또는 크롤해도 검색결과에 표시되지 않게 ...

웹 접근성은 중요한 SEO 중 하나입니다

웹 접근성은 중요한 SEO 중 하나입니다
검색엔진 로봇에 의한 크롤 가능성을 확보하는 작업을 「크롤러빌리티의 확보」, 정확한 색인을 돕는 작업을 「인덱서빌리티의 확보」라고 합니다. 이것들은 웹 접근성 향상을 위한 기본적인 작업을 통해 동시에 달성할 수 있습니다. 다르게 말하면 웹 접근성을 따르는 것이 곧 SEO 중 하나라는 이야깁니다. 시작하며:웹 접근성이란 웹 접근성이란, 고령자나 장애인을 포함한 어떤 유저라도, 어떤 유저 에이전트를 이용하고 있더라도, 또한 어떤 ...

웹사이트를 위한 사이트 테마 최적화

웹사이트를 위한 사이트 테마 최적화
사이트 테마(또는 테마 테크놀로지)란, 공통된 테마성을 가진 웹사이트나 그것들과의 연관성에 높은 평가를 부여하는 Scoring 알고리즘입니다. 공통된 테마를 가진 웹페이지의 연관성을 평가 검색엔진이 키워드와 웹페이지의 적합도를 재는 지표 중 하나로 사이트 테마(또는 테마 테크놀로지)가 있습니다. 비슷한 테마와 연관된 키워드 그룹을 포함하는 페이지 간의 링크 관계에 주목, 내용과 관련 있는 페이지로부터의 링크에 가중치를 둡니다. 테마의 추출은, 각 웹페이지에 ...