▣ Learn How Google Works: in Gory Detail


Infographic by PPC Blog

당신이 블로그나 트위터, 일반적인 사이트에 새 글을 쓴다. 그러면 인터넷을 크롤링하던 구글 검색 로봇은 당신이 쓴 새 글을 발견한다. 당신이 쓴 글에 링크가 있으면 구글 로봇은 더 깊이 크롤링을 하지만 그렇지 않다면 거기서 끝난다. 구글 로봇은 당신의 쓴 새 글을 다른 사이트에서 연결된 링크를 이용할 수도 있고 블로그 소프트웨어나 xml 사이트맵을 이용할 수도 있다. 단, 당신 글에 연결된 링크 페이지에 `nofollow` 태그가 붙어 있다면 그 링크를 통해서 당신 글을 찾아갈 수는 없다.

크롤링을 하며 발견된 페이지는 순식간에 색인된다. 색인된 페이지의 컨텐츠는 역색인이 이루어진다. 구글은 도메인을 평가하고 링크에 기반해(페이지랭크pagerank) 페이지의 권위를 평가한다. 다음으로 해당 페이지가 편집 정책에 맞는지 점검이 이루어진다. 점검을 통해 이용자에게 위험을 가할 수 있는 페이지는 접근을 막는 등 불이익을 주기도 한다. 또한 이용자의 검색에 도움이 될 수 있는 다양한 데이터가 해당 페이지에 붙는다.

이제 새로운 페이지가 검색될 준비가 끝났으니 이용자가 검색을 하는 상황으로 가보자. 이용자가 구글 검색 엔진에 쿼리를 던진다. 구글 엔진은 입력된 내용에 기반해서 키워드를 제안한다. 또한 동의어를 사용해서 관련된 페이지를 찾는다. 이제 검색 결과가 만들어진다. 검색 결과는 권위, 페이지랭크에 따라 정렬되고 중복된 페이지는 제거된다. 검색 결과와 함께 등장하는 것이 구글의 텍스트 광고인 애드워즈Adwords다. 광고 내용의 관련성과 위치 정보를 이용해 적합한 광고를 찾는다. 광고에 영향을 주는 편집 정책을 보면, 지침을 벗어난 광고는 계정이 금지될 수 있으며 검색 빈도가 낮은 광고는 자동적으로 사용이 정지될 수 있다. 아마존에 대한 애드워즈와 같이 클릭 횟수가 높은 광고는 가격 할인을 해주기도 한다. 그리고 광고는 수익성에 따라 정렬된다.

검색 결과에는 몇 가지 기준에 따라 걸러진다. 이용자가 과거에 방문했던 웹 사이트를 기반으로 이용자 특성이 반영된다. 검색 결과 중 랭크가 높은 페이지에 링크된 페이지는 동반하여 위로 올라간다. 사회에서 또는 검색에서 이슈가 되고 있는 검색어에 대해 구글 엔진은 가중치를 부여하여 신선한 주제에 대한 내용을 우선하여 보여준다. 그리고 같은 도메인에서 많은 페이지가 검색되면 하나로 묶어준다.

최종적으로 이용자는 적합한 광고와 필터링된 검색 결과가 합해진 유기적인 검색 결과과 보게 된다.

URL : http://www.ppcblog.com/how-google-works/

<출처>NDSL, 2010-07-01

Posted by TopARA

댓글을 달아 주세요