수요일, 1월 18, 2006

Google의 검색 엔진

Google 이란 책을 보고 있다.
Google 이라는 회사에 대해서 다룬 책으로 생각했는데 내용의 절반이 '검색'이라는 주제에 대해 다룬 책이다.
Google의 시작은 Stanford대학에서 박사과정의 논문 준비에서 시작되었다고 한다. Google은 여타 검색엔진과 달리 백링크. 즉, 전방위 링크가 아닌 후방위 링크에 대한 연구결과로 탄생되었다.
좀 더 쉽게 설명하자면, 현재 페이지가 어떤 페이지들에 의해 링크가 형성되어 있는지 통계를 내고 그 통계에 근거하여 페이지의 중요도를 매기는 방식이다.
즉, 나의 페이지가 여러 페이지에서 링크되고 있으며 또한, 내 페이지를 링크하고 있는 페이지 역시 아주 많은 페이지에서 링크되고 있는 페이지라면 내 페이지는 매우 중요한 정보를 담고있을 가능성이 높다는 것이다.
이러한 데이터를 산출하기 위해서는 간단히 생각해보아도 엄청 복잡한 그래프가 형성되고 어마 어마한 데이터에 기반해야됨을 알 수 있다.
일단, 백링크를 구성하기 위해서는 Web의 전체 페이지를 모두 검토해보아야 하며 다시, 백링크간의 연관 관계를 계산하기 위한 알고리즘을 효율적으로 적용하기 위해서는 수학적 접근 방법이 필요할 것이다.

댓글 없음: