페이지랭크: 구글 재미난 이야기



구글 툴바를 웹브라우져에 붙여서 사용하고 있습니다. 최근 새로 설치한 웹브라우저 파이어폭스2 beta-1과 잘 연동해서 사용할 수 있더군요. 무료로 다운받을 수 있는데요, 파이어폭스 2는 아직 베타버전이라 완전하지 않기 때문에 그냥 호기심 많은 분들만 사용하시길 권합니다.

+파이어폭스 2.0 베타-1 다운받기

+구글 툴바 다운받기

구글 툴바에서 제가 가장 유용하게 사용하는 기능은 스펠체커와 gmail 확인 그리고 구글링을 쉽게 할 수 있는 검색창 등인데요 자세히 보면 중간에 PageRank 라는 것이 보입니다. "구글의 페이지 중요도 측정" 이라고 풍선말이 따라오는데요, 그것을 계산하는 방식이 궁금해서 조금 알아보았습니다.

생각보다 간단한데요, 해당 웹페이지 (A 라고 부를께요)에 링크된 N개의 웹페이지들 (t1, t2, t3 ... tN)이 있는 경우 구글 페이지랭크는 다음 처럼 계산된다고 합니다. (참조: Pagerank Explained)



여기서

PR(s )= s의 페이지랭크
C(s)=s에서 걸려있는 외부링크수
d=댐핑 팩터

인데요, d를 파라메터로 피팅을 하는 1-파라메터 피팅 랭킹 계산법이라고 할 수 있겠습니다. 통상적으로 d가 0.85가 사용된다고 합니다.

그런데 위에서 제시한 중요도 계산은 사실 매우 보편적인 응용성을 가지고 있습니다.

예를 들어 이런 경우를 생각해 보고싶습니다. 인접 도시간에 도로 그리고 철도 등으로 복잡하게 연결된 어느 지방이 있다고 가정해 보겠습니다. 그런데 그 지방 어디엔가 자신이 운영하는 물류 센터를 두고 싶은 어느 사업가가 있다고 할 때, 그는 과연 어느 도시에 점포를 세워야할지 고민이 될 것입니다. 그가 고려해야할 "중요도" 는 다음과 같을 것입니다.

1. 잘 발달된 도시들과 강하게 연결된 도시
2. 인접 도시와 교통편이 잘 발달된 도시

위의 두가지 사항이 위에 제시된 페이지랭크 계산식에 들어있다는 것을 쉽게 눈치챌 수 있을텐데요, 1번 사항, 인접 도시에서 그 도시로의 연결의 중요도는 (PR(t)/C(t))로 그리고 2번 사항, 교통편의 불편함 정도는 d 라는 파라메터로 나타내고 있다고 보시면 되겠습니다. 즉 교통편이 잘 발달되어 있다면 d 값 (댐핑 팩터)이 낮아지고, 주변 도시들의 연결이 그 도시를 중심으로 되어있다면 PR(t)/C(t) 값이 높아질 것이기 때문에 결국 도시의 중요도가 높아지게 됩니다.

물론 실제의 경우라면 d 라는 파라메터가 또 다시 다양한 팩터들, 예를 들어 고속도로의 수, 철도 운행 간격, 비행편 수 등등 에 의해 결정되겠지요.

어떻게 보면 이렇게 간단한 수식이 매우 강력한 응용성을 가지고 있다는 것에서 "왜 수학은 물리학의 언어가 될 수 있었나?" 라는 보다 심오한 질문에 대한 힌트를 얻을 수 있을 것도 같습니다. 사실 가장 신기한 것은 우리가 수학을 언어로 자연에 대해 이해할 수 있다는 그 사실 자체니까요.

덧글

  • PLUR 2006/08/07 01:30 # 답글

    C의 t값이 높을수록 PR이 높아진다는 것은 결국 '평판이 높은 사람에게 좋게 평가될수록 평판이 높아진다'라는 의미로군요. 수학처럼 완벽하게 기호화된 언어는 역시 이해도 응용도 재미있네요 :)
  • ExtraD 2006/08/07 05:00 # 답글

    역시 그렇죠? 수학적 언어로 표현하는 것 자체로 좀 더 많은 것을 얻을 수 있는 것 같습니다.
  • sesism 2006/08/07 09:08 # 답글

    저글링보다 무서운건 구글링 같아요. 얘는 뭐 모르는것도 없고 찾아내지 못하는것도 없으니 말예요.
  • ExtraD 2006/08/07 10:30 # 답글

    sesism님, 맞아요. 구글의 다양한 검색 서비스도 정말 일품이죠. 저는 Picasa2 도 아주 유용하게 쓰고 있답니다.
  • clair 2006/08/07 14:05 # 답글

    와아 재밌어요 재밌어요
    툴바 같은 것 참 싫어하는데, 처음으로 깔아볼까 하는 생각이 들었습니다. 생각해보니 구글 페이지로 안가고 구글링 할 수 있는 것도 참 유용하겠는데요.
  • ExtraD 2006/08/09 09:23 # 답글

    **clair님, 늘 재밌게 봐주셔서 고마워요~. 저도 다른 툴바는 별로 유용성을 모르겠는데 구글툴바는 괜찮아서 잘 쓰고 있습니다. 구글 서치를 많이 하기도 하고, 다양한 서비스가 제공되니 ..특히 gmail은 제 주력 사적메일함으로 쓰이고 있거든요. ^^ 필요에 따라서 나쁘지 않은 선택인 것 같습니다.
  • xellos 2006/08/10 00:02 # 답글

    저도 Picasa2<->Gmail 조합 참 좋아합니다 ^^ 같이 일하는 교수님 보니 Google Calendar도 상당히 유용한것 같아요
  • ExtraD 2006/08/10 06:58 # 답글

    **xellos님, 구글로 RSS 구독도 시도해봤는데 그건 영 별로더라구요.
  • 2006/08/10 13:13 # 답글

    비공개 덧글입니다.
  • ExtraD 2006/08/11 10:03 # 답글

    **비밀덧글님, 어서오세요~반갑습니다. 간단하게 써본거라 좀 다듬을 필요도 있겠죠?
※ 로그인 사용자만 덧글을 남길 수 있습니다.