SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

検索アルゴリズム:: Topic-Sensitive PageRank

たまには検索アルゴリズムそのものを取り扱ってみようと思います。Topic-Sensitive PageRank(トピックセンシティブ ページランク)。Stanford University、Computer Science DepartmentのTaher H. Haveliwalaが考えたものです。

Google の PageRank は皆さんご存じでしょう。インターネット上の各々のWebページの重要性をリンクによって決定する方法で、Google が利用する100以上に及ぶ検索アルゴリズムの1つでもあり重要性の高いものです。この PageRank の考え方を発展させたもの、より適切にWebページの評価を行おうとするアルゴリズムが Topic-Sensitive PageRank です。

"Topic-Sensitive" 、日本語でいうと「トピック反映型」でしょうか、ともかく『トピック』を PageRankスコアの算出に反映させようというのがこのアルゴリズム。PageRank は、リンクによって結ばれる2つのWebページが扱う「トピック」は全く考慮されていません。例えば(他の条件やアルゴリズムは無視した上で)次のA,Bをご覧下さい。

A:Webページ (a)(宇宙航空力学を説明)からWebページ (b) (お花屋さん)へリンク

B:Webページ (c)(お花見を説明)からWebページ (d)(お花見を説明)へリンク

従来の PageRank コンセプトの下では、AのケースもBもケースも全く同様に PageRank のスコア算出を行い、リンクが向かっているターゲットページ、つまり (b) (d) に対して同一のスコアを与えます。これに対して Topic-Sensitive PageRank はリンクの「トピック」を考慮しますので、ケースAのように全く無関係なWebページへの PageRank スコアを下げる一方、ケースBのように関連性のあるWebページへの PageRank スコアは上げましょう、とするわけです。

この論文を読みたい方は次のページをどうぞ。HTML と PDF があります。ちなみに英語ですよ :)

Topic-Sensitive PageRank (HTML版)

Topic-Sensitive PageRank (PDF版)

COPYRIGHT © 1997-2021 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

お問い合わせ(お仕事の相談、講演依頼など)

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。