「リンクの関連性」という話は全く新しい概念ではなく、既に2000年頃から言われていたことだ。ただ、当時はSEOのベストプラクティス(こうあるべきだ)という観点からWebサイトのトピックと関連するサイト(ページ)からリンクをもらうように心がけよう、という程度のものだったのだが、近年はGoogle、Yahoo!、Live Search ともに関連性の高いリンクを獲得することは比較手短期に成果(検索ランキングで上位に表示する)を求めるためには必要なことだ。
ここで改めて話を整理しておこう。
リンクの関連性とは
リンクの関連性とは、リンクを張ったページと張られたページの双方のコンテンツの関連性についての話だ。
例えば、「ケーキの作り方」というコンテンツを持つページAがあったとしよう。ここに対して、「車の修理方法」のコンテンツを持つページXと、「お菓子の作り方」のコンテンツを持つページYからの双方からリンクが張られている時、検索エンジンはXよりもYのリンクをより高く評価する。リンクXを全く評価しないということはないのだが、少なくともYほどの評価は得られない。
一応、この理屈(なぜ、関連性が重視されなければならないのか?)を、きちんとSEOの考え方を理解してもらうためにも説明しておこう。
Webページの重要度は「検索クエリ」によって変わるべき
どの検索会社も「どれだけのリンクが張られているのか」を、数・質・関連性・時・信頼性などの多様な観点から分析・スコアリングしてランク付けする。これはインターネット上のWebのリンクコネクティビティ(リンクによる接続網)を分析することで、一般的に人々が重要視(価値が高いと判断)するようなWebページにはより良質なリンクが集まり、その重要性が下がるにつれてリンクにより算出されるスコアも下がると考えられるからだ。
ところで、このリンクによるスコアリングは検索品質を高めるためにはより適切にページごとに点数付けすることが求められるのは当然のことだ。
1997年から2002年当時のGoogleが採用していたリンク分析関連のアルゴリズム(PageRankと読み替えていただいて問題ない)、基本的にリンクの「数」と「質」、そしてアンカーテキストに基づいてスコアを算出していた。これはPageRankの基本的な考え方が「インターネット上における各々のWebページの重要度を算出する」 - 少なくともその当時は、それさえ算出すればより適切な検索結果が提供できると考えられていた - ことにあったのだが、これは実は欠点があった。
次の2つのケースを思い浮かべて頂きたい。コンテンツ「中古バイク」のWebページに対して8つのリンクが張られているが、その8つのページはいずれもバイクと全く関係がないページ。そして、同じく「中古バイク」のWebページであるが、その被リンクとなる4ページのうち3ページは同じく「中古バイク」の話題を扱っている。
この時、当時のPageRankであれば後者のケースよりも前者のケース、「中古バイク」Webサイトを(リンク分析において)より高い点数付けをしていた。しかし、残念ながらこの計算が適切とはいえない。何故なら、どのWebページが重要であるかは普遍的なものではなく、本来は検索キーワード、ユーザーが何を求めているかによって変わるはずだからだ。
この話は現実世界を例にあてはめてみるとわかりやすい。例えば自宅の水道が壊れた時、皆さんはどこに連絡するだろうか。大半の人はその手の専門家である水道工事屋さんに連絡して修理を依頼するだろう。しかし、不注意で交通事故を起こしてしまって裁判沙汰になった時に同じく水道工事屋さんに相談するだろうか?その時は"法律の専門家"である弁護士のはずだ。
このように、その時々の話題・関心ごとにおいて解決するために最も適切な人物を選ぶように、検索サービスにおいても「ユーザが何を探しているか」に基づいて重要なWebページは変わるはずだ。
したがって、"当時のPageRank"の基本システムのように検索クエリにかかわらず"普遍的な重要度の高いページ"を表示することは決して最適とはいえないわけだ。検索キーワード「中古バイク」で検索された時に、中古バイクと関連性のないリンクの評価はゼロにする、あるいは関連性のあるものより低く評価することで、純粋に「同じ中古バイクの話題を扱うWebページ同士で最もリンクが集まっているのはどこなのか」を見つけたほうが、ユーザが満足いく検索結果を表示できる可能性はずっと高い。
実はこの考え方を取り入れた検索エンジンが、当時"Googleキラー"として話題となったTeoma(現在はAsk.com / Ask.jp )のSubject Specific Popularity(現在は ExpertRank (エキスパートランク)と呼ぶ)だ。
今まで述べてきた通り、リンクの関連性を評価に加えた方が合理的なため、Google、Yahoo!、Live Searchも何らかの形式で同様の指標(関連性)を評価するようになってきている。少し本筋から話がそれたが、「なぜ、検索エンジンはリンクの関連性という指標を参考にするのか」という理屈を理解しておくことは今後の検索アルゴリズムの変化のトレンドを捉える上でも大事なことなのであえて説明を加えさせていただいた。
執筆:渡辺隆広
本原稿は、2007年3月1日時点のもの