米Googleのフェローでコアランキングチームに所属するAmit Singhal氏は2008年7月9日、Google公式ブログにおいてGoogleの検索結果ランキングについて紹介した。
Googleランキングはアルゴリズムの集合で、クエリに最も関連性の高い文書を探すために用いられている。現在Googleは毎日、数億ものクエリに対し、関連する文書を数百億もの中から見つけ出し、ユーザーに提供している。このランキングアルゴリズムは最も利用されるウェブ検索だけでなく、イメージ検索やニュース検索、YouTube、地図、商品検索、書籍検索など他のGoogleサービスでも変更を加えて利用されているとのこと。
こうしたランキングアルゴリズムの開発において、Googleは次に紹介する3つの原則に従っているという。
1) Best locally relevant results served globally.
(共通の方法を用いて個別に最高の結果結果を返す)
2) Keep it simple.
(シンプルさを保つこと)
3) No manual intervention.
(人手による介入を行わない)
1つ目の原則"Best locally relevant results served globally."は、あらゆる検索クエリに対し最適な検索結果を提供することに努めており、どの国のどの言語によるクエリであっても理想とは程遠い検索結果が表示されるのであれば、それを利用して将来の開発に利用するという。
2つ目の原則"Keep it simple."は検索アーキテクチャをシンプルに保つこと。検索システムは複雑になりがちであるが、Googleは検索品質で妥協せずにシステムをシンプルに保つことに多大な努力をしており、毎週10箇所ほどランキングに変更を加えているが、シンプルさは優先して考慮されているという。こうしたシンプルで理解可能なシステムによって検索品質の改善が行いやすいようにしている。
3つ目の原則"No manual intervention."は、Googleは検索ランキングに手を加えているのではないか?というよく寄せられる疑問に対する答えであり、Googleがランキングを人為的に操作していることを明確に否定した。Googleのランキングは、巨大なインターネットコミュニティの中で人々によって作成されたリンクやページを分析し、アルゴリズムを通じて決定しており、このような、個人の主観でなく集合知に基づいた順位決定が優れているとの信念があると述べた。また、人為的な操作を行わない2つ目の理由として、問題のあるクエリは多くの場合アルゴリズムに問題があることを示唆しており、1つのクエリの問題を解決しようとするよりもアルゴリズムを改良した方が結果として全体の検索品質改善につながるという。
もっとも、「ウェブマスター向けガイドライン」に明記している通り、マルウェアやウイルス配布サイト、違法サイトなどに対しては適切な措置を行うとのこと。
Introduction to Google Ranking [The Official Google Blog]
http://googleblog.blogspot.com/2008/07/introduction-to-google-ranking.html(日本語版)
[追記] 誤訳がありました、原則の1つ目は「ローカルの最適がグローバルに通じる」が適切です、はてなブックマークのpantingclimberさんありがとうございました