米GoogleのJeremy Hylton氏は2009年4月14日、ブログ検索のblogroll(ブログロール)検出技術を改良し、検索式link:(被リンクページ一覧を表示するコマンド)で適切な結果一覧が出るような改善を行った。
ブログロールとは、他ブログへのお気に入りリンクリストをまとめたもの。Googleブログ検索は以前、ブログ記事をインデックスする際に本文(主コンテンツ)だけでなくサイドメニューに設置されたブログロールも収集・索引化していたため、キーワード検索時にブログロール内のワードとマッチしただけの、検索クエリと主コンテンツが全く関係ないページを検索結果に表示してしまう問題を抱えていた。この問題は昨年12月時点で認識されており、2009年3月26日~28日に解決している。
今回はブログロールのリンク検出について改善を行い、link:検索時にブログロールにのみ出現するリンクは検索結果一覧に表示されないようにした。まだ問題は残っているものの、社内評価では品質が大幅に増したとしている。
We deployed our latest improvements for blogroll detection late lastweek. The change affects link: queries. We now drop most or all of
the links that occur in the blogroll or in other parts of the page
that are just boilerplate. I'm sure there are lingering problems, but
our internal metrics suggest that its a big increase in quality for
link: queries. We've got a few more improvements in the works, but I
think this recent change fixed the biggest part of the problem.
As always, please send me specific examples where things have gone
wrong. We'll do our best to fix them.
Jeremy [Blogroll fix for link: queries, Google Groups]