SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

マイクロソフト、Live Search日本語版のアップデートについて説明

マイクロソフトは2007年10月17日、今秋実施した検索サービスLive Searchのアップデートや日本語版の状況に関する説明会を開催した。

Live Search日本語版は主にコア検索技術のクオリティー向上に着手。Live Searchが採用するランキングシステムRankNetの日本向けリモデリングを実施した。

RankNetとは、ニューラルネット技術を利用した機械学習アルゴリズム(machine learning algorithm)。検索結果のトレーニングデータ(サンプル)で学習させることで、適切なランキングを決定するためにウェブページのどの要素に評価のウエイトをおくべきかを決定する。例えば静的ランキング(static ranking)システムの代表であるPageRankは、単純にリンクの数や質を利用してウェブページのスコアを算出するため、検索エンジンスパマーに操作されやすい欠点がある。一方RankNetは複雑な項目を評価するため操作がされにくいほか、学習の結果、使用に適さなくなった要素は最終スコア算出時に評価対象から排除することができる。

日本語版の検索品質改善は、10月2日時点で行われた。隠しテキストやキーワード繰り返し、リンクファームによるスパムといった古典的なスパムの排除に成功しているほか、一部のパターン化されたリンク(例えば有料リンク)のウエイトを低下させる一方、形態素解析などの日本語処理にも手を加えたことで、以前よりも検索品質は改善されたことが確認されている。今回の発表でも同社は「検索結果10件以下が従来の半数」「インデックスサイズを4倍」「プラットフォームの改善」「クローリングアルゴリズム改善によるより広く、深くインデックス」「単語の区切りミス33%減少」などの改善を挙げていた。

同社が提示したレリバンシーに関するYahoo!、Google、Live Searchの比較では、2007年10月でGoogleを上回っている。この結果についてマイクロソフトディベロップメントの中島浩之氏は、YouTubeやWikipediaが上位に表示されやすい点などが、マイクロソフトが実施した測定作業において評価が伸びなかった原因と説明している。

レリバンシーの例として、「女子アナ」と検索した際のGoogleとLive Searchの違いが示された。Googleで女子アナと検索した時の検索結果は、画像など”男性向け”ともいえそうなリストが表示されるが、Live Searchで「女子アナ検索時は1位にフジテレビ、アナウンサーの紹介ページなど、”アナウンサー志望向け”(?)の検索結果が表示される。マイクロソフトによると、Googleはウィキペディアを過剰に検索上位に表示する傾向があるが、ウィキペディアが公式サイトよりも上位に出ることに違和感を持つユーザーもあるという。

Nielsen//Netratings 2007年8月データによると、日本の検索シェアはYahoo! 56%、Google 31%に対してLive Searchは5%。浅川秀治シニアディレクターはまず検索精度の向上を通じてユーザーに満足いく価値ある検索サービスを提供していくことに注力するとした。

#

検索各社レリバンシーに対する考え方は違いますし、とても主観的なものなので一概にどの検索結果リストがベストかは決められまんけれど、マイクロソフトとしての考え・姿勢が伺えました。

COPYRIGHT © 1997-2021 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

お問い合わせ(お仕事の相談、講演依頼など)

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。