米Microsoftは2008年7月1日、自然言語検索技術を開発する米Powersetの買収を正式に発表した。Live Search公式ブログで明らかにした。
Powersetは自然言語処理をコアにした検索エンジンを開発しているスタートアップ企業。言葉の意味を理解し、検索クエリに対して回答を表示することができる。例えば、「伊豆の踊り子を書いたのは誰?」と質問文で検索すると、川端康成という記述箇所を含めた検索結果を表示できる。買収に伴い、Powersetの従業員は、Microsoftのコア検索チームに移籍し、Microsoft Researchがこれまでに開発した技術と組み合わせ、Live Searchの検索品質向上を目指す。
Microsoftは今回の買収について、検索ユーザーの三分の一は検索の最初のクリックで適切な答えが得られていないと指摘。これは、現在の検索エンジンはクエリのコンセプトやコンテクストを理解できないために適切な回答を持つウェブページを特定できないこと、そして、検索結果の説明文に表示されている内容と、リンク先ページの概要が異なるために結果として「答え」にたどり着けないことがあるためと指摘している。こうした問題を解決するためには、検索インテント(意図)を把握し、ウェブページの意味を理解することが求められ、それを実現する革新的技術がPowersetにあると述べている。
Powerset joins Live Search
http://blogs.msdn.com/livesearch/archive/2008/07/01/powerset-joins-live-search.aspx
#
マイクロソフトは「アンサーエンジン」(リンクを並べるのではなく、答えを表示する検索エンジン)を目指しているので、言葉や文章の意味を理解して、回答が記述されている場所を直接表示できるPowersetの技術はとても魅力的。一方、Powersetは自らのビジネスを拡大するためには多くのコンピューティングパワーを必要とし、それには資金も必要。また、先日公開したWikipediaを使った自然言語検索は検索対象をWikipediaに限定しているからこそ実現できたのであって、これをGoogleのような一般検索に広めようとすると、どうしてもランキングアルゴリズムは必要。この2つの要件を満たす企業としてマイクロソフトは適当な相手。どちらにとってもメリットがある話だと思います。