検索技術開発会社の米Vivisimoが、政府系Webサイトのサイト内検索を同社のドキュメントクラスタリング技術を使って検索できるデモを公開している。
Vivisimo は Webページの内容を判断してトピック別に分類表示(クラスタリング)する検索サービスを提供している会社。今回行われている Vivisimo Clustering Engine デモ の対象は、USDA や FirstGov、PAPowerPort といった政府関連のサイト。仕組みは次のようになっている。まず、
Vivisimo の画面からキーワードを入力して検索を行うと、まずクエリーを検索対象となるサイトのエンジンに渡す。サイト内検索が検索結果を返してくると Vivisimo がそれを受取り、クラスタリングして画面に表示する。
例えば、FirstGov にて用意されている(FirstGovの)サイト内検索で「internet fraud」と検索すると、同キーワードを含むページが一覧で表示されるだけだ。それに対して Vivisimo の Vivisimo Clustering Engine 技術で検索を行うと、"law enforcement" や "Securities and Exchange Comission", "Victims", "FTC" といったトピック別に分類して表示をしてくれる。
なお、Vivisimo は政府関連サイト以外にも News や Science and Engineerig、Universities、Business and Law など様々な専門分野において同社のクラスタリング技術のデモンストレーションを行っている。例えば News なら CNN や Yahoo! News、USA Today、BBC Online といったサイトの検索で Vivisimo を利用できる。
Vivisimo Clustering Engine Demos
h
Clustering Engine Demos (Government)
[Source]