メタ検索エンジンとはあるキーワードに対して Yahoo!JAPAN や infoseek、goo、Google といった複数の検索エンジンにまとめてクエリー要求を行い、それぞれの検索結果を一覧にして表示する「横断検索」サービスです。単純に個々の検索エンジンから取得した検索結果を表示するのではなく、クラスタリングエンジンというWebページ情報を自動的に分類する機能を搭載して、情報を整理して表示する検索エンジンも登場しています。
今日はメタ検索エンジン(メタサーチ)についてのお話です。
メタ検索エンジンって何?
メタ検索エンジンは、複数の検索エンジンを横断的に検索を行った上、個々の検索エンジンが表示する検索結果をまとめて表示する検索エンジンです。
例えば、キーワード「ピエヌ」で Yahoo!JAPAN、goo, infoseek、Google といった複数の検索エンジンで調べものをしたらどうするでしょうか。1つ1つの検索エンジンにアクセスしてキーワードを入力して検索結果一覧を出して、1つ1つのウェブページを見ていかないといけません。
しかし、メタ検索エンジンではこのような手間は不要です。メタ検索エンジンにアクセスして、キーワードを入力して1回検索をするだけで全ての検索エンジンからの検索結果情報を取得できるのです。例えばメタ検索エンジンで「ピエヌ」という言葉で検索を行います。するとメタ検索エンジンはこのワード「ピエヌ」を使ってgoo や infoseek、BIGLOBE(Attayo), @NIFTY, zubaken、Excite、Yahoo!JAPANといった他の検索エンジンでも同じ言葉で検索を行うわけです。それぞれの検索エンジンはワード「ピエヌ」に対する検索結果を返してきますので、それを全部まとめて1画面上に表示してくれるのです。
メタ検索エンジンは独自の検索用のインデックス(情報データベース)は持っていません。先述したように他の複数の検索エンジンのデータベース(インデックス)を利用して検索結果を表示しています。
メタ検索エンジンの検索結果表示方法
メタ検索エンジンには2種類あります。
1つは一覧表示型メタ検索エンジン。これは各検索エンジンから取得した検索結果を検索エンジン毎に一覧表示するタイプです。例えば Yahoo!JAPAN、infoseek、goo、NAVER と4つの検索エンジンに横断検索できるメタ検索エンジンであれば、検索結果画面上には「Yahoo!JAPANの検索結果」「infoseekの検索結果」「gooの検索結果」「NAVERの検索結果」といったように、検索エンジン別にそれぞれの検索結果を1つの画面上で表示をするのです。それぞれの検索エンジンで実際に表示された検索結果、その掲載順位をそのまま一切手を加えずに1画面上に表示をするだけです。
従って一覧表示型のメタ検索エンジンでは「Yahoo!JAPANの1位サイト、2位サイト・・・」「infoseek の1位サイト、2位サイト・・・」といったように検索エンジンごとに関連性の高いサイトから順番に掲載が行われるわけです。これが一覧表示型のメタ検索エンジンです
もう1つのメタ検索エンジンは、複数の検索エンジンから取得したデータをミックスした検索結果情報を提供する、統合型メタ検索エンジンです。
例えば先ほどの例で挙げた4つの検索エンジンに横断検索できるメタ検索エンジンであれば、各検索エンジンから取得した検索結果情報を1つにまとめてしまいます。その上で、メタ検索エンジンが独自に持っている分析・解析手法によって情報の分類を行います。さらに検索キーワードと個々のウェブページの関連性を評価した上でランク付けを行い、検索結果を表示します。つまり、統合型メタ検索エンジンは、独自の方法で全ての情報を整理した上でユーザーに結果を表示するわけです。
一覧表示型メタ検索エンジンでは、「Yahoo!JAPANの検索結果」「infoseek の検索結果」と検索エンジンごとに分類して表示していました。統合型メタ検索エンジンは全てをまとめて一覧表示するため、こういった分類は存在しません。ただ、一覧に表示されているウェブページが元々どこの検索エンジンのインデックスに含まれていたのかわかるように、ウェブページの引用元として検索エンジン名を表示するのが一般的です。
ユーザー側から見ると、統合型メタ検索エンジンの表示している検索結果一覧はあたかもそのメタ検索エンジンが持っているインデックス情報から作成された検索結果のように見えます。しかし実際には複数の検索エンジンから取得した情報を1つにまとめた上でメタ検索エンジンが独自に分類・整理して表示しているのです。
メタ検索エンジンはどんな時に便利?
特にニッチな情報を探している時にはメタ検索エンジンは有効です。1つ1つ検索エンジンで検索をして探して行かなくても、メタ検索エンジンを利用すればたった1度の検索で済むからです。また個々の検索エンジンがカバーできるウェブ情報量には限界がありますが、メタ検索エンジンを利用すれば全ての検索エンジンのインデックス情報を一度に利用できるため、短時間により包括的なウェブ検索が可能です。メタ検索エンジンで見つからないような情報はウェブ上には存在しないと考えてもいいほどです。
海外のメタ検索エンジンには、例えば検索キーワードがeコマースサイトと関連性が高い時にはペイド・リスティング(リスティング広告)されているウェブを優先表示するといった細かな利便性の向上が図られています。今後日本のメタ検索エンジンも更に機能を高度化させていくことでしょう。
メタ検索エンジンの紹介
主なメタ検索エンジンの紹介です。
KartOO visual meta search engine (英語)
http://www.kartoo.com/メタ検索エンジン。Googleを除くAltaVista、Teomaなど、ほぼ全てのメジャーなサーチエンジンに対して検索を行なうメタ検索エンジン。Macromedia Flash を利用して検索結果をビジュアルな地図に表示するのが特徴。
Excite.com (英語)
http://www.excite.com/米Excite。米国の Excite はメタサーチエンジンになっている。Google · Looksmart · Inktomi · Ask Jeeves · About · Overture · FindWhat · FAST · Open Directory · Search Hippo · Sprinks が対象。関連性の高い順番に並べ替える。
dogpile (英語)
メタサーチエンジン。Google, FAST, Ask Jeeves and Inktomi, About, LookSmart and The Open Directory, Overture, FindWhat, Sprinks and ah-ha, FAST, Ditto, PriceGrabber, MP3Board, AstraWeb and BoardReader, Dogpile Guaranteed Search Inclusion 等が検索対象となっている。
vivisimo (英語)
米国のメタサーチエンジン。on-the-fly, conceptual, hierarchical, document clustering. と呼ばれるクラスタリングエンジンを採用。
WAKANO (日本語)
日本のメタ検索エンジン。リアルタイムコンテンツ自動分類、強力な知能型のコンテンツ分類(Clustering)エンジンを搭載。150個のアイテムをリアルタイムで自動分類するのにかかる時間は,たったの0.5秒と高速な検索機能を有する。
ちなみに WAKANOとは,「We Absolutely Know Alpha aNd Omega」の略で,「インターネットのことならすべて分る」という意味を込めたネーミング.
MarkAgent METASearch (日本語)
日本のメタ検索エンジン。MarkAgentの持つ膨大な利用データからブックマーク数,クリック数,人気度等をリアルタイムに様々な手法で効果的に適用した結果を表示。
メタ検索エンジンの技術的仕組み
メタ検索エンジンの技術的仕組みについて少し説明しましょう。
「統合型メタ検索エンジン」は独自に持っているアルゴリズム解析手法に基づいて複数の検索エンジンから取得した検索結果情報を更に分類・ランク付けすると先述しました。これはつまり、メタ検索エンジン側で情報に付加価値(情報の分類、独自のランク付け、重複データの削除など)をつけて検索結果を提供しているわけです。
では、これを達成するために、メタ検索エンジンはどのような技術的仕組みを持っているのでしょうか?
例えば米InfoSpace は各検索エンジンから取得した情報に、さらにキーワードとの関連性を評価した上で関連性の高い順番に並び直しを行っています。各検索エンジンがキーワードに対して「ベスト」だと思ったデータの中からさらにベストなウェブページを広いだすわけです。またキーワードが商用サイトに関連するもの(例えば商品名やサービスに関係するもの)であれば PPC広告を優先的に検索結果に表示するような工夫も行われています。
こういったメタ検索エンジンが持つ様々な技術の中でも、特に注目されているのが「クラスタリングエンジン」と呼ばれるものです。
情報分類をするクラスタリングエンジン
米 Vivisimo(よみ:ビビジモ) や WAKANO(よみ:ワカノー)はクラスタリングエンジン(Clustering Engine)と呼ばれる技術を搭載しています。クラスタリングとは「分類」を意味します。クラスタリングエンジンは、各検索エンジンから取得した情報を分析して、トピック、テーマ的に関連のある情報に分類をリアルタイムで行うのです。
例えばWAKANOは、「コンテンツ自動分類」(Real-Time Content Clustering、リアルタイムコンテンツクラスタリング)を搭載しています。米Vivisimo はVivisimo Clustering Engine (TM) "on-the-fly, conceptual, hierarchical, document clustering" というクラスタリングエンジンを搭載しています。
実際に WAKANO でキーワードを「イラク」として検索をしてみてください。キーワードとしては「イラク」ですが、WAKANO がこのキーワードを元に探していそうな意味のある情報に自動的に分類をしてくれます。例えば「イラク 大量破壊兵器」「イラク 情勢」「イラク 戦争」「トピックス イラク」「イラク 基礎 データ」といった、WAKANO が自動的に分類・生成してくれたグルーピングを目にすることができるはずです(2003年8月31日時点)。米Vivisimo でキーワードを "Iraq" として検索をしても同じように情報をグルーピングして表示してくれます。
これは WAKANOや米Vivisimoが搭載するクラスタリングエンジンが各検索エンジンから取得した今この瞬間の情報をリアルタイム処理して情報を自動分類したのです。
ユーザーが必要とする情報の単位で検索結果を表示
ユーザーが検索を行うとき、それは何かの情報を探しているから検索を行っているはずです。そこで、WAKANO や 米Vivisimo が搭載している検索エンジンは入力されたキーワードを元に、ユーザーが探していると思われる意味のある情報グループ毎に分類をして検索結果画面に表示をしてくれるわけです。
「イラク」の例であれば、単にイラクという言葉を含む文書を関連性の高い順番に表示するのではなく、イラクの「○○○」(情勢、基礎データ、大量破壊兵器、等)といった探していると思われる情報単位で検索結果を表示しています。ユーザーが必要としていると思われる情報単位でグルーピングをすることにより、膨大な検索結果の中からユーザーはより早く目的とする情報に到達する事ができるわけです。
頻繁に検索エンジンを使う人には、このクラスタリングエンジンを搭載しているメタ検索エンジンは大変便利な検索ツールになるはずですし、実際に使っていると大変便利なことに気がつくと思います。今まで Yahoo!JAPANや Google しか使ったことのない人は是非この機会に試してみてください。