検索エンジン AlltheWeb のSEO対策、第2回目。まずは AlltheWeb の検索エンジンとしての機能・特徴を知りましょう。
AlltheWeb は日本語対応
意外と知らない方が多いのですが、AlltheWeb は日本語に完全対応しています。検索結果表示の一部(後述するクラスター部分)でカタカナ処理が行えないようですが、日本語検索が可能です。
AlltheWeb の検索サービスを導入するポータル
国内で AlltheWeb を導入しているポータルは @woman です。@woman は「検索」ポータルではないので、その意味において国内でのサーチトラフィックの影響度は皆無に等しい状況です。
AlltheWeb のインデックスサイズ
AlltheWeb の持つインデックスサイズは、3,151,743,117 です(2003/12/28)。ところで Google は 3,307,998,701です(2003/12/28)。インデックスサイズでの世界第1位は Google ですが第2位は AlltheWeb です。AlltheWeb は実は優秀な検索エンジンです。過去にも(まだ Google が月1更新だった頃)「インデックス更新頻度を9日〜12日に短縮する」、「マルチメディアファイル検索に対応」「PDF ファイルのインデックス」「macromedia Flash 対応」などインデックス対象ファイルの多様化やインデックスサイズの増加、その更新頻度には積極的に取り組んできた検索エンジンです。
AlltheWeb が対象とする検索ファイル
AlltheWeb は 音声ファイルや動画ファイル、画像をはじめとしてPDF ファイルや Microsoft Word、macromedia Flash のファイルにも対応しています。
AlltheWeb の検索結果
AlltheWeb の検索結果は、スポンサー枠(PPC広告)とアルゴリズム検索による検索結果の2つで構成されています。広告には見出し最後に(sponsored)の文字がみられます。AlltheWeb は Overture が運営していますのでPPC広告も当然 Overture スポンサードサーチです。
検索結果はアルゴリズム検索ですので、検索キーワードに対して関連性が高い順番に表示されます。つまり Google と同じということですね。このアルゴリズムの特徴や AlltheWeb のクオリティーマネジメント(検索の品質管理)に関するお話はこの後で取り扱います。
なお、AlltheWeb はニュース検索も提供していますので、キーワードによっては画面上部にニュースのヘッドラインが表示されることがあります。これは Google News をイメージして下さい、そんな感じです。このニュース検索は日本国内も対応していますので、日本語キーワードで入力すれば国内をソースとしたニュースも検索できます。
検索結果のクラスター化
AlltheWeb の特徴は、検索キーワードに応じて適合したウェブページを分類表示する機能です。以前は FAST Topics と呼ばれていたのですが、Overture に買収された後この機能の正式名称は不明です。この機能については後日取り上げます。
検索キーワードの修正
AlltheWeb はユーザーが入力したキーワードの意図をくみ取り自動的にキーワードを補正した上で検索結果を表示します。例えばキーワード「what is the weather in San Francisco」で検索をすると、「weather "san francisco"」というキーワードに書き換えてくれるのです。入力したキーワード「what is the weather in San Francisco」の検索者の意図は十中八九「サンフランシスコの天気を知りたい」でしょうから、それに最も適切な検索結果が返るように「weather "san francisco"」としたわけです。"" で囲まれているのはsan franciscoはフレーズだからです。このキーワード補正・書き換えは他にも「where can I find information about search engine optimization」と入力すれば「"search engine" optimization」になりますし、「Who is the Saddam Hussein」とすれば「"saddam hussein" 」に書き換えられます。
インターネット初心者で検索スキルが高くない人でも適切な情報にたどり着けるようにするための機能ですね。
[関連]