日本でも広まりつつある blog ですが、Trackback が Google に問題を・・・
イギリスの The Register の記事"Blog noise achieves Google KO"を紹介。
Blog には "Trackback" という便利な機能があります。Trackback というのは、あるblogの記事を読んだ読者がそれを参照して自分のBlogでも同じ話題の記事を書いた時に、その参照元のBlogに対して「私も記事を書いたよ」と知らせると同時にそのオリジナル記事から自分の記事へのリンクを設置することができる機能。つまり、他人のBlog上に自分のBlogへのリンクを簡単につけられるわけです。
Trackback は blog の各々の記事毎に1つずつあり、これ自体は HTML でできていますので Google始めとするロボット型検索エンジンもクロール&インデックスしてくれます。しかし先述した通り Trackback は他サイトへの記事一覧であってそれ自体に情報があるわけではありません。
これが Google にとって悩みの種。例えばキーワード「X Panther discussion」で検索すると、Trackback ページばかりが検索されてしまいます。つまり内容のない空っぽのページで検索結果が埋もれてしまっているわけです。これではユーザーが探したい情報を見つけ出せない - 検索結果の精度の低下になっているのです。別に Trackback の機能そのものが悪いわけでもなく、誰が悪いというわけでもなく --- Google はおそらくこの問題を認識しているでしょうから、どう対応するか。
[Source]
Blog noise achieves Google KO [The Register]
Blog noise is 'life or death' for Google [The Register]
[解説]
例えば SEMリサーチのサイトでは MovableType を利用していますが、デフォルト設定ですと各記事の Trackback のページタイトルは
SEM-Research: Discussion on (ここに記事の見出しが入る)
このような形式のため、SEO的にはタイトルタグ文中に重要なキーワードが入ってしまいます。さらに各Trackback のリンクの前後の文脈との関係でどうしても Google 検索アルゴリズム的には高い評価が与えられてしまうため、キーワードによっては上記記事中で指摘されているような事象が発生します。
The Register では Google に対して及ぼしている問題という切り口で取り上げられていますが、これは情報発信者側であるWebサイト運営者も考慮しなければならない問題です。
例えばSEMリサーチは検索エンジンに関連する情報ポータルサイトという位置づけです。より幅広いユーザーに本サイトの情報を伝達できるように検索エンジン対策も組み込んでいます。各々の記事についてキーワードを割り当てて最適化をしていますので、ユーザーが検索キーワードを入力した時にそれに対して「回答」として最も適切な記事が検索結果の上位に表示されるような最適化を施しています(これは自分自身のスキルを維持するという目的もありますけれども)。
しかしここで Trackback の問題がでてきます。私は各記事において特定キーワードでのSEOを考慮しているものの、実際に検索すると記事のページではなくて Trackback が上位に表示されてしまう場合があります。情報発信者からすれば、キーワード毎に最も適切なページへ誘導したいのですが Trackback によってその誘導策が妨げられてしまうのです。
本サイトではこの問題への対処として、「Trackback のページは検索エンジンにクロールさせない」という措置をとっています。META タグと robots.txt の2つを組み合わせて Trackback がおかれているディレクトリをクロール禁止しています。
[関連記事]