SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

SEO:信頼できるリンクを特定する「TrustRank」の概念

SEOにおける外部リンク対策の基本方針は、昔も今も「優良なWebサイトからリンクを獲得する」「リンクが自然に増えるような良質なコンテンツ・サービスを提供する」ことに代わりはない。一方で、私たちは自らのSEOの努力でもって外部リンクを積極的に獲得したいし、数も増やしていきたい。だからこそ、あれこれとリンクを増やす手法が生み出されるわけだが、ただ闇雲にリンクを増やすのではなく「リンクの品質」を常に考えなければいけない。

これに加えて、安定した検索ランキングを維持するために必要とされるのが「信頼性の高いリンク」だ。これは欧米では Trusted Link などと呼ばれる。元々は検索エンジンスパムを排除するアルゴリズムの手法として論文で紹介されたTrustRank※1 の考えがあるが、同手法が実際の検索エンジンに導入されているかどうかは別※2として、リンクの信頼性という概念を何らかの形でランキングの評価に加えている、という見方は少なくない。この概念は2~3年ほど前に同じく欧米で話題になったAuthoriy(オーソリティー)※2という概念にも似ているのだが、ここで簡単に紹介をしておこう。

リンクの信頼性を考慮する「TrustRank」とは

例えば、あなたの大親友で絶対の信頼を置いているサチコさんがいたとする。そのサチコさんに、あなたは面識がないがサチコさんの大親友であるアヤカさんを紹介されたとする。この時、あなたはアヤカさんを信用するだろうか?

大抵の方は「信用する」と答えるに違いない。なぜなら、サチコさんという大親友で信用している人物が紹介した人物だから、きっと”(アヤカさんは)危険な人ではない”と判断するからだ。

では、サチコさんの親友の、親友の、親友の、親友の、親友の、親友の・・・・・親友のマドカさんを紹介されたらどうだろうか。この時は「信用しない」と答えるはずだ。確かにサチコさんは信用できるが、その親友の親友の(以下、省略)親友(=マドカさん)はあなたにとって赤の他人であり、信用してくれと言われてもできないだろう。

こうした考え方をスパムサイトの判定に用いようと考え出されたのがTrustRankという概念だ。TrustRankとは、あらかじめ人の目で見て「信頼できる、充実している」と判断されたWebサイトを複数決めてマークしておく。次に、このマークしたWebサイトを拠点として、リンク先ページに点数を与えていく。マークされたWebからその直接のリンク先ページには多くの点数が与えられるようにする。一方、マークされていないWebページからのリンクは相応に低く点数を与えていく。

一般的に、”良い"ページは滅多に”悪い”ページにはリンクを張らない(どこにリンクを張るか常に注意していると推定できる)、”悪いページ”は同じく”悪いページ”にリンクを張っていることが多い(リンクを増やしたいというSEOの意識が常に働くため)、つまり”悪いページ”は同じく”悪いページ”から数多くのリンクを張られている、などの傾向がある。

したがって、上記のように最初に「信頼できるWebサイト」を決めて点数を配分していくと、Webサイト群によって点数に顕著な偏りが出てくるため、「検索エンジンスパムの可能性のあるWebサイト」「信頼できるに足ると判断できるWebサイト」を抽出できるようになる。

TrustRankのコンセプト自体は導入されているかも?

TrustRankはあくまで米スタンフォード大学のZolt´an Gy¨ongyi氏やHector Garcia-Molina氏、米Yahoo! Inc.のJan Pedersen氏らが発表した論文の話であり、実際にGoogleやYahoo!といった検索エンジンが導入されているかどうかは別問題だ※3。ただし、論文や特許で記述された通りに検索エンジンが技術を実装しているかは別として、そこにあるコンセプトが何らかの形で導入されている(と判断できそうな)ケースは少なくない。今回のTrusted Linkと呼ばれる概念もこうした、「導入されていそうな気配」が感じられる技術の1つといわれている。

わかりやすい例として、日本のYahoo!検索対策における「Yahoo!カテゴリ」登録があげられる。Yahoo!検索で検索上位に表示するために必須の外部リンク対策としてあげられるのがYahoo!カテゴリ登録だが、これは「Yahoo!カテゴリに登録されたサイトは、そうでないサイトと比較して明らかに検索上位に表示されやすい」事実が確認されていること、またYahoo!自身、Yahoo!カテゴリからのリンクはそれ以外からのリンクよりも重み付けを行っていることを認めているためだ。

Yahoo!がこうした手法をとるには無論、合理的な理由がある。Yahoo!カテゴリは人の手により審査され、その審査を通過したサイトのみが掲載されるカテゴリであり、すなわり、Yahoo!カテゴリは「良質なWebサイトの集合」だ。

したがって、こうしたサイトに相応の重み付けをして検索上位に表示されやすくすることは、検索品質の担保とより有益な情報を表示する検索エンジンを構築する上で有効な方法の1つといえよう。ここで「良質なWebサイト」とみなしているのは言い換えれば「信頼に足るサイト」ということであり、先にふれたTrustRankと同様の理由の上で成り立っていることがおわかりいただけると思う。

GoogleにおけるTrusted Linkの考え方

品質の精度を高めるために人の判断や価値基準を積極的に採用するYahoo!に対して、Googleはできる限り技術で問題を解決しようとする傾向がある。そうした背景から、Googleが何らかの形であらかじめ「信頼できるWebサイト」を人の手で選び出している可能性は限りなく低い一方で、何らかのアルゴリズム技術を用いて「信頼に足るWebページ」はあらかじめ選択している節がある。これはPageRankの高低とは関係なく、純粋にGoogleが"他のWebサイトよりは比較的、良好な評価を与えている"と状況証拠から類推できることが複数のケースで確認されていることが背景にある。

この原稿を執筆している時点(2007年3月1日)でまだ検証結果が明確に出ていないため残念ながらここで断定することはできないのであるが、少なくとも、比較的良質なリンクを多く集めている少数のWebサイトからリンクを得ることで、クロールの頻度も通常より高く、競争が著しく激しい検索キーワードを除けば比較的検索上位に表示できる現象は確認できている。"信頼性"という基準をGoogleがどのように構築しているのかは不明であるが、「長期にわたり存続し、非常に豊富なコンテンツを持ち、数多くのディープリンク※4を含む良質なWebサイトからのリンクを持ち、定期的に更新され、かつ、定期的に被リンクも増えていくサイト」からのリンクは比較的高く評価されやすいようだ。結局のところ、この定義に該当するWebサイトのPageRankは総じて高くなるので「PageRankが高いサイトからリンクを集めればいいだろう」と捉えてしまうかも知れないが、少なくとも、(多くの人が好きな"PageRank"という言葉で説明するなら)「"PageRankが高いWebページ(サイト)からのリンクを優先的に獲得するための施策を考えるべき」とはいえよう。

少なくとも、「チリも積もれば山となる」的な考え方で、PageRankの低いページからいくらリンクを集めても以前ほどランキングへの影響は及ばないし、むしろ別項で触れたとおり「低品質のリンクが集まるサイト」と判断されればランキング以前にデータベースへの登録で障害が生じてしまう。

以上の説明では「結局、"Trusted Link"を獲得する方法がわからない」となるので、ここでは筆者が日常用いている判断基準を一例としてあげておこう。

1. Yahoo! / Jディレクトリー / モンキーポッド全てのディレクトリ検索エンジンに掲載されているサイト

2. 更新頻度が非常に高く、記事更新のたびに数多くのブロガーからリンク・言及されているサイトで、かつ、大手ディレクトリ検索エンジンのいくつかに登録されているサイト

3. コンテンツボリュームが膨大(目安として、"意味のある(価値のある)"コンテンツが1,000ページ以上存在する)して、かつ、定期的に更新しているサイト、ただし、シンジケーションサイト(他の媒体からコンテンツ供給を受けているサイト)を除く

注釈

※1 原文は"Combating Web Spam with TrustRank"。

※2 Authority(オーソリティー)とは、インターネットの世界でみんなから「権威あるサイトだ」「この話題の専門サイトはこれだ」「ここはすごいんだ」と思われているWebサイトのこと

※3 検索会社が公開した特許文書にこんな記述があった、公開された論文の執筆者が検索エンジン会社の社員だった、などを根拠に該当文書で触れられている仕組みや技術が検索エンジンに導入されている可能性が高いと主張するものがいるが、別に特許が取得されているからといってそれが検索技術に実装されているわけではない。競合他社に同様の技術を開発させない、あるいは何らかの特許訴訟を起こされた際のカウンターとして訴えるための、いわゆる「防衛特許」と呼ばれるものがあるからだ。ただし、だからといってこうした検索関連の特許や論文に目を通す価値がないというわけではなく、これらに触れることで検索技術の開発視点やトレンドを探ることはできるので、余裕のある人は目を通してもいいだろう。

※4 ディープリンクとは、Webサイトのトップページ(通常は 独自ドメイン.jp/index.html )以外のページに張られたリンクを指す。例えば、過去のニュースを全てアーカイブしているニュースサイト(例 CNET Japan http://japan.cnet.com/ ) は、トップページよりも個別記事に対してブログなどを通じてリンクを張られ言及されることが多いので、サイト全体に対するリンクのうちディープリンクが占める割合は多くなる傾向にある。

執筆:渡辺隆広

本原稿は、2007年3月1日時点のもの

COPYRIGHT © 1997-2020 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。