Google の PageRank の概念を踏まえた上で、実際にWebサイト構築を行う際にはどのように取り組んでいけばよいのか。
※ PageRank の基本的事項は理解しているという前提で話を進めています。
※ PageRank の基本的説明は省略しています。わからない方はPhil Craven 氏による Google PageRank の解説をご覧下さい
GoogleはWebページの検索結果を決定する際の一つの要素として PageRank によるWebページの重み付けを行っています。テキストマッチやテーマ、リンクポピュラリティーなど全ての要素を計算した上で一番最後に PageRank による並び替えが行われています。従って PageRank によって絶対的に順位が決するわけではありませんが、SEOを行うのであれば何らかの対策をしておきたいものです。
PageRank は漠然と「外部ドメインのWebサイトからもらうリンクの質と量によって決定される」ということは理解されていても、「Webサイト内部のリンクもPageRank として計算される」こと、そして「Webサイト内部のリンク構造によってWebサイト全体の総PageRank は変わらなくても各々のWebページに対して配分される PageRank の量は変わる」こと等は意外と知られていない、あるいは勘違いされていることです。
そこで、「PageRank配分の最適化理論」ということで、PageRank の基本的な処理のされ方を学びつつ PageRank という概念を実際のWebサイト構築に反映させてWebサイト全体の最適化を図る際にはどうすればよいかを解説していきたいと思います。第1回目は「Webサイト内部のリンク構造によって PageRank 配点は変わる」ということを理解して下さい。
まず以下の図版をご覧下さい。
これはWebサイト内部のリンク構造について、頻繁に利用される3つの形態について取り上げています。ほとんどのWebサイトのリンク構造は上記3つのいずれかの組み合わせ、または派生したものです。わかりやすくするために、Webサイトは4つのWebページで構成されており、外部サイトからのリンクは1つもないと仮定します。矢印の方向はリンクの向きを指しています。両方に矢印がある場合はそのページが相互にリンクしていることを表しています。
まずストレート型(straight link structure)。これはあるページから別のページに対してリンクが張られているが、張られた側のページからリンク元のページにはリンクが返っていません。ただ一方向へとリンクが張られているだけ。これはホームページ制作初心者のWebページによく見られる形態ですが、サイト内移動する際にブラウザの戻るボタンをクリックしなければならないなど不便な為一般的なWebサイトでは用いられていない構造です。あえて使われるとしたら注文手続き画面でしょうか。
次にヒエラルキー型(hierarchy link structure)。頂点となるWebページを起点として、3つのWebページがぶら下がっています。個々のページと頂点にあるページは相互にリンクされていますが、個々のページ同士はリンクされていません。このリンク構造はコラムやニュースサイトなどによく見られるリンク構造です。当SEM-ResearchのWebサイト内においても、各カテゴリートップページと個々の記事の関係はこのヒエラルキー型になっています。
最後にクロスリンク型(cross-link structure)。これは4つのWebページが相互にリンクされている状態です。あるWebページは他の3つのWebページに全てリンクされています。このリンク構造は主にWebサイト内における主要ページ内に見られます。当サイトであれば、トップページ及び主要カテゴリー(画面上部及び下部にあるメニューページ)間にこのクロスリンク型のリンク構造が見られます。
ここでPageRankのお話に戻りましょう。この3つのリンク構造ですが、どれをとってもこの4つのWebページで構成されるWebサイトの総PageRank(4つのWebページに割り当てられたPageRankを合計した数値)は変わりありません。この場合の総PageRank は 4です。
何故4になるのか、実際にPageRankを求めてみましょう。ここで利用する計算式は公開されている次の計算式です。
PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
Google が実装している PageRank 計算はもっと複雑な計算式を用いているのですが、基礎理論を学ぶには十分ですのでこの式を使います。この式の意味を知りたい方は Google PageRank 計算式をご覧下さい。
計算を簡易にするために、減衰係数※ d は 0.85 とします。
※減衰係数・・・簡単にいうと、全てのリンクを同列に取り扱うのは不合理なので、リンクの持つ性質によって減衰係数をかけて PageRank 値を変えるのです。例えば外部サイトからのリンクと同一ドメイン下ページ間のリンクでは減衰係数 d の値は変わります。
きっと多くの方は計算式を見るとめまいがしたり全然興味ないかと思いますので、計算過程は省略します。仮に各々のWebページに1を割り当てて PageRank を求めると、
リンク構造 Webサイト総PageRank
- - - - - - - - - - - - - - - - - - - -
ヒエラルキー 4
クロスリンク 4
ストレート 1.2913688
PageRank値は上記の通りです。PageRank はリンクによって点数が配分されていきますが、ストレート型はWebページ間のリンクのつながりが悪い(つまりWebサイトリンク構造が悪い)ために本来総PageRankを4にできるはずなのに 1.29 のパフォーマンスしか発揮していないわけです。一方、ヒエラルキー型とクロスリンク型はどちらもPageRank がWebサイト内の各々のWebページに行き渡っているため、総PageRank数は4になります。
しかし、ヒエラルキー型とクロスリンク型は総PageRank数こそ同じでも、実はWebページに配分されている値は異なります。
ヒエラルキー型の場合、各々のWebページに配分されている点数は次の通りです。
頂点のページ 1.9189
その他のページ 0.6936
このようにヒエラルキー型リンクの場合は頂点となるWebページに対して PageRank が集中しています。一方クロスリンク型の各々のWebページへの PageRank 配分は 1 です。クロスリンク型ではWebサイト総PageRankが均等に配分されています。この事実からわかるように、Webサイト内のリンク構造は PageRank の配分点数にも影響します。
言い換えると PageRankの配点をWebサイト制作者が操作できることを意味します。実際にSEOをWebサイトに組み込む時にこのPageRank配分に着目するのです。つまり、ユーザーのランディングポイント(検索エンジン経由して到達する最初に見るページ)に対して PageRank 配分を高くすることで特定キーワードで特定ページを上位に表示させたり、検索エンジンにヒットさせる必要のないWebページの PageRank配点を低くするといった事が可能になります。
この PageRank の配点をコントロールするのが PageRank配分の最適化です。
[筆者注]
※ 本稿は PageRankの仕組みを理解するための理論説明です。実際にWeb制作を行う際には、Webサイト内のリンク構造を決定するにあたり他に考慮すべき様々な要素があります。上記の考え方は、その意志決定をする際の1つの要素として知っていれば良いことであり、上記の理論を絶対に守っていかなければならないというものではありません。他の要素と優先事項を比較した上で、その他の要素がさほど重要でない時などに上記の理論に従った作り方をしてみればよいだけですので、勘違いしないで下さい。