SEMリサーチ

企業で働くウェブマスター向けに、インターネット検索やSEOの専門的な話題を扱います

オーサーランク(AuthorRank)議論の背景と将来の可能性

オーサーランクまわりの話について誤解・間違った記事が氾濫しているので、その言葉が生まれた背景や、今日までの Google の言及、将来の可能性について簡単にまとめてみます。

※ 本記事では、便宜上「オーサーランク」という用語で説明していきます。また、Google 側の発言は社員により rel=author、Authorship など用語の使い方が曖昧ですが、文脈・背景的に同じものを指していると考えて差し支えありません

オーサーランク(AuthorRank)とは

『オーサーランクとは、著者に基づいてウェブページをランク付けするアプローチ全般を表す用語です』。後半で述べるようにコンテンツ品質推定のための数あるシグナル(手がかり)のうちの1つに過ぎませんので、決して有名人の発言を優遇するものではありません。

…オーサーランクという言葉は、Google (あるいは検索開発会社)から発せられた言葉ではなく、SEO業界側で自然に作られた用語です。では、いつ頃からオーサーランクという言葉が語られだしたのでしょうか。

時代は2005年に遡ります。当時、David Minogue, Paul Tucker らによる特許文書が注目を集めました。Agent Rank (US 20070033168 A1) です。

Agent Rank 特許 (2005年)

The present invention provides methods and apparatus, including computer program products, implementing techniques for searching and ranking linked information sources. The techniques include receiving multiple content items from a corpus of content items; receiving digital signatures each made by one of multiple agents, each digital signature associating one of the agents with one or more of the content items; and assigning a score to a first agent of the multiple agents, wherein the score is based upon the content items associated with the first agent by the digital signatures. [Agent Rank, United States Patent Application, US20070033168 A1]

Google PageRank は、「よく引用される論文は良い論文」という考えに基づいています。つまり、多くのページからリンクされているページほど重要度の高いページとみなす、また、同じ1つのリンクでも重要度の高いページからのリンクはより価値があるものとみまします。ここまでは皆さんご存知かと思います。

しかし、IR (Information Retrieval) の研究として捉えると、まだまだ改善できることは数多くあります。その1つは、「情報単位の評価」です。

某ポータルサイトに掲載された次の記事を題材に考えてみましょう。

リブセンス決算で改めて注目、オーサーランクとは? - THE PAGE

上記記事は、SEO について理解がないライターによって適当に執筆されたのでしょうか、読む価値はゼロです(だから rel=nofollow つけました。この記事のどこがダメなのかは後述します)。しかしながら、上記記事は headlines.yahoo.co.jp という世界中から数多くのリンクが集まった、PageRank の目で見れば「重要度が極めて高いサイト」に掲載された記事です。したがって、たとえ上記のような信頼性が極めて低い記事であっても「オーサーランク」などのキーワード検索をすると検索上位に表示されてしまいます。

従来の検索エンジンは、ページ単位の重要度や信頼性を推し量ろうと試みているものの、その書き手のことは考慮していません。Yahoo!ニュースのように、1つ1つの記事(ページ)が全く属性の異なる記者によって執筆されていることもあれば、1つの記事が複数のライターによる共著ということもしばしばあります。しかし、検索エンジンはそれを判別することができません。

もしも著者の情報を取得し、その評価に基づいて検索順位を考慮することができれば、きっとより優れた検索体験をユーザーに提供することができる可能性があります。先の例でいえば、headlines.yahoo.co.jp に掲載されたページであるが「著者は検索の話題について無知である、権威性が低い」ことを考慮して検索上位に表示させなければ、検索利用者に間違った情報を目に触れやすい場に掲載することを避けられます。

話をAgent Rank の特許文書に戻します。この文書は、情報単位で著者(Agent)と結び付けて、その Agent のランク(重要度)を計算してランキングを決める方法について述べられています。

この特許文書が見つかった時に、SEO 業界内では「そうか、ページ単位ではなく、書き手の単位でランク付けする方法が考えられているんだ。今後はページの評価だけじゃなく、オーサーの評価も重要になってくる可能性があるんだ」と認知されたことで、例の「オーサーランク(AuthorRank)」という言葉が出てきました。

あくまで特許文書ですから、実際に Google がそれを利用しているか否かすらわかりません。特許ですから。ただ、マウンテンビューに勤務する Google 社員が執筆した論文ですから、Google の未来の検索にとって全く無縁であるともいえないでしょう、だから非常に注目を集めて、様々な議論が交わされました。

ここまでの話をまとめますと「Google が出願した Agent Rank 特許が話題になってオーサー評価の可能性に注目が集まったことでオーサーランクという概念(言葉)が生まれた」「オーサーランクは SEO 業界側が生み出した言葉」ということです。

##

[追記] タイトルがおかしいのに始まり、最初から最後まで適当でない記述が多数確認されたため、公開時点では意図的に言及を避けました(触れたくなかった)。しかし、Twitterにて @bangumihihyo(荒木 厚/アラキアツシ)さんより、具体的に(リブセンス決算で改めて注目、オーサーランクとは? という記事の)ダメな個所を説明すべきではないかとのご指摘を頂きました。

それを踏まえまして、当該記事の内容が正しいと思われた方にとっては説明が不親切だろうと判断をし、特に本論に直接関係する部分2か所のみ、簡単に追記することにしました。本題であるオーサーランクの話から外れるため、最初の2段落(リブセンスの個所)及びその他の個所についてのコメントは省かせて頂きます。bangumihihyoさんご指摘ありがとうございました。

--

[1]引用:『オーサーランクとは、その名の通り、文章の書き手をランク付けし、より専門性が高いと判定された人のコンテンツを上位に表示しようというものです。』

→→→書き手の専門性(expertness)というよりは、信頼性(trustworthiness)を推量してランク付けする仕組みです。専門性を有することと、評判が良いことは別です。たとえばテレビのニュース番組に出演している専門家コメンテーターがいつも意味不明な発言していて視聴者の評判はよくないというケースがありますよね。専門性は信頼性を構成する1つの要素といえばいいでしょうか。

[2]引用:『どのようにして書き手をランク付けするのかについては今のところ不明ですが、おそらく自然言語解析技術を用いるものと考えられます。プロフィールが明確で著名な書き手についてはすぐにランク付けが可能と思われますが~(略)』

→→→信頼性や権威性の評価方法は、対象アカウントへの言及・参照・支持・影響力の程度を計算するのか、リアル世界の属性情報を使うのか、様々な可能性が考えられます。例えば Google+ のフォロワー数、シェア数、活動状況、ソーシャルグラフの状態など諸説あります。いずれにせよ、自然言語解析技術はこの文脈であれば適当ではありません。また、プロフィール欄の肩書を参考にするわけではないのです(それなら皆、好き勝手な肩書を書けば操作し放題になってしまうじゃないですか)。

--

##

rel=author の将来の可能性を Google が語る (2011年)

議論は続くものの公式の情報ではありませんから結論は出ませんでした。そして時が流れて2011年。Google がrel=author (Authorship)を発表した時に、その rel=author プロジェクトに携わった社員の一人・Other Hansson氏が rel=author と将来の可能性について言及しました。

Authorship markup

Matt Cutts: So I'm sure the first question they're going to ask is; what's it for me ? What do they get if they implement rel=author ? Will people get higher rankings ? Is there a ranking boost for rel=author ?

Othar Hansson: Right, so it's obviously early days. So we hope to use this information and any information as a ranking signal at Google. So in this case we want to get information on credibility of authors from all kinds of sources and eventually use that in ranking. We're only experimenting with that now. Who knows where it will go. [Other Hansson and Matt Cutts, AUthorship markup, Google Webmasters, August 9, 2011]

rel=author (Authorship) はまだ誕生したばかりの実験的プロジェクトであり、将来どうなるかはわからないものの、rel=author の情報をランキングシグナルとして利用したいと考えている趣旨の発言をしたことで、再び「オーサーランク」に注目が集まり始めました。あらゆるソースから集めた著者の信頼性という情報が得られれば、きっと検索に役立つのです。

Authorship の可能性について Google が語る (2012年)

さらに翌年の2012年。Authorship について同社社員・Sagar Kamdar氏がインタビューで次のように答えました。

Grant Crowell(Question): How long has the Authorship program been around, and how big is it today?

Sagar Kamdar(Answer): We’re still in our pilot phase as we’re learning a lot from authors and users as we continue to look for ways to improve the program [...] [Sagar Kamdar, Director of Product Management on Search, Google, "Google Authorship: An Interview with Google’s Sagar Kamdar", July 17 2012, Search Engine Journal]

Grant Crowell(Question): Is Authorship used by Google as a ranking signal? (i.e., does it factor into search rankings?)

Sagar Kamdar(Answer): Not for now, but it isn’t off the table. “We use over 200 signals to determine search ranking, and although authorship is not currently one of those signals, we hope to experiment with using information about authorship as a signal in ranking in the future,” says Kamdar. [Sagar Kamdar, Director of Product Management on Search, Google, "Google Authorship: An Interview with Google’s Sagar Kamdar", July 17 2012, Search Engine Journal]

Google は200以上のシグナルを用いて総合的に検索順位を決めているが、authorship は現在(2012年時点)でそのシグナルではないとコメントしながらも、将来、Authorship で得られる情報をランキングシグナルとして使うことを試みたい意向を話しています。これまたオーサーランク論が過熱していきました。

rel=author の将来について Matt Cutts が語る (2013年)

そして特別エンジニア・マットカッツ氏も rel=author の未来の可能性について語ります。

Will Google be evaluating the use of rel="author" moving forward?

現実の世界のモノや、モノとモノの間を認識できるようにするために開発したナレッジグラフがあるように、現実の著者が誰なのか、何を書いているのかを把握することは有益であり検索品質の改善に寄与するであろうと話しています(※ 他にも色々話していますが省かせて頂きます)。

AuthorRank(著者評価)は限定的に利用されている (2014年)

2014年5月現在、Google が公式に認めているのは「In-depth articles (日本語名「詳細な記事」機能)の選択時に著者情報を考慮している」ことです。詳細は次の記事『Google、著者情報をランキング要因に考慮していることを明らかに』をご覧ください。In-depth articles の選択・ランク付けに具体的にどのようなシグナルを用いているかは明らかにされていませんが、少なくとも著者情報を1つの要因として考慮していることは認めています。一方、通常ウェブ検索結果には著者情報(Authorship に紐づけられた情報)は使用していないことも明言しています。

なぜ著者情報が重要なのか?リンクはどうなるの?

例えば、あなたの会社で「英語がペラペラ話せる人間」を採用したいと考えたとしましょう。この場合、その人物の能力を判断するうえで…

A: TOEIC または TOEFL の点数で決める

B: TOEIC または TOEFL の点数に加えて、採用面接自体を英語で実施する

A のように TOEIC や TOEFL の点数という1つの尺度だけで判断するよりは、点数も考慮しつつ面接を英語でこなせる程度のスピーキング能力も確認するという2つの尺度で見た方が、より適切な人物を選ぶことができるでしょう。

これと同じことです。ウェブページの重要性や信頼性を推し量るうえでは、

A:ページの内容の理解(キーワードレベル)

B:ページの第三者による評価、人気投票(≒リンク)

C:ページの書き手の評価(≒オーサーランク)

Google 登場以前の A だけの指標よりも、Google が持ち込んだ B と A を組み合わせた方が適切に価値のあるページを選び出すことができます(だから検索技術が飛躍的に進化した)。さらに、A、B に加えて C の指標も加えれば、有益な情報を精度よく選ぶことが可能となり、ひいては検索品質の改善に役立つことでしょう。

さらにいえば、A はキーワードレベル(キーワードの含有割合)だけでなく、トピック(話題)の把握、さらに自然言語処理技術を推し進めて本当の言葉の意味を理解させるまでに発展させることができれば、リンク分析や著者分析と組み合わせることで検索性能をもう一段レベルを引き上げることになるでしょう。

被リンクという評価手法から、何か別のものに移行する、置き換えられるという話ではありませんのでご注意ください。技術発達により、従来はできなかった評価方法を用いることが可能になれば、その他の評価方法の相対的な重要性は低下していくものです。例えば、ある大学の入学試験が英語(100点満点)、国語(100点満点)の2教科だったものが、英語+国語+数学+小論文(各100点満点)の4教科に変更されたら、国語と英語の相対的な重要性は低下しますよね、それと同じです。自然言語処理が進化し、(従来不可能だった)モノゴトの真の意味の理解が可能になれば、従来の評価指標は重要性が下がります。[Google「バックリンクの重要性は薄れる」今後は著者オーソリティやコンテンツ分析へ]

だから、「著者の情報も考慮する」というのはページを評価する軸・尺度を追加する、多様な面から解析・評価することでコンテンツ全般を把握する精度を高めるということです。前半で紹介した記事が述べているような「リンクが著者評価に置き換わる」などというお話ではありません。より多様な側面から物事を見ることでより正しくその対象を理解できるように、検索エンジンも「ページが何について記述されているのか」を正しく理解できることを目指して、従来のコンテンツ分析やリンク分析に加えて、著者評価の視点を加えられないか可能性を検討しているのです。

最後に(お客様から頻繁に御質問頂くのですが)「リンクはどうなるの?」という話ですが、オーサーランクをウェブ検索に適用できる日がくるのはまだ少し先のお話です。適用した時には、相対的に(評価指標が増えるのですから)リンクの重要度は薄まりますが、必要なくなるわけではありません。よって現状は、自然リンクが増える施策をどのようにするのか、多くのユーザーに言及・参照をうける機会を増やすためのコンテンツ戦略をどうすべきかを考える段階です。ただ、限定的に利用されている機能もあるので、とりあえず Google+ くらい運用してみたらいかがでしょうか。

AuthorRankは本当に重要なの?

[UPDATE 2014/05/27 大事なことを言及していなかったため、以下追記] オーサーランクは「著者」=個人が誰かを判断することが基本にあります。しかし、果たして全てのウェブページで著者は明らかにされるべきものでしょうか。

たとえば、企業のコマースサイトを考えてみてください。1つ1つの商品説明ページの「著者」とは誰でしょうか。コーポレートサイトの会社概要の「著者」とは誰でしょうか。それらの「誰」は明らかにされ、その書き手によって商品説明ページや会社概要ページは評価される必要があるのでしょうか。

Google が既にリリースしている Authorship(※ Google+プロフィールと自分のウェブサイトを紐付けることができる記述法)は現状、「個人(1名)が自分の意見や考えをテキスト主体に発信した情報」が想定されています。具体的には新聞社サイトでジャーナリストがコラムを書く、メディアサイトで記者がニュースを発信するなどが該当します。しかし企業トップページやサービス案内、商品説明ページなどに掲示された情報は組織体が発信する一般的な情報のため、Authorship は想定されておらず利用もできません。

また、オーサーランクがランキング要因全体の中でどの程度の位置づけなのかという点も考えなければいけません。たとえば「ページ読込速度」がランキング要因に位置付けられた際はかなり注目集めましたが、実はほんの小さなシグナルの扱いに過ぎないのです。それと同じで、オーサーランクも色々と議論されているものの、実際の影響はたいしたことない可能性も大いにあるのです。

以上の理由により、仮に近い将来オーサーランク的なものが登場するにしても、影響範囲は比較的限定的である点に留意してください。注目を集めている話題ですが、実は自分には(少なくとも当面は)全く関係がないという企業担当者の方もきっといらっしゃるに違いありません。

もっとも、個人ではなく組織体として情報発信者を定義する機能がリリースされるなどしたら話は変わるのかもしれませんが、そうした想像はあまり意味がないので、深く考える必要はありません。

#

本文で紹介した記事を厳しく批判しましたが、「ネットで話題になっているキーワード使って適当に記事書いてみました」感で溢れていましたので。全体の一部が少しくらい間違っていても記者さんは専門じゃないし仕方ないよねで済みますけど、このレベルは仕事が雑すぎるのではないでしょうか。

COPYRIGHT © 1997-2021 渡辺隆広(わたなべ たかひろ) ALL RIGHTS RESERVED.

お問い合わせ(お仕事の相談、講演依頼など)

SEMリサーチ(www.sem-r.com)に掲載している文章及び図版の無断使用及び転載を禁じます。著作権侵害行為には厳正に対処します。

免責事項:SEMリサーチは、本記事中で触れている企業、商品、サービスの全て(情報)について、有用性、適合性、正確性、安全性、最新性、真実性に関する一切の保証をしておりません。各自の判断でご利用下さい。