このページは、外部サイト
SEO Japan の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「
Googleがリンクの価値を決定する34の要素」 からご覧ください。
SEO by the SeaからGoogleの取得した特許を元に、Googleがページ上のリンクをどのような要素を元に評価するのか、という考察。Googleのアルゴリズムを理解する上で参考になります。 — SEO Japan
リンクベースのランキングシステムにおいては、すべてのリンクが等しいわけではなく、検索エンジンは、ページにそれぞれのリンクの重要度を伝える仕組みを特定するため、様々な要素を見ている可能性がある。
グーグルがウェブページを格付けする際に利用するシグナルの一つが、リンク先とリンク元である。他のウェブサイトにリンクを張られているページを特定するためだ。“重要”なページからのリンクはあまり重要ではないページからのリンクよりも重要視される。このシステムにおける重要なページとは、他の重要なページから、もしくは重要ではない多数のページから、もしくはその両方からリンクが張られているページのことを指す。このシグナルはページランクと呼ばれ、グーグルがウェブページを格付けし、検索者からのクエリに応じて検索結果のページに表示する位置を決めるために利用する数多くのシグナルの一つである。
グーグルのファウンダーが初期に綴った論文、
「大規模なハイパーテキストに基づくウェブ検索エンジン」によると :
ページランクは、ユーザーの行動のモデルとして考えることが出来る。グーグルは、ウェブページを与えられると、“戻る”ボタンを押さずにリンクをクリックし続けるものの、やがて飽きて別のランダムなページで同じことをする“ランダムサーファー”が存在すると仮定している。ランダムサーファーがページを訪問する可能性がそのページのページランクである。
このアプローチの下では、同じページのリンクは別のページに向かう場合、どれも同じ重要度を持つことになる。
2004年に申請され、最近承認されたグーグルの特許は、リンクが同じページに表示されている際のリンクの持つ価値に対して、少し異なるアプローチを採用している:
発明の原則に沿ったシステムおよびメソッドは、サーファーが一連のリンクを介して文書にアクセスした際に、サーファーがリンクの幾つかをそれ以外のリンクよりも高い確率でクリックすることを示唆するリーズナブルサーファーモデルを特定することが出来る。
このリーズナブルサーファーモデルは、文書に関連するリンクのすべてが同じ確率でクリックされるとは限らない点を反映する。「利用規約」のリンク、バナー広告、そして、文書に関係のないリンクはクリックされる確率が低いリンクの例として挙げることが出来る。
特許:
ユーザーの行動および/または特徴的なデータを基にした文書のランクづけ
発明者 ジェフリー A. ディーン、コリン・アンダーソン、アレクシス・バトル
グーグル Inc.に委託
米国特許 7,716,225
付与日: 2010年5月11日
申請日: 2004年6月17日
抜粋
リンクが掲載された文書からのリンクの異なる特徴に関連するデータ、そして、リンクに関連するナビゲーションの行動に関するユーザーの行動のデータをベースにしたモデルを生成するシステム。また、このシステムは、モデルをベースに文書を格付けする。
この“リーズナブルサーファー”モデルでは、ページに表示されるすべてのリンクが同じ価値を持っているわけではないことを意味している。リンクに関連する別の特徴、そして、リンクが表示されるページおよび導くページによって、これらのリンクがリンク先のページに与える価値の大きさが決まる。
リンクと文書の特徴
この特許では、検索エンジンがウェブのページをクロールし、インデックスするとき、検索エンジンは、リンクが表示されるソースページ、リンクが導くターゲットページ、そして、当該のリンク自体に関連する特徴に注目し、これらのページのランクを決める上で役立つモデルを生成する。また、検索エンジンは、例えばどのリンクをクリックしたのか、ページを見つけるためにどんなクエリを利用したか、さらにウェブブラウザもしくはツールバー等のブラウザのアドオンから得られるその他の情報等、ビジターがページをどのように利用しているかに関する情報を集めることもあり得る。
以下のリストに特徴の例を掲載する。すべての特徴が利用されるわけではなく、また、リストアップされていない特徴が用いられる可能性もある点を留意してもらいたい。
リンクに関連する特徴:
リンクに関連するアンカーテキストのフォントのサイズ;
リンクの位置(例えばHTMLリスト、本文、800 X 600のブラウザのディスプレイで一目で見ることが出来る位置の上もしくは下、文書の側面(上、下、右、左)、等)、フッター、サイドバー等);
リンクがリストの中にあるなら、リスト内のリンクの位置;
リンクのフォントの色もしくはその他の特質(例、イタリック、灰色、バックグラウンドと同色等);
リンクのアンカーテキスト内の単語の数;
リンクのアンカーテキスト内の実際の単語;
リンクに関連するアンカーテキストの商業的な度合い;
リンクの種類(テキストリンク、イメージリンク);
リンクがイメージの場合、アスペクト比の度合い;
リンクの前そして/または後の幾つかの言葉の前後関係;
リンクのアンカーテキストに関連するトピックのグループ;
リンク先が同じホストもしくはドメインかどうか;
リンク先が同じドメインのページかどうか;
リンクのURLがリファラーURLよりも短いかどうか;
リンクのURLが別のURLをエンベッドしているかどうか(例: サーバー側のリダイレクト)
ソースの文書に関連する特徴の例を以下に挙げていく:
ソースの文書のURL(もしくはソースの文書のURLの一部);
ソースの文書に関連するウェブサイト;
ソースの文書内のリンクの本数;
ソースの文書のその他の言葉の存在;
ソースの文書の見出し内のその他の言葉;
ソースの文書が関連するトピックのグループ;
ソースの文書に関連する部分とリンクのアンカーテキストのマッチの度合い;
ターゲットの文書に関連する特徴の例を以下に挙げていく:
ターゲットの文書のURL(またはターゲットの文書のURLの一部);
ターゲットの文書に関連するウェブサイト;
ターゲットの文書のURLがソースの文書のURLと同じ場所でホスティングされているかどうか;
ターゲットの文書のURLがソースの文書のURLと同じドメインと関連しているかどうか;
ターゲットの文書のURL内の言葉;
ターゲットの文書のURLの長さ;
文書およびリンクに関連するユーザーの行動のデータもまた以下のように考慮される可能性がある:
ナビゲーション的な行動等(選択したリンク、入力したウェブサイトのアドレス、記入したフォーム等)、人々が文書にアクセスし、利用する方法に関する情報、
ユーザーの言語、
ユーザーの興味、
入力されたクエリの用語、
リンクが選択される頻度、
あるリンクが選択された際に、別のリンクが選択されない場合の頻度、
ページで一つもリンクが選択されない場合の頻度、
etc.
このようなユーザーの行動のデータは、ウェブブラウザもしくはグーグルのツールバーのようなブラウザのアシスタントプログラムから入手することが出来るだろう。
リンクの重要度に影響を与える仕組み
このモデルがベースとする特徴は、ページのリンクが、このような特徴のポジティブおよびネガティブな局面によって選択される可能性を特定する意図を持つ。
例えば、特定のサイズよりも大きなアンカーテキストを持つリンクは、小さなサイズのアンカーテキストを持つリンクよりも選択される可能性が高いだろう。ページの上部に近いリンクもまたクリックされる可能性が高いだろう。文書のトピックがリンクが表示されているページのトピックに関連している場合もまた、そのページのビジターに選ばれる可能性は高い。そのため、大きなフォントで、ページの上部に近く、同様のトピックを取り上げるページに導くリンクは、フォントが小さく、ページの底部に近い、関連性のないトピックのページに導くリンクよりも遥かにクリックされる可能性は高いだろう。
この特許は、ページの異なるリンクがビジターによって選択され、クリックされる可能性を特定するために、異なる特徴に適用されるその他のルールの例を提供している。この可能性は、それぞれのリンクの動的な重要度を特定するために用いられ、リンクが導くページのランキングの高さに影響を与える可能性がある。リンクに対する異なる重要度によって、それぞれのリンクが他のサイトにもたらすページランクが決まってくるかもしれないのだ。
もしくは、特許に記載されているように:
文書のランクは、リーズナブルサーファーが多数のリンクを辿った後に文書にアクセスする可能性として解釈される。
結論
ページランクのようなリンクベースのシステムでは、ページのリンクはどの程度の価値をもたらすのだろうか?
本日承認されたこの特許の下では、リンクの価値は、リンクがページのどこに位置しているのか、リンクは他のリンクと異なるフォントや色を使っているか、リンクのアンカーテキストは何ワードあるか、使われているテキストは営利目的か、リンクが掲載されているページのトピックは何か、リンクが導くページのコピーは何か等、多数のファクターによって異なる。
初期のグーグルは、他のページへ向かうリンクを均等に分割した値がリンクの重要度になると述べた、1999年に発表された「ページランクの言及ランク: ウェブに秩序を」に記載された記述を素通りしていた可能性が高い。今回の特許は、グーグルがリンクの価値を異なる方法で評価するために用いてきた多数のアプローチを説明している。しかし、上述のリストは、確実なガイドラインとしてではなく、あくまでも、リンクが評価される可能性のある例として見てもらいたい。
いずれせよ大体の目安は抑えていると思う。リーズナブルサーファーに最も選択される確率が高いリンクこそが、最も重要度の高いリンクと言えるのではないだろうか。
この記事は、SEO by the Seaに掲載された「Google’s Reasonable Surfer: How the Value of a Link May Differ Based upon Link and Document Features and User Data」を翻訳した内容です。
リーズナブルサーファー(Reasonable Surfer)という言葉は単純なロボットと違い、実際にサイトを使用するユーザーという意味かと思いますが、確かにその観点でリンクを評価するアルゴリズムは検索順位を決める上でもより適切なものではと思います。一点、「リンクに関連するアンカーテキストの商業的な度合い」とは有料リンク、SEOのためのリンクということでしょうが、ここをより詳しく知りたいですね。
記事にも書かれているように、全てが現在のGoogleのアルゴリズムに適用されているわけではないでしょうが、しかし、良く考えているな、ということは伝わりますね。リスト上の位置だとか、リンクの色だとか、ここに書かれている細かいことを「SEO的にどうすべきか」という観点で気にしだすと大変なことになりそうですが、いずれにしてもユーザーに使いやすいサイトを作る、リンクも使いやすいリンクにすることが大事なのですかね。 — SEO Japan