国内&海外SEO情報ウォッチ 「海外SEO情報ブログ」の鈴木 謙一氏が、日本と海外の検索マーケティング情報をさらっとまとめて毎週金曜日にお届け。
海外&国内SEO情報ウォッチ

NAVERまとめや楽天市場に大打撃か? 同一サイトのページが検索結果に出すぎないようにグーグルがアルゴリズムを変更予定

ページ

海外のSEO/SEM情報を日本語でピックアップ

NAVERまとめや楽天市場に大打撃か? 同一サイトのページが検索結果に出すぎないようにグーグルがアルゴリズムを変更予定
★★★★☆ 多様性を取るか1つに絞るかバランスが難しい (Google Webmaster Help on YouTube)

米グーグルのマット・カッツ氏は、検索結果での多様性を優先させる方向でアルゴリズムを間もなく変更することを、明らかにした。

具体的には、同じドメイン名のサイトからの複数のページが、検索結果で今よりも少なくなるという調整だ。検索ユーザーは、さまざまなサイトから選ばれたページを検索結果で目にすることになるはずだ。

検索結果の多様性(Diversity)に関しては、グーグルはバランス取りに苦労してきている。

多様性を持たせるためにさまざまなサイトのページを提示したいという判断と、1つのサイトから複数のページを提示したほうが、ユーザーにとって利便性が高い場合もあるという判断があるからだ。

多様性を取るか1つに絞るか、これまでに何度か仕様を変えてきた経緯がある。

現状では、検索結果の1ページ目では多様性を優先し、同じドメイン名からのページはなるべく出ないようにしている。しかし2ページ目以降では、適切だと判断すれば、同じドメイン名のサイトであっても複数のページが同時に出現することがある。

しかし2ページ目以降であっても、10件表示される検索結果のうちのほとんどが、1つないしは2つのサイトのページに専有されてしまい、不満に感じるユーザーが、依然として少なからず存在していたことも事実である。

そこで今後は、1つのドメイン名のサイトからいくつかのページがまとめて表示されたら、それ以降の検索結果ページにはそのドメイン名のページが出にくくするように調整を加えることになった。

いくつ出てきたらその後は出にくくなるかに関しては、マット・カッツ氏は「4つ」という例を挙げているものの、特定の数字があるわけではないと思われる。検索クエリやそのクエリに関連性のあるページを持つサイトの数や状態によって変化するはずだ。

いずれにしても検索結果の何ページ目であろうと、同一サイトのページで検索結果が埋め尽くされることは、これからはなくなると期待していいだろう。

楽天市場やNAVERまとめのように、同じまたは類似したトピックのコンテンツが複数あるサイトに何かしらの影響があるかもしれない。

なおこの動画のなかでマット・カッツが説明している検索結果の多様性の変遷や、今回のアルゴリズム変更が及ぼす影響について、渡辺隆広氏が解説している。こちらも参照していただきたい。

追記: この記事を書き終えた後に、多様性を優先するアルゴリズム変更が実行された模様だという情報が入ってきた。

「リンク販売業者たち、覚悟せよ」マット・カッツが警告を発す
★★★★☆ 実際にリンクネットワークに制裁を与えた (Matt Cutts (mattcutts) on Twitter)

米グーグルのウェブスパム取り締まりチームのトップに就いているマット・カッツ氏が次のようにツイートした

ブログでの動画に加えて、ガイドラインに違反するリンクネットワークにはウェブスパムチームも(手動で)対策し続けると想定しておいたほうが身のためだ。

事実、PageRankを転送する有料のリンク販売ネットワークの数千のサイトに対して、今日の早い時間に対応した。

数か月後に予定している10個ほどの検索アルゴリズムの更新について、動画でマット・カッツ氏は説明していた。そのなかには、次世代のペンギンアップデートやリンクスパム検出力の向上といった、不正なリンクに対抗するものが含まれている。

これらはアルゴリズムによって自動で働く。だがマット・カッツは自動でリンクスパムに対抗するだけでなく、ウェブスパムチームの人間が手動でも対抗すると警告したのだ。

そして実際に人間の手によって処置を下したことも明かしている。

グーグルが、ロシアのリンクネットワークを一網打尽に封じ込めたことが以前にもあった。これ以前にもいくつかのリンクネットワークを対象に粛清を実行したことがある。日本も例外ではなく、2年ほど前だったろうか、あるSEO団体が会員向けに提供していた人工リンクのためのサテライトサイト群が、片っぱしからインデックス削除された事件が起きたていた。

リンク販売業者が組織的に作り上げているリンクネットワークは、遅かれ早かれ必ずグーグルに見つかると肝に銘じておかなければならない。「安全な有料リンク」など絶対に存在しない。リンク販売業者の甘い言葉には決して乗らないように注意してほしい。

いらないページには404と301のどちらが適しているのか
★★★★☆ 基準はシンプル (HRF SEO Forum)

下のような質問がHigh Rankings フォーラムに投稿された。

情報が古くなってしまっているうえに、内容的にもあまりよくないコンテンツのページがある。

インデックスされているけれど検索トラフィックはない。

必要のないページなので、なくしたい。

301リダイレクトすべきか、それとも単純に削除して404を返すべきだろうか。

判断基準はシンプルだ。以下のように考えるといいだろう。

  • 301リダイレクトを使うべき場合

    内容が(ほぼ)同じページがある場合は、301リダイレクトを使う。

    もし元のページがユーザーにブックマークされていたり、ほかのページからリンクされていたりしたとしても、対応するページに自動的に転送できる。

    また検索エンジンには、URLが恒久的に変わったことを伝えられる。結果として、元のページの評価を転送先ページに引き継いでもらえる(もっとも質問者のケースでは、元のページにたいした評価が与えられているとは思えないが)。

    注意してほしいのは、対応するページがないとしても、トップページに301リダイレクトするのはダメだ。予期せずトップページにアクセスしてしまったユーザーは、戸惑うだろう。内容が違うページに301リダイレクトすることを、検索エンジンは好まない。数が多いと、301リダイレクトの乱用として疑われるかもしれない。

  • 404エラーを使うべき場合

    そのページがもはや不要で、代わりになるページがないときは、ページを削除して404のHTTPステータスコードを返す状態にする。

    404は「Not Found」を表し、ページが見つからなかったことを示すために本来使われるが、グーグルはページがなくなったと基本的に解釈してくれる。ページが完全になくなったことをはっきりと伝えたいなら410を返してもいい。

    ユーザーに対しては、ページが見つからなかったというエラーメッセージを単に返すよりも、トップページと主要なカテゴリへのリンク、検索ボックスなどを設置したカスタム404ページを準備しておくと親切だ。

覚えのないサイトリンクが表示された理由はナント
★★★☆☆ サービス提供業者による隠しリンク (Google Webmaster Help Forum)

検索結果に表示されるサイトリンクに、見慣れないリンクが出ている。なぜだろうか。

あるウェブ担当者がグーグルの公式ヘルプフォーラムで理由を尋ねた。

グーグル社員のジョン・ミューラー氏が調べてみたところ、原因はフッターにある“隠し”リンクだった。

質問者のサイトは、無料のホームページサービスを利用していたようだ。このサービス提供業者はSEOサービスもやっていたらしく、被リンクを集めるために、利用者のサイトに強制的にリンクを埋め込んでいたのだろう。人間には見えないが検索エンジンには見えるリンクが、サイトリンクに選ばれたのだ。

利用規約に書かれているのであればチェックせずにサービスを利用したほうにも責任があるのだが、無料サービスを使う際にはこういった嬉しくない影響があるかもしれないことも承知しておくべきだろう。

自社や有料の顧客のサイトへのリンクが仕込んである無料のアクセス解析サービスがあることも、SEOの業界では広く知られている。

グーグルのインデックス日時とキャッシュ日時は違う
★★★☆☆ 元グーグル社員が教えてくれたTIPS (Pedro Dias on Google+)

ブラジルのグーグルのサーチクオリティチームで以前働いていたペドロ・ディアス氏が、Google+で次のようなTIPSを投稿した。

グーグルのインデックスにおいては、キャッシュを取得した日付は、最後にクロールした日付を必ずしも反映しているとは限らない。

キャッシュ日時

グーグルのキャッシュを見ると取得日時が出ている。この日付は、グーグルが最後にクロールした時とは限らないという意味だ。

だが、ここに表示される日時は、最後にGooglebotが訪問した日時だ(キャッシュを更新しようがしまいが)。グーグルがこの仕様に変更したのは、かなり以前だ。

この事実を筆者が伝えたところ、ディアス氏は現在もそうなっているのかはっきりしないし、インデックスされているページとキャッシュが異なるケースが、実際に数多くあると返答した。

これは確かにそのとおりだ。

グーグルがインデックスしている、言い換えると検索順位を決めるために利用するインデックスのデータとキャッシュ表示に使うデータは、必ずしも同期しているとは限らない。キャッシュとして保存されている情報は、インデックスされている情報よりも古いことがありえる。

キャッシュの取得日時が、Googlebotが最後にクロールした日時なのかどうかは不明だ。グーグルのなかの人に聞く機会があれば質問してみようと思う。

SEO JapanSEO Japanの
掲載記事からピックアップ

被リンクの評価方法の将来予測と、現在と未来のSEOを考察した記事を今週はピックアップ。

ページ

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

インデックス
検索エンジンがWebページをデータベースに保存しているデータベース。データベース ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]