NAVERまとめや楽天市場に大打撃か? 同一サイトのページが検索結果に出すぎないようにグーグルがアルゴリズムを変更予定
海外のSEO/SEM情報を日本語でピックアップ
NAVERまとめや楽天市場に大打撃か? 同一サイトのページが検索結果に出すぎないようにグーグルがアルゴリズムを変更予定
多様性を取るか1つに絞るかバランスが難しい (Google Webmaster Help on YouTube)
米グーグルのマット・カッツ氏は、検索結果での多様性を優先させる方向でアルゴリズムを間もなく変更することを、明らかにした。
具体的には、同じドメイン名のサイトからの複数のページが、検索結果で今よりも少なくなるという調整だ。検索ユーザーは、さまざまなサイトから選ばれたページを検索結果で目にすることになるはずだ。
検索結果の多様性(Diversity)に関しては、グーグルはバランス取りに苦労してきている。
多様性を持たせるためにさまざまなサイトのページを提示したいという判断と、1つのサイトから複数のページを提示したほうが、ユーザーにとって利便性が高い場合もあるという判断があるからだ。
多様性を取るか1つに絞るか、これまでに何度か仕様を変えてきた経緯がある。
現状では、検索結果の1ページ目では多様性を優先し、同じドメイン名からのページはなるべく出ないようにしている。しかし2ページ目以降では、適切だと判断すれば、同じドメイン名のサイトであっても複数のページが同時に出現することがある。
しかし2ページ目以降であっても、10件表示される検索結果のうちのほとんどが、1つないしは2つのサイトのページに専有されてしまい、不満に感じるユーザーが、依然として少なからず存在していたことも事実である。
そこで今後は、1つのドメイン名のサイトからいくつかのページがまとめて表示されたら、それ以降の検索結果ページにはそのドメイン名のページが出にくくするように調整を加えることになった。
いくつ出てきたらその後は出にくくなるかに関しては、マット・カッツ氏は「4つ」という例を挙げているものの、特定の数字があるわけではないと思われる。検索クエリやそのクエリに関連性のあるページを持つサイトの数や状態によって変化するはずだ。
いずれにしても検索結果の何ページ目であろうと、同一サイトのページで検索結果が埋め尽くされることは、これからはなくなると期待していいだろう。
楽天市場やNAVERまとめのように、同じまたは類似したトピックのコンテンツが複数あるサイトに何かしらの影響があるかもしれない。
なおこの動画のなかでマット・カッツが説明している検索結果の多様性の変遷や、今回のアルゴリズム変更が及ぼす影響について、渡辺隆広氏が解説している。こちらも参照していただきたい。
「リンク販売業者たち、覚悟せよ」マット・カッツが警告を発す
実際にリンクネットワークに制裁を与えた (Matt Cutts (mattcutts) on Twitter)
米グーグルのウェブスパム取り締まりチームのトップに就いているマット・カッツ氏が次のようにツイートした
In addition to mattcutts.com/blog/what-to-e… it's safe to assume webspam will continue to tackle link networks that violate our guidelines as well.
— Matt Cuttsさん (@mattcutts) 2013年5月15日
ブログでの動画に加えて、ガイドラインに違反するリンクネットワークにはウェブスパムチームも(手動で)対策し続けると想定しておいたほうが身のためだ。
In fact, we took action on several thousand linksellers in a paid-link-that-passes-PageRank network earlier today.
— Matt Cuttsさん (@mattcutts) 2013年5月15日
事実、PageRankを転送する有料のリンク販売ネットワークの数千のサイトに対して、今日の早い時間に対応した。
数か月後に予定している10個ほどの検索アルゴリズムの更新について、動画でマット・カッツ氏は説明していた。そのなかには、次世代のペンギンアップデートやリンクスパム検出力の向上といった、不正なリンクに対抗するものが含まれている。
これらはアルゴリズムによって自動で働く。だがマット・カッツは自動でリンクスパムに対抗するだけでなく、ウェブスパムチームの人間が手動でも対抗すると警告したのだ。
そして実際に人間の手によって処置を下したことも明かしている。
グーグルが、ロシアのリンクネットワークを一網打尽に封じ込めたことが以前にもあった。これ以前にもいくつかのリンクネットワークを対象に粛清を実行したことがある。日本も例外ではなく、2年ほど前だったろうか、あるSEO団体が会員向けに提供していた人工リンクのためのサテライトサイト群が、片っぱしからインデックス削除された事件が起きたていた。
リンク販売業者が組織的に作り上げているリンクネットワークは、遅かれ早かれ必ずグーグルに見つかると肝に銘じておかなければならない。「安全な有料リンク」など絶対に存在しない。リンク販売業者の甘い言葉には決して乗らないように注意してほしい。
いらないページには404と301のどちらが適しているのか
基準はシンプル (HRF SEO Forum)
下のような質問がHigh Rankings フォーラムに投稿された。
情報が古くなってしまっているうえに、内容的にもあまりよくないコンテンツのページがある。
インデックスされているけれど検索トラフィックはない。
必要のないページなので、なくしたい。
301リダイレクトすべきか、それとも単純に削除して404を返すべきだろうか。
判断基準はシンプルだ。以下のように考えるといいだろう。
301リダイレクトを使うべき場合
内容が(ほぼ)同じページがある場合は、301リダイレクトを使う。
もし元のページがユーザーにブックマークされていたり、ほかのページからリンクされていたりしたとしても、対応するページに自動的に転送できる。
また検索エンジンには、URLが恒久的に変わったことを伝えられる。結果として、元のページの評価を転送先ページに引き継いでもらえる(もっとも質問者のケースでは、元のページにたいした評価が与えられているとは思えないが)。
注意してほしいのは、対応するページがないとしても、トップページに301リダイレクトするのはダメだ。予期せずトップページにアクセスしてしまったユーザーは、戸惑うだろう。内容が違うページに301リダイレクトすることを、検索エンジンは好まない。数が多いと、301リダイレクトの乱用として疑われるかもしれない。
404エラーを使うべき場合
そのページがもはや不要で、代わりになるページがないときは、ページを削除して404のHTTPステータスコードを返す状態にする。
404は「Not Found」を表し、ページが見つからなかったことを示すために本来使われるが、グーグルはページがなくなったと基本的に解釈してくれる。ページが完全になくなったことをはっきりと伝えたいなら410を返してもいい。
ユーザーに対しては、ページが見つからなかったというエラーメッセージを単に返すよりも、トップページと主要なカテゴリへのリンク、検索ボックスなどを設置したカスタム404ページを準備しておくと親切だ。
覚えのないサイトリンクが表示された理由はナント
サービス提供業者による隠しリンク (Google Webmaster Help Forum)
検索結果に表示されるサイトリンクに、見慣れないリンクが出ている。なぜだろうか。
あるウェブ担当者がグーグルの公式ヘルプフォーラムで理由を尋ねた。
グーグル社員のジョン・ミューラー氏が調べてみたところ、原因はフッターにある“隠し”リンクだった。
質問者のサイトは、無料のホームページサービスを利用していたようだ。このサービス提供業者はSEOサービスもやっていたらしく、被リンクを集めるために、利用者のサイトに強制的にリンクを埋め込んでいたのだろう。人間には見えないが検索エンジンには見えるリンクが、サイトリンクに選ばれたのだ。
利用規約に書かれているのであればチェックせずにサービスを利用したほうにも責任があるのだが、無料サービスを使う際にはこういった嬉しくない影響があるかもしれないことも承知しておくべきだろう。
自社や有料の顧客のサイトへのリンクが仕込んである無料のアクセス解析サービスがあることも、SEOの業界では広く知られている。
グーグルのインデックス日時とキャッシュ日時は違う
元グーグル社員が教えてくれたTIPS (Pedro Dias on Google+)
ブラジルのグーグルのサーチクオリティチームで以前働いていたペドロ・ディアス氏が、Google+で次のようなTIPSを投稿した。
グーグルのインデックスにおいては、キャッシュを取得した日付は、最後にクロールした日付を必ずしも反映しているとは限らない。
グーグルのキャッシュを見ると取得日時が出ている。この日付は、グーグルが最後にクロールした時とは限らないという意味だ。
だが、ここに表示される日時は、最後にGooglebotが訪問した日時だ(キャッシュを更新しようがしまいが)。グーグルがこの仕様に変更したのは、かなり以前だ。
この事実を筆者が伝えたところ、ディアス氏は現在もそうなっているのかはっきりしないし、インデックスされているページとキャッシュが異なるケースが、実際に数多くあると返答した。
これは確かにそのとおりだ。
グーグルがインデックスしている、言い換えると検索順位を決めるために利用するインデックスのデータとキャッシュ表示に使うデータは、必ずしも同期しているとは限らない。キャッシュとして保存されている情報は、インデックスされている情報よりも古いことがありえる。
キャッシュの取得日時が、Googlebotが最後にクロールした日時なのかどうかは不明だ。グーグルのなかの人に聞く機会があれば質問してみようと思う。
SEO Japanの
掲載記事からピックアップ
被リンクの評価方法の将来予測と、現在と未来のSEOを考察した記事を今週はピックアップ。
- リンクは永遠に不滅です
リンクは今後も重要だけれどそれだけでは不十分 - 「SEOは終わった」のではなく、進化した
EOの未来を5分で理解
ソーシャルもやってます!