「新R25」がSEO業界で類をみない英断! コンテンツシンジケーションのあるべき姿とは?【SEO記事13本まとめ】
他サイトから記事提供を受けているメディアでは、rel="canonical"をどう設定するべきか? 頭ではわかっていてもオトナの事情で実行できない「あるべき姿」とは。
ほかにも、検索順位に対する「パーソナライズ」の影響度、Search ConsoleのURLパラメータ設定の注意点、SEOでHTML文法の正しさよりも大切なこと、モバイル検索で「待ち時間」「メニュー」の検索が増加傾向などなど、SEOに役立つ情報を今週もまとめてお届けする。
今週のピックアップ
「新R25」がSEO業界で類をみない英断! コンテンツシンジケーションのあるべき姿とは?
配信元にrel="canonical"で正規化 (サイバーエージェントSEO情報ブログ) 国内情報
「新R25」は、サイバーエージェントのグループ会社が運営しているメディアサイトだが、自社で制作するコンテンツに加えて、他社のサイトからも記事提供を受けてサイトに掲載している。ウェブ業界では「シンジケーション(Syndication)」と呼ばれる「記事配信」「記事提供」の仕組みだ。
新R25は、他サイトから提供を受けているコンテンツに関しては、オリジナル記事のURLを指定したrel="canonical"を「新R25」サイト上のHTMLに設定するという英断を下した。この動きについて、サイバーエージェントの木村氏が解説している。
その内容については元記事を見ていただくとして、ここで「英断」という言葉を使ったのには意味がある。
コンテンツシンジケーションでは、通常はまったく同じ記事を配信している。そのためシンジケーションは理論的には複製コンテンツである。提供元と配信先で何らかの合意・契約があるとはいえ、検索エンジンの観点からは(ドメイン名をまたがった)重複コンテンツと大差ない。
もちろん、グーグルの検索結果に表示されるのが提供元であるオリジナルの記事ならば、何も問題にはならない。
しかし、配信を受けた側の記事(掲載させてもらっているほうの記事、悪い言い方をすれば「コピー記事」)が検索結果で上位に表示されてしまうことも、しばしば起こる。たとえば、配信先であるヤフーニュースの記事ページが、提供元である新聞社サイトのオリジナル記事ページよりも検索上位に表示されてしまうという状況だ。
そうなった場合、提供元からすれば、そのコンテンツを作って最初に公開したのは自分たちなのに、検索トラフィックを配信先に奪われてしまうことになる。納得がいかない部分があるだろう。
解決方法はいくつかあるが、最も確実で推奨されるのは、配信先側のサイトでrel="canonical"を使ってオリジナル記事のURLに正規化することだ。そうすれば、検索エンジンの評価はオリジナル記事に統合される。配信先の記事が検索結果に出てくることは(特別なことがない限り)なくなる。
それこそが、今回「新R25」が行ったことだ。
コンテンツのシンジケーションを受けている場合、配信先のサイトでは、rel="canonical"をオリジナルの記事に向けるべきだ。
このことは、考え方としては議論の余地がない。しかしながら、実際にはほとんど実行されていないのが現実だ。そうすることが正しいと頭では理解していても、配信してもらった側もやはり検索トラフィックが欲しいというビジネス的な事情がひょっとしたら関係しているのかもしれない。配信を扱うくらいだから技術的に難しいことはないはずだ(まさか、手動で記事をコピー&ペーストはしていないだろう)。
だが新R25は、rel="canonical"を提供元に向けて正規化することを決定したのだ。決定しただけではなく、すでに実行している。葛藤があったに違いないが、決定から実行に至るプロセスは実に速やかだった。
自社の利益だけを考えることなく、検索の世界で本来あるべき姿に方針を変更した新R25の取り組みは、評価に値する。これをきっかけに、同じ流れがシンジケーション利用者間で標準になるといい。
(ちなみに安田編集長によると、Web担では昔からそうするようにしているということだ。たとえばこの記事や、こちら、ほかにもこれなどがそうだ。)
- シンジケーションを利用しているすべてのWeb担当者 必見!
グーグル検索SEO情報
グーグル検索結果への影響は、「パーソナライズ検索 >>> 場所と言語」
せいぜい1つか2つの順位変化? (Danny Sullivan) 海外情報
グーグル検索の広報役を務めるダニー・サリヴァン氏が次のような情報をツイッターで提供してくれた。
検索結果のパーソナライズはとても軽微だ。同じ言語、同じ場所で検索しているほとんどの人は、同じ検索結果を見るだろう。
検索結果が異なるということに関しては、場所と言語はパーソナライズよりもずっと影響してくる。
FYI, personalization of results is very light. Most people searching in the same language and same location will see largely the same things. Location and language are far more influential about why results differ.
— Danny Sullivan (@dannysullivan) 2018年5月15日
グーグルの検索結果にはパーソナライズ機能がある。検索履歴に基づいて、よく訪問するサイトのページは掲載順位がより上位になることがある。またGoogle+でフォローしているユーザーの投稿が出やすくなることもある(※筆者注: 現在はもう機能していないかもしれない)。
つまりユーザーによって検索結果が異なってくるのだ。
しかしながらサリヴァン氏によれば、パーソナライズによる影響は微々たるものらしい。ほかのユーザーが検索すると10位だったページがあなたの検索結果で1位になったりはしないのだ。経験からすると、せいぜい1つか2つの順位変化ではないだろうか。
一方、検索ユーザーの場所や言語は、検索結果に大きく関わってくる。スマホが普及したこともあり、検索者がいる物理的な場所によって検索結果が大きく変化することは珍しくない。あなたも経験しているはずだ。
言語については、日本語ユーザーには日本語のサイトが優先的に表示されるだろうし、ドイツ語ユーザーにはドイツ語のサイトが優先的に表示される。
厳密には、場所と言語による検索結果の調整はパーソナライズではない。ユーザーが異なったとしても条件が同じであれば同等に適用される。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
Googlebotのレンダリングのタイムアウトをチェックする方法
MFTを使う (John Mueller on Twitter) 海外情報
Googlebotは、ユーザーがブラウザで見るときと同様にJavaScriptを実行してウェブページをレンダリングできる。
しかし、JavaScriptレンダリングの際にタイムアウトが発生するとレンダリングを中止する。これは、回線スピードが遅かったりサーバーの反応が遅かったりという理由で、一定時間が経過しても無応答な状態が続くと発生する。
この状況が発生すると、グーグルはそのページを正しくインデックスできない。
では、レンダリング完了までにどのくらいの時間がたつとタイムアウトしてしまうのだろうか?
グーグルのジョン・ミューラー氏は次のように説明している。
定まった時間というものはない。なぜかというと、キャッシュされたリソースによってレンダリングにかかる時間はまちまちだからだ。
モバイルフレンドリー テスト ツールで入念にチェックするといいだろう。(スクリーンショットに)ページがきちんと表示されていれば、インデックスされるはずだ。
There's no fixed timeout since rendering time can be quite different with cached resources. I'd double-check with the mobile-friendly test; if it works there, it should work for indexing too.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) 2018年5月24日
モバイルフレンドリー テスト ツールでは、テスト結果の表示にスクリーンショットを掲載している。この画像は、Googlebotが実際にレンダリングする機能と同等の仕組みで作成する。
もしGooglebotのレンダリングにタイムアウトが発生するとしたら、ツールの検証も失敗するということだ。
確実なチェック方法だとは言えないが、知っておくと何かのときに役立つかもしれない。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
- 技術がわかる人に伝えましょう
Search ConsoleのURLパラメータ設定はrel="canonical"よりも強し
かなり強い指示として扱われる (Google Webmaster Central office-hours) 海外情報
Search Consoleで指定できる、さまざまなURLパラメータをグーグルがどう扱うかの設定に関して、グーグルのジョン・ミューラー氏は次のように説明した。
robots.txtとは異なり、URLパラメータは「命令」というわけではないが、「かなり強い指示」として扱われる。
たとえば、rel="canonical"で正規化された先のURLが、URLパラメータによってインデックスしないように設定されていたとする。その場合、グーグルはインデックスしない。若干のタイムラグがあるかもしれないが、最終的にはそうなるはずだ。
URLパラメータはrel="canonical"よりも強い指示だ。
rel="canonical"は優先的にインデックスさせるURLを指定する。しかし、アクセスしたURLにパラメータが含まれていて、そのURLパラメータがある場合にはクロールしないように設定されていたら、Googlebotはクロールしない。そのため、(rel="canonical"が記述されていたとしても)インデックスもしなくなる。
rel="canonical"も比較的強いシグナルとしてグーグルは扱うのだが、URLパラメータはそれよりもさらに強いようだ。矛盾した場合にはURLパラメータの設定が優先される。
Search ConsoleでのURLパラメータの設定は、(設定画面にも表示されているように)予期せぬ動作にならないように慎重に構成しよう。少しでも自信がないのであれば、自分で設定するのではなくわかっている人に頼むべきだ。
- ホントにSEOを極めたい人だけ
AMPの質問が盛りだくさん――5月のウェブマスター オフィスアワー
動的レンダリングの質問もさっそく (ウェブマスター オフィスアワー) 国内情報
5月開催のオフィスアワーを紹介する。回答者は前回から2人体制になり、金谷氏とあんな氏だ。今回はAMP関連の質問が多い。Google I/Oで発表があった動的レンダリングについての質問もさっそく出ている。
- AMP:
- 一部ページだけをAMPにした場合のランキングへの影響
- MFI後のカノニカルAMPの評価
- Dirty AMPについて
- キャッシュされないAMPページ
- AMPページのSearch Consoleでのレポート
- 記事タイトルで検索結果に上位表示されない
- 重複コンテンツ
- 構造化データのマークアップの推奨
- Search Consoleの地域別のレポート
- robots.txtのブロックを解除したあとのクロール
- 意図した503エラーをレポートしてほしくない
- 新規ページがインデックスされない
- リダイレクトエラーの通知
- 動的レンダリング
- パラメータ付きURLは不利なのか
まだ視聴していない人のためにYouTubeの録画を埋め込んでおく。
- すべてのWeb担当者 必見!
ソーシャルもやってます!