国内&海外SEO情報ウォッチ 「海外SEO情報ブログ」の鈴木 謙一氏が、日本と海外の検索マーケティング情報をさらっとまとめて毎週金曜日にお届け。
海外&国内SEO情報ウォッチ

うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!【SEO情報まとめ】

「グーグルは最初の15MBしかインデックスしない」という情報が、多くの不安や疑問を呼んだ。この仕様に関する詳細をグーグルが公開しているので、読んで安心してほしい

ページ

「グーグルは最初の15MBしかインデックスしない」という情報が、多くの不安や疑問を呼んだ。この仕様に関する詳細をグーグルが公開しているので、読んで安心してほしい。

今回は小粒なネタが多いが、ほかにも「title・descriptionの文字数」「内部リンクの本数」「リンクのnofollow比率」などなど、幅広いトピックであなたのSEO知識を伸ばす情報をお届けする(個人的には2ページ目最初の「SEOとCMS」も好きなトピックだ)。

  • titleタグとmeta descriptionタグは最大何文字?
  • 内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
  • 2つのサイトマップに同じURLを記載するとまずい?
  • nofollowリンクと通常リンクの理想的な比率とは?
  • グーグル検索SEOに強いCMSはどれか?
  • 動画のインデックス状況がつぶさにわかるレポートがSCに導入へ
  • 共有IPアドレスのサイトはSEOに弱いのか?
  • GA4に直帰率が復活! ただしUAの直帰率とは違う
  • 2022年7月第1回のオフィスアワー: 特定地域の情報を検索結果に表示させたい、別々のURLのMFI移行、インスタグラムSEOなど
  • Googleの脅威!? 若者はレストランを探すときに検索もマップも使わない、ビジュアルなTikTokとInstagramで見つける
  • 検索ランキングアップデート履歴の一覧ページをGoogleが公開
※次回お休みのおしらせ: このコーナーは隔週更新のため、本来ならば次回の更新は8月12日ですが、お盆のためお休みさせていただき、その1週間後の8月19日から更新再開の予定です。

今週のピックアップ

うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!
テキスト処理の制限、大多数のサイトには影響なし (グーグル検索セントラル ブログ) 国内情報

Googlebotに関する技術ドキュメントに次のような説明が最近追加された。

Googlebot は、HTML ファイルまたはサポートされているテキストベース ファイルの最初の 15 MB の部分をクロールできます。HTML で参照されるリソース(画像、動画、CSS、JavaScript など)は個別に取得されます。ファイルが最初の 15 MB を超過すると、Googlebot はクロールを停止し、ファイルの最初の 15 MB のみをインデックス登録の対象とします。ファイルサイズの上限は、非圧縮データに適用されます。他のクローラでは制限が異なる場合があります。

※強調は編集部による

新しい仕様ではない。以前からこうだったことをドキュメントに明文化しただけだ。しかし、この仕様について多くの質問と誤解が出てきたため、グーグルはブログであらためて解説した。

次の6つの質問に対して回答している:

  • この 15 MB の上限にはどのような影響がありますか?
  • 15 MB を超過するとコンテンツはどうなりますか?
  • 15 MB の上限が適用されるコンテンツ タイプを教えてください。
  • Googlebot が画像または動画を認識できないということですか?
  • データ URI は HTML のファイルサイズに加算されますか?
  • ページのサイズを確認するにはどうすればよいですか?

グーグルのドキュメントを見る前に、「画像とか動画とか入れたら、ページの総サイズで15MBなんてあっという間に超過してしまう!」と焦る人もいるかもしれない。しかし心配ない。この15MB制限は(基本的に)HTMLのサイズが対象だ。そのため、影響を受けるサイトはごくごくわずかだ。

  • 15MB制限の対象となる ―― 最初にリクエストしたコンテンツ(一般的にはHTMLドキュメント)
  • 15MB制限の対象とならない ―― ページに埋め込んでいる画像、動画、JavaScript、CSSなど

1ページのHTMLファイルだけで15MBを超えるようなページは非常に少ない。HTTPArchiveのデータを参照すると、HTMLドキュメントのバイト数の中央値は次のようになっている(この記事を書いている時点での最新データ)。

  • PC 向けページ ―― 31.1 KB
  • モバイル向けページ ―― 29.6 KB

15MB(約15,360KB)にはほど遠い。

おそらく15MB制限はPDF、Word、Excel、PowerPointといった巨大になりがちなドキュメントを主な対象としていると考えるのが適切だろう。

ということで、通常のWebページを公開している場合には、実質的には気にかける必要がない仕様だと言える(そもそも、新しい仕様ではなくグーグルはずっとこの15MB制限でやってきていたのだから!)。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

グーグル検索SEO情報①

titleタグとmeta descriptionタグは最大何文字?
制限なし (John Mueller on Twitter) 海外情報

titleタグとmeta descriptionタグの文字数に制限はあるのだろうか?

こんな疑問を抱いたことがある人は多いかもしれない。titleタグは検索結果のタイトルリンクに最もよく使われる要素だし、meta descriptionタグは検索結果のスニペットに使われる場合がある要素だ。

こうした疑問に、グーグルのジョン・ミューラー氏は次のように回答している:

制限は存在しない。

titleタグのテキストやmeta descriptionタグのcontent属性に指定できる文字数の制限は、HTML5の仕様にはない。仕様上は、好きなだけ長くしていい。ミューラー氏の回答も、これに沿っている。

とはいえ、ミューラー氏の回答は、質問者が知りたかったことではないだろう。「HTML5の仕様」と「グーグルの処理」は同一ではない。実際、検索結果のタイトルリンクとスニペットにはおおよその表示文字数制限がある。

この制限は、たとえばデスクトップ検索において日本語の場合、タイトル30文字弱・スニペット80文字弱といったところで、この文字数を超えると検索結果で省略表示される(実際の制限はテキストが含む文字種によって異なる)。

また、元のtitleタグが長すぎると、検索結果ではグーグルが修正したタイトルで表示される原因になる。元のmeta descriptionが長い場合も、利用されたとしても一部分だけになるだろう(そもそも、meta descriptionが必ずしもスニペットに利用されるとは限らない)。

HTML5の仕様として文字数の制限はなくても、titleタグとmeta descriptionタグは検索結果に表示されたときの見え方も考慮に入れて設定するのがいい。

実際の検索結果を定期的に観察していれば、表示文字数の制限が変わったときにも気づけていいだろう(頻繁ではないがそれなりに変わっている)。

★★★☆☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
リンク数はサイトの評価を測る指標ではない (John Mueller on Twitter) 海外情報

内部リンクの情報を正確に詳細に調べるにはどうすればいいのだろうか?

Search Consoleで確認できる内部リンクレポートのデータ精度に関してあれこれ質問してきたサイト管理者に、グーグルのジョン・ミューラー氏が次のようにコメントした:

リンクを数える客観的な方法はない。内部リンクレポートについては、技術ドキュメントを参照してほしい。

リンクの本数を気にしてはいけない ―― どのツールがレポートするものであれ。リンクを正しく計測する“正しい”方法は存在しない。解釈の仕方はさまざまだ。

リンクは、それ自体が何かの指標であると考えるのではなく、人々がサイト(やコンテンツ)に到達する手段として考えるべきだ。どんなツールが提示するリンクであっても、その本数はランキング要因ではない。

SEOにおいてリンクは重要で、外部リンクであっても内部リンクであっても、ランキングに影響を与えうる要素であることは確かだ。しかし、単純に本数が多ければ評価が上がるというものではない

そもそも、ミューラー氏が繰り返し指摘するように本数を正確に測る方法はない。内部リンクであれば(サードパーティ製の)ツールを使ってそれなりに実数に近い本数を取得できるかもしれない。しかし、そうして内部リンクの本数が明確になったとしても、

  • サイト全体の共通フッターからのリンク
  • 詳細に解説しているコンテンツ内部からのリンク

をどちらも1本と数えることに意味があるとは思えない。やはり数が多ければいいというものでもない。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

2つのサイトマップに同じURLを記載するとまずい?
問題なし、ただし一貫性を保つこと (Google SEO office-hours) 海外情報

同じURLを2つのサイトマップに記載して、片方のサイトマップではhreflangのアノテーションを登録し、もう片方のサイトマップでは普通にURLを登録するとしたら、検索に悪い影響が出ますか?

英語版のオフィスアワーに投稿された質問だ。グーグルのジョン・ミューラー氏によればまったく問題ないとのことである。hreflang用のサイトマップと通常のサイトマップを別々に送信し、同一のURLを両方のサイトマップに記載するのはよくある構成だそうだ。

これはhreflangに限らない。どんなURLであっても、同じURLを複数のサイトマップに記載していいし、それがクロールやインデックス、ランキングにマイナスに影響することはない(もっともプラスに働くこともない)。

ただし一貫性を保たなければならないとミューラー氏は注意を促している。たとえば、次のような状況をイメージしてほしい:

  • 同じURLなのに、片方のサイトマップではドイツ語のページだとhreflangで指定していて、別のサイトマップではフランス語のページだとhreflangで指定している

  • 同じURLなのに、片方のサイトマップでは20年前に更新したとlastmodで指定しているのに、別のサイトマップでは5分前に更新したとlastmodで指定している

こんなサイトマップが送信されると、グーグルはどちらのサイトマップの情報を利用すべきか混乱してしまう。しまいには、hreflangやlastmodを完全に無視してしまうかもしれない。

同じURLを複数のサイトマップに記載することに問題はないが、一貫性を保つことが重要だ。

★★★☆☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

nofollowリンクと通常リンクの理想的な比率とは?
そんなものはない (Reddit) 海外情報

  • nofollow を付けたリンク
  • nofollowなしの通常のリンク

この2種類のリンクの理想的な比率を教えてほしい

こんな質問が、Reddit(レディット)のSEO掲示板に投稿された。

グーグルのジョン・ミューラー氏は(「51:52」と冗談を書き込んでから)シンプルにこう答えた:

理想的な比率なんて存在しない。

リンクの本数を気にする人はたくさん見てきたが、「nofollowリンクと通常リンクの比率」を気にする人は初めて見た気がする。もちろんグーグルは、そんな比率を気にしていない。だからあなたも、「必要ならばnofollowを使い、不要ならばnofollowをつけない」ただそれだけでいい。

rel="nofollow"(とその派生である、rel="sponsored"rel="ugc")に関しては、技術ドキュメントに説明がある。

★★☆☆☆
  • ホントにSEOを極めたい人だけ
用語集
CSS / Googlebot / Googleアナリティクス / HTML / Instagram / JavaScript / SEO / UA / meta description / nofollow / アクセス解析 / インデックス / クロール / コンバージョン / スニペット / セッション / ソーシャルメディア / ドメイン名 / ページビュー / リンク / 外部リンク / 検索エンジン / 直帰率

ページ

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

RFP
RFP(Request for Proposal)は「提案依頼書」のこと。SIe ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]