うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!【SEO情報まとめ】

「グーグルは最初の15MBしかインデックスしない」という情報が、多くの不安や疑問を呼んだ。この仕様に関する詳細をグーグルが公開しているので、読んで安心してほしい
よろしければこちらもご覧ください

「グーグルは最初の15MBしかインデックスしない」という情報が、多くの不安や疑問を呼んだ。この仕様に関する詳細をグーグルが公開しているので、読んで安心してほしい。

今回は小粒なネタが多いが、ほかにも「title・descriptionの文字数」「内部リンクの本数」「リンクのnofollow比率」などなど、幅広いトピックであなたのSEO知識を伸ばす情報をお届けする(個人的には2ページ目最初の「SEOとCMS」も好きなトピックだ)。

  • titleタグとmeta descriptionタグは最大何文字?
  • 内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
  • 2つのサイトマップに同じURLを記載するとまずい?
  • nofollowリンクと通常リンクの理想的な比率とは?
  • グーグル検索SEOに強いCMSはどれか?
  • 動画のインデックス状況がつぶさにわかるレポートがSCに導入へ
  • 共有IPアドレスのサイトはSEOに弱いのか?
  • GA4に直帰率が復活! ただしUAの直帰率とは違う
  • 2022年7月第1回のオフィスアワー: 特定地域の情報を検索結果に表示させたい、別々のURLのMFI移行、インスタグラムSEOなど
  • Googleの脅威!? 若者はレストランを探すときに検索もマップも使わない、ビジュアルなTikTokとInstagramで見つける
  • 検索ランキングアップデート履歴の一覧ページをGoogleが公開
※次回お休みのおしらせ: このコーナーは隔週更新のため、本来ならば次回の更新は8月12日ですが、お盆のためお休みさせていただき、その1週間後の8月19日から更新再開の予定です。

今週のピックアップ

うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!
テキスト処理の制限、大多数のサイトには影響なし (グーグル検索セントラル ブログ) 国内情報

Googlebotに関する技術ドキュメントに次のような説明が最近追加された。

Googlebot は、HTML ファイルまたはサポートされているテキストベース ファイルの最初の 15 MB の部分をクロールできます。HTML で参照されるリソース(画像、動画、CSS、JavaScript など)は個別に取得されます。ファイルが最初の 15 MB を超過すると、Googlebot はクロールを停止し、ファイルの最初の 15 MB のみをインデックス登録の対象とします。ファイルサイズの上限は、非圧縮データに適用されます。他のクローラでは制限が異なる場合があります。

※強調は編集部による

新しい仕様ではない。以前からこうだったことをドキュメントに明文化しただけだ。しかし、この仕様について多くの質問と誤解が出てきたため、グーグルはブログであらためて解説した。

次の6つの質問に対して回答している:

  • この 15 MB の上限にはどのような影響がありますか?
  • 15 MB を超過するとコンテンツはどうなりますか?
  • 15 MB の上限が適用されるコンテンツ タイプを教えてください。
  • Googlebot が画像または動画を認識できないということですか?
  • データ URI は HTML のファイルサイズに加算されますか?
  • ページのサイズを確認するにはどうすればよいですか?

グーグルのドキュメントを見る前に、「画像とか動画とか入れたら、ページの総サイズで15MBなんてあっという間に超過してしまう!」と焦る人もいるかもしれない。しかし心配ない。この15MB制限は(基本的に)HTMLのサイズが対象だ。そのため、影響を受けるサイトはごくごくわずかだ。

  • 15MB制限の対象となる ―― 最初にリクエストしたコンテンツ(一般的にはHTMLドキュメント)
  • 15MB制限の対象とならない ―― ページに埋め込んでいる画像、動画、JavaScript、CSSなど

1ページのHTMLファイルだけで15MBを超えるようなページは非常に少ない。HTTPArchiveのデータを参照すると、HTMLドキュメントのバイト数の中央値は次のようになっている(この記事を書いている時点での最新データ)。

  • PC 向けページ ―― 31.1 KB
  • モバイル向けページ ―― 29.6 KB

15MB(約15,360KB)にはほど遠い。

おそらく15MB制限はPDF、Word、Excel、PowerPointといった巨大になりがちなドキュメントを主な対象としていると考えるのが適切だろう。

ということで、通常のWebページを公開している場合には、実質的には気にかける必要がない仕様だと言える(そもそも、新しい仕様ではなくグーグルはずっとこの15MB制限でやってきていたのだから!)。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

グーグル検索SEO情報①

titleタグとmeta descriptionタグは最大何文字?
制限なし (John Mueller on Twitter) 海外情報

titleタグとmeta descriptionタグの文字数に制限はあるのだろうか?

こんな疑問を抱いたことがある人は多いかもしれない。titleタグは検索結果のタイトルリンクに最もよく使われる要素だし、meta descriptionタグは検索結果のスニペットに使われる場合がある要素だ。

こうした疑問に、グーグルのジョン・ミューラー氏は次のように回答している:

制限は存在しない。

titleタグのテキストやmeta descriptionタグのcontent属性に指定できる文字数の制限は、HTML5の仕様にはない。仕様上は、好きなだけ長くしていい。ミューラー氏の回答も、これに沿っている。

とはいえ、ミューラー氏の回答は、質問者が知りたかったことではないだろう。「HTML5の仕様」と「グーグルの処理」は同一ではない。実際、検索結果のタイトルリンクとスニペットにはおおよその表示文字数制限がある。

この制限は、たとえばデスクトップ検索において日本語の場合、タイトル30文字弱・スニペット80文字弱といったところで、この文字数を超えると検索結果で省略表示される(実際の制限はテキストが含む文字種によって異なる)。

また、元のtitleタグが長すぎると、検索結果ではグーグルが修正したタイトルで表示される原因になる。元のmeta descriptionが長い場合も、利用されたとしても一部分だけになるだろう(そもそも、meta descriptionが必ずしもスニペットに利用されるとは限らない)。

HTML5の仕様として文字数の制限はなくても、titleタグとmeta descriptionタグは検索結果に表示されたときの見え方も考慮に入れて設定するのがいい。

実際の検索結果を定期的に観察していれば、表示文字数の制限が変わったときにも気づけていいだろう(頻繁ではないがそれなりに変わっている)。

★★★☆☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
リンク数はサイトの評価を測る指標ではない (John Mueller on Twitter) 海外情報

内部リンクの情報を正確に詳細に調べるにはどうすればいいのだろうか?

Search Consoleで確認できる内部リンクレポートのデータ精度に関してあれこれ質問してきたサイト管理者に、グーグルのジョン・ミューラー氏が次のようにコメントした:

リンクを数える客観的な方法はない。内部リンクレポートについては、技術ドキュメントを参照してほしい。

リンクの本数を気にしてはいけない ―― どのツールがレポートするものであれ。リンクを正しく計測する“正しい”方法は存在しない。解釈の仕方はさまざまだ。

リンクは、それ自体が何かの指標であると考えるのではなく、人々がサイト(やコンテンツ)に到達する手段として考えるべきだ。どんなツールが提示するリンクであっても、その本数はランキング要因ではない。

SEOにおいてリンクは重要で、外部リンクであっても内部リンクであっても、ランキングに影響を与えうる要素であることは確かだ。しかし、単純に本数が多ければ評価が上がるというものではない

そもそも、ミューラー氏が繰り返し指摘するように本数を正確に測る方法はない。内部リンクであれば(サードパーティ製の)ツールを使ってそれなりに実数に近い本数を取得できるかもしれない。しかし、そうして内部リンクの本数が明確になったとしても、

  • サイト全体の共通フッターからのリンク
  • 詳細に解説しているコンテンツ内部からのリンク

をどちらも1本と数えることに意味があるとは思えない。やはり数が多ければいいというものでもない。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

2つのサイトマップに同じURLを記載するとまずい?
問題なし、ただし一貫性を保つこと (Google SEO office-hours) 海外情報

同じURLを2つのサイトマップに記載して、片方のサイトマップではhreflangのアノテーションを登録し、もう片方のサイトマップでは普通にURLを登録するとしたら、検索に悪い影響が出ますか?

英語版のオフィスアワーに投稿された質問だ。グーグルのジョン・ミューラー氏によればまったく問題ないとのことである。hreflang用のサイトマップと通常のサイトマップを別々に送信し、同一のURLを両方のサイトマップに記載するのはよくある構成だそうだ。

これはhreflangに限らない。どんなURLであっても、同じURLを複数のサイトマップに記載していいし、それがクロールやインデックス、ランキングにマイナスに影響することはない(もっともプラスに働くこともない)。

ただし一貫性を保たなければならないとミューラー氏は注意を促している。たとえば、次のような状況をイメージしてほしい:

  • 同じURLなのに、片方のサイトマップではドイツ語のページだとhreflangで指定していて、別のサイトマップではフランス語のページだとhreflangで指定している

  • 同じURLなのに、片方のサイトマップでは20年前に更新したとlastmodで指定しているのに、別のサイトマップでは5分前に更新したとlastmodで指定している

こんなサイトマップが送信されると、グーグルはどちらのサイトマップの情報を利用すべきか混乱してしまう。しまいには、hreflangやlastmodを完全に無視してしまうかもしれない。

同じURLを複数のサイトマップに記載することに問題はないが、一貫性を保つことが重要だ。

★★★☆☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

nofollowリンクと通常リンクの理想的な比率とは?
そんなものはない (Reddit) 海外情報

  • nofollow を付けたリンク
  • nofollowなしの通常のリンク

この2種類のリンクの理想的な比率を教えてほしい

こんな質問が、Reddit(レディット)のSEO掲示板に投稿された。

グーグルのジョン・ミューラー氏は(「51:52」と冗談を書き込んでから)シンプルにこう答えた:

理想的な比率なんて存在しない。

リンクの本数を気にする人はたくさん見てきたが、「nofollowリンクと通常リンクの比率」を気にする人は初めて見た気がする。もちろんグーグルは、そんな比率を気にしていない。だからあなたも、「必要ならばnofollowを使い、不要ならばnofollowをつけない」ただそれだけでいい。

rel="nofollow"(とその派生である、rel="sponsored"rel="ugc")に関しては、技術ドキュメントに説明がある。

★★☆☆☆
  • ホントにSEOを極めたい人だけ
グーグル検索SEO情報②
  • グーグル検索SEOに強いCMSはどれか?
  • 動画のインデックス状況がつぶさにわかるレポートがSCに導入へ
  • 共有IPアドレスのサイトはSEOに弱いのか?
  • GA4に直帰率が復活! ただしUAの直帰率とは違う
  • 2022年7月第1回のオフィスアワー: 特定地域の情報を検索結果に表示させたい、別々のURLのMFI移行、インスタグラムSEOなど
海外SEO情報ブログの掲載記事から
  • Googleの脅威!? 若者はレストランを探すときに検索もマップも使わない、ビジュアルなTikTokとInstagramで見つける
  • 検索ランキングアップデート履歴の一覧ページをGoogleが公開

グーグル検索SEO情報②

グーグル検索SEOに強いCMSはどれか?
評価に差はない、手作りページでも上位表示は可能 (#AskGooglebot on YouTube) 海外情報

CMSの選択は上位表示に重要ですか?

この質問にグーグルのジョン・ミューラー氏が動画で回答した:

大前提として、私が知る限りでは、グーグルの検索システムは、特定のCMSを特別扱いするようには見ていない。グーグルにとって、CMSはウェブページを作成する一手段にすぎない。そのため、

  • ページがどのように作成されたのか
    → グーグルのシステムは重視しない
  • ページが最終的にどんな内容(つくり)になっているか
    → グーグルのシステムは重視する

となる。つまり、

  • 手作りのウェブページ
  • WordPressで生成されたウェブページ
  • Wixで生成されたウェブページ
  • Squarespaceで生成されたウェブページ

いずれも同等に「最終的にクロールしてインデックスする内容」を評価する。

私が言えるのは、次のことだ:

主流のCMSはすべて、検索でうまくいくページを作成できる

大部分においてSEOは魔法ではない。SEOは文書化されているし、たくさんの検証ツールがある。すべてのCMS提供会社は自分たちが選んだSEO機能を実装している。

すべてのウェブページが異なっているのと同じように、CMSのシステムによって多少の違いはあるが、独創的なしくみで検索でうまくいくか、わずかな設定やプラグインでチューニングできる

一言で言えば、特定のCMSが検索で有利ということはない。ミューラー氏が例に挙げたWordPressなどの代表的なCMSは近年では、サイト管理者が自分でやらなくてもSEOに適した構成をデフォルトで最初から備えているようになっている。そのため、「○○はSEOに強い」というアピールあるいはユーザーの声を目にすることがあるかもしれない。

だからといって、それはグーグルが特定のCMSを高く評価しているということでは決してない。各CMS会社(やテーマ作成者、プラグイン作成者)がSEOに適した構成を手軽に構成できる仕組みを提供してくれているため、結果としてSEOをうまくやりやすくなっているのだ。

CMSを使わずに手作りしたウェブページでも上位表示は可能だ(が、技術的な側面に関しては本当にSEOに精通している必要があるだろう)。

そういう意味では、モダンで代表的なCMSを利用することは「検索エンジンが理解しやすいウェブページを、専門知識がなくても作成しやすくなる」ことにつながり、良いコンテンツを作れば結果としてSEOがうまくいく可能性が高まるとも言える(もちろん、適切ではないプラグインやテーマによってSEOに不利な作りになってしまうこともあるのだが)。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

動画のインデックス状況がつぶさにわかるレポートがSCに導入へ
URL検査ツールも動画インデックスをサポート (グーグル検索セントラル ブログ) 国内情報

動画のインデックス登録という新しいレポートがSearch Consoleに追加された。動画のインデックス登録レポートは、検出した動画に関する次のような情報を提供する:

  • Google が動画を検出したページ数はどれだけか?
  • 正常にインデックス登録された動画はどれか?
  • 動画のインデックス登録を妨げている問題は何か?

さらに、URL 検査ツールが拡張された。動画のインデックス状況の検査に対応した。

動画インデックスレポートとURL検査ツールの動画サポートにより、動画が検索結果でどのように表示されるかを把握でき、問題の特定と修正が容易になる。重要なコンテンツとして動画を公開しているサイトでは非常に有用だ。レポートの見方と使い方の詳細はヘルプ記事で確認できる。

なお、これらの新しいツールは今後数か月かけて段階的に展開していく。したがって、あなたのSearch Consoleではまだ利用できないかもしれない。楽しみに待とう。

★★★★★
  • 動画が重要コンテンツのすべてのWeb担当者 必見!

共有IPアドレスのサイトはSEOに弱いのか?
そんなことはまったくない (John Mueller on Twitter) 海外情報

共有IPアドレスでも検索においては問題ないか?

この質問に、グーグルのジョン・ミューラー氏が答えた:

共有IPアドレスを使っても問題ない。火を見るよりも明らかだ。

専用IPアドレスを使うからといってSEOで有利になることはない。

ウェブの大半のサイトは同じIPアドレスが割り振られたサーバーで公開されている。ウェブで当たり前に使われている仕組みなのに、そうしたサイトの評価を下げるのは理にかなっていない。

たくさんのサイトを収納しているサーバーにあるサイトであろうが、専用のサーバーを使っているサイトであろうが、ユーザーには関係ない。ユーザーが欲しているのは、

  • 求めているものを提供してくれるコンテンツ
  • そのコンテンツに触れる前後も含めた体験(快適さ)

なのだから。

また検索エンジンはIPアドレスではなくドメイン名でサイトを識別する。したがって複数のサイトに同じIPアドレスが割り当てられていても、クロールやインデックスに不都合が生じることは通常ない(そうでなければ、だれもCDNを利用したくなくなるだろう)。

★★★☆☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

GA4に直帰率が復活! ただしUAの直帰率とは違う
エンゲージメントが発生しなかったセッション率 (Analytics Help) 海外情報

GA4(Google アナリティクス 4)では消滅したはずの直帰率の指標が再導入されるのではないかという憶測があったが、現実になった。直帰率の記載が、Googleアナリティクスの7月11日付けリリースに出ていた。

とはいえ同じ「直帰率(Bounce rate)」という名称でも、UA(ユニバーサル アナリティクス)とGA4では異なる指標になっているようだ(こちらも予想どおりだが)。

ごく簡潔に説明するとUAとGA4の直帰率は次のような指標だ:

  • UAの直帰率 ―― 1 ページだけの閲覧のセッションのパーセンテージ(もう少し正確には、「インタラクション」イベントが発生しなかったセッション)

  • GA4の直帰率 ―― エンゲージメントが発生しなかったセッションのパーセンテージ(「エンゲージメント セッション」は、10 秒を超えて継続したセッション、コンバージョン イベントが発生したセッション、または 2 回以上のページビューやスクリーン ビューが発生したセッションなど)

簡単に言えば、GA4の直帰率はエンゲージメント率の逆の指標だ(直帰率 = 1 - エンゲージメント率)。GA4の直帰率は、データ探索とカスタムレポートで利用できる。

GA4とUAの直帰率の違いについてはこちらの記事が詳しい。よりきちんと理解した人は読むといい。

★★★★☆
  • アクセス解析担当者に伝えましょう

2022年7月第1回のオフィスアワー: 特定地域の情報を検索結果に表示させたい、別々のURLのMFI移行、インスタグラムSEOなど
今回から月2回開催に (Google ポリシー オフィスアワー on YouTube) 国内情報

2022年7月のオフィスアワーをグーグルの金谷氏と小川氏が開催した。両氏が回答した質問は次のとおりだ:

検索関連の質問
  • 特定地域の情報を検索結果表示させたい(1:43)
  • 店舗公式ホームページが検索結果表示されない(8:02)
  • Search Console インデックスクローラの表記(12:29)
  • 別々の URL の MFI 移行(14:14)
  • クローラの信用性と MFI 移行の確認方法(15:50)
  • XML サイトマップ送信と WebSub を併用(18:08)
  • インデックス可能なページで noindex 検出(19:22)
  • インスタグラムでの SEO(21:57)
パブリッシャーポリシー関連の質問
  • アドセンスでの不正クリックの報告(27:12)
  • 同一の IP アドレスからの広告クリック(31:07)

再生時間のリンクをクリック/タップするとその場面から再生できる。興味がある質問の回答だけを知りたいときに利用してほしい。

通しで視聴したい人のために動画を埋め込んでおく。

なお、7月からオフィスアワーは収録時間が短くなった。従来のだいたい半分だ。その代わり、月1回の開催が月2回に増えた。疑問があれば、フォームから質問を投稿しておくといい。現在はグーグル検索に加えて、AdSenseとAdMob、Googleアド マネージャーのポリシーに関する質問も扱っている。

★★★★☆
  • SEOがんばってる人用(ふつうの人は気にしなくていい)

海外SEO情報ブログの
掲載記事からピックアップ

グーグルを脅かすソーシャルメディアと、グーグルアップデートの一覧サイトについての記事をピックアップ。

この記事の筆者

鈴木 謙一(すずき けんいち)

「海外SEO情報ブログ」の運営者。株式会社Faber Companyの取締役Search Advocate(サーチ・アドボケイト)。

海外SEO情報ブログは、SEOに特化した日本ではもっとも有名なSEO系ブログの1つ。米国発の最新のSEO情報を中心に、コンバージョン率アップやユーザーエクスペリエンス最適化のための施策も取り上げている。

正しいSEOをウェブ担当者に習得してもらうために、ブログでの情報発信に加えて所属先のFaber Companyでは、セミナー講師や講演スピーカーを主たる役割にしている。

テーマ別カテゴリ: