Googlebotがクロールするファイルサイズ上限の仕組みを正しく理解しておこう
グーグル検索SEO情報②
Googlebotがクロールするファイルサイズ上限の仕組みを正しく理解しておこう
ウェブ検索Googlebotは2MB上限の裏側 (グーグル 検索セントラル ブログ) 国内情報
「ウェブ検索向けのGooglebotがクロールするHTMLファイルの上限が2MB」であることが、技術ドキュメントで明確化された(これ自体は2か月ほど前に取り上げたトピックだ)。従来は15MBが上限だと説明していたのだが、仕様変更があったわけではない。以前から2MB上限だったのだが、ドキュメントが正確な情報を提供していなかったため、一部に混乱を生じさせていた。
そこでグーグルのクローラーの仕組みを、検索セントラルブログがあらためて解説した。
主要ポイントをまとめる。
Googlebotのアーキテクチャ
- グーグルは、集中型クロールプラットフォームを運用している。
- Googlebotは、そのクロールプラットフォームで動くプログラムの1つ
- ほかにも複数のプロダクトがそのクロールプラットフォームを利用している
- プロダクトによってクローラー名は異なるが、その本体であるクロールプラットフォーム(インフラ)は共通
フェッチ上限
グーグルの集中型クロールプラットフォームを利用するクローラーは、フェッチ(取得)するデータサイズの上限を定めている:
- HTML: URLごとに最大2MB
- PDF: 最大64MB
- ファビコン: 非常に小さいサイズ上限
- 画像と動画: 取得するデータの種類に応じた適切なサイズ上限
フェッチ上限を指定せずにクロールプラットフォームを利用する場合、最大15MBのデフォルト値となる。
注意点として、データサイズの計算ではコンテンツデータだけでなくHTTPヘッダー(リクエストヘッダー・レスポンスヘッダー)を含んで計算することがある。
ちなみに、サイズ上限を超えてもフェッチはエラーにならない。単純に、上限を超えた部分はクロール・レンダリング・インデックスされないだけだ。
ウェブ検索向けのGooglebotとレンダリング(WRS)
ウェブ検索向けのGooglebotのサイズ上限は2MB。つまり、最初の2MBのみを取得し、それ以降のコンテンツは完全に無視する。
そのうえで、Googlebotはレンダリングシステム(WRS)にデータを引き渡す。
WRSはモダンブラウザと同様にJavaScriptを実行し、最終的なDOMを構築するのだが、次のような特徴をもつ:
- レンダリング対象は、フェッチ済みのバイト(上限内)のみ
- HTMLから参照している外部リソース(画像、JS、CSSなど)があれば、個別にフェッチする。サイズ上限はリソースのURLごとに適用される
- クロールがURLごとであるのと同様に、レンダリングもURLごとに実行する。ローカルストレージやセッションストレージは、URLが変わるごとにクリアし、保持しない
SEOへの影響をふまえたベストプラクティス
こうした技術的な説明をふまえて、元記事では「バイトレベルのベストプラクティス」として次のようなものを紹介している:
- HTMLを軽量に保つ
- 大きなCSS、JSは外部ファイルに移動する
- 次のような重要な要素はできるだけ早い位置に配置する:
<title>- メタタグ
- canonical
- 構造化データ
- インラインの大容量アセット(例:base64画像)は、重要なコンテンツを2MB超に押し出すリスクがあるので注意して使う
- クロール頻度の低下を防ぐため、サーバーパフォーマンスを監視する
クロールはリソースのバイト上限によっても制約される。確実にインデックスされるためには、重要なコンテンツを早い位置、かつ最初の2MB以内に配置しなければならない。
とはいえ、前回も触れたように大多数のサイトでHTMLが2MBを超えることはない。ブラウザのデベロッパーツールでファイルサイズを調べる方法も教えたが、こちらのツールを使えば簡単にHTMLサイズを計測できる。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
Googlebot系クローラーのIP範囲ファイルのURLが変わったので注意
事情がない限り新しい場所を指定するように (グーグル 検索セントラル ブログ) 国内情報
グーグルのクローラー・フェッチャーのIPアドレス範囲を記載するJSONファイルリストのURLが変更された。
これは、「Google のクローラーとフェッチャーからのリクエストを確認する」のドキュメントで示されているものだ。
次のようなルールでURLが変わっている:
- 旧:
https://developers.google.com/search/apis/ipranges/ - 新:
https://developers.google.com/crawling/ipranges/
以前に「タイプ:一般的なクローラー」として示していた「googlebot.json」は、ファイル名部分も「common-crawlers.json」に変わっているので注意してほしい:
- 旧:
https://developers.google.com/search/apis/ipranges/googlebot.json - 新:
https://developers.google.com/crawling/ipranges/common-crawlers.json
現在は古いURLでも正しいデータのJSONファイルが返る。しかし、6か月以内に古い場所を段階的に廃止し、新しい場所にリダイレクトするとのことだ。
また、それまでの間でも、古いURLにアクセスすると「新しいURLを使うように指示する内容のJSONファイルが返る」状態が時折発生するという。これは、特にリダイレクトに対応していないシステムの管理者に「URLが変わったこと」を認識してもらうために、意図的に「壊れた状態」にしているのだということだ。
グーグルクローラーのIPアドレスを取得するツールやシステムを使用している場合は、早めに新しいパスに変更しておくといいだろう。
- クローラーIPアドレスを取得しているすべてのWeb担当者 必見!
- 技術がわかる人に伝えましょう
【ローカルSEOのバイブル】グーグル公式GBP最適化ガイド×4業種
GBP最適化のためのベストプラクティス (Lisa Landsman on LinkedIn) 海外情報
グーグルビジネスプロフィール(GBP)のエバンジェリストであるリサ・ランズマン氏が、GBPの最適化ガイドブックを4業種向けに公開した。GBPを最適化し、露出とエンゲージメント、コンバージョンを向上させるためのベストプラクティスをまとめたものだ。
次の4業種の最適化ガイドブックが手に入る:
どんな内容かをイメージしやすくするために、レストラン・カフェの最適化ガイドブックから重要ポイントを紹介しておこう。
プロフィールの完成度がパフォーマンスを左右する
- 完成度の高いプロフィールにすると、クリック数が最大7倍、表示回数が最大5倍になる
- ビジネスのプロフィールを詳細に記載すると、顧客が購入を検討する可能性が29%高まる
- ビジネス情報(名称・カテゴリ・営業時間)を正確に記載することは、視認性と信頼性の基盤となる
ビジネス情報の最適化
- メインカテゴリを1つ、サブカテゴリを最大9つ(合計10件)設定する
- 祝日や特別営業時間を含め、営業時間を常に最新の状態に保つ
- 明確で魅力的な説明文を記載する(必要に応じてAIを活用)
- 96%の顧客は、「営業時間を表示しているビジネスを訪問する」可能性が高い
メニューはコンバージョンの核となる要素
- 84%のユーザーが、新しいレストランを選ぶ前にオンラインでメニューを確認する
- レストランの最終決定の43%は、メニューを見た後に行われる
- 40%の人が、食べものを検索する時点ですでに食べたい料理を決めている
- 写真・価格・説明・アレルギー情報などを含む高品質な構造化メニューを掲載すると、エンゲージメントと発見性が高くなる
- 写真付きのメニュー項目はクリック率が32%高く、82%の人が料理の見た目をもとに注文を決める
ビジュアルコンテンツがエンゲージメントを高める
- 写真を掲載しているビジネスは、掲載していないビジネスに比べて、グーグルマップでのルート検索が42%多く、ウェブサイトへのクリック数が35%多い
- 90%の人が、「グーグル検索やマップに写真があるビジネスを訪問する」可能性が高い
- 質の高いビジュアルは、ブランドイメージを伝え、来店意欲に影響を与える
クチコミが信頼を築き、選択を左右する
- 91%の消費者が、地元のビジネスを評価する際にクチコミを参考にする
- 65%の消費者は、クチコミに返信しているビジネスを選ぶ可能性が高い
- 肯定的・否定的なクチコミの両方に返信することで、顧客ロイヤルティが高まり、顧客を大切にしている姿勢が伝わる
アクティブなエンゲージメント機能
投稿でオファーやイベント、最新情報を発信し、即時行動を促す。62%の来店客は期間限定オファーによって来店意欲が高まり、50%が検索時にプロモーションを探し、48%が特別オファーによって再来店する意欲が増すと回答している
メッセージ機能(WhatsApp/SMS)は顧客ニーズに応える。67%がビジネスへの連絡手段として電話やメールよりメッセージを好み、60%が最も好むチャットプラットフォームとしてWhatsAppを挙げている
ソーシャルリンクはクロスプラットフォームのエンゲージメントを拡大する。20%の顧客が、ビジネスを訪問する前にソーシャルメディアを確認する
コンバージョンの実現
- 「予約」や「注文」のリンクを追加し、需要を直接取り込む
- 米国の消費者の80%が、レストランに対して「オンラインでテーブル予約や注文ができること」を期待している
属性とアクセシビリティの情報
- 「ペット同伴可」「Wi-Fi完備」「テラス席あり」「車椅子対応」などの特徴を明示することで、検索での関連性が高まり、顧客が自分のニーズに合うビジネスをすぐに見つけやすくなる
継続的な管理とガバナンス
- プロフィールのオーナー確認は、デジタルストアフロントを管理するための必須の第一歩である
- スタッフ交代によるアクセス喪失を防ぐため、複数の管理者を設定し、アクセス権限を定期的に監査する
- オーナーシップは移転可能だが、プライマリオーナーは常に1名のみ
- 問題解決には、「ヘルプセンター」「AIヘルプガイド」「お問い合わせフォーム」「ヘルプコミュニティ」を活用する
ほかの3業種の最適化ガイドブックに関しては、AIを利用するなどしてご自身で学んでほしい。
- ローカルSEOに取り組むすべてのWeb担当者 必見!
ローカルSEOエキスパートがこっそり教える、ほとんど知られていないGBP最適化の秘策×6
知る人ぞ知る施策 (Whitespark on YouTube) 海外情報
1つ前では、GBP最適化のためのグーグル公式ガイドブックを紹介した。ここでは、「あまり活用されていない6つの高度なGBP戦略」を紹介する。ローカルSEOエキスパートのダレン・ショー氏がYouTubeで共有したものだ。
次のような内容を、動画で解説してくれている。操作の手順も動画内で具体的に示しているので、以下の説明を見て「どうやるの?」とイメージできない場合は動画を確認してほしい。
写真へのテキスト追加と動画のアップロード:
グーグルのAIは、抽象的な写真のコンテキストを把握するのが苦手だ(例:会議中の人々)。そこで、画像に説明テキストを直接重ねて表示することでコンテキストを補う。
また、動画のアップロードも効果的。グーグルマップの検索結果では動画が自動再生され、ユーザーの注目を集められる
多言語への対応:
観光地や多言語地域にビジネスがある場合は、Googleマップ上で表示言語を切り替えた状態でビジネス名の翻訳版を追加する。これにより、検索ユーザーの母国語でビジネスが表示されるようになる
ソーシャルメディア プロフィールの連携:
インスタグラムやTikTokなどのソーシャルメディア アカウントをGBPの設定で連携させる。グーグルは現在、連携されたソーシャルメディア プロフィールからリアルタイムのコンテンツやスニペットをローカル検索結果に直接表示するようになっている
サブリースオフィスでリーチを拡大:
ローカル検索は近接性に大きく依存している。サービスエリアビジネスは、登録住所から遠い都市では上位表示が難しい。新しいエリアで順位を上げるには、そのエリアに安価な正規のサブリースオフィスを借り、新たなGBPを設けるといい
ただし、バーチャルオフィスや私書箱は使用しないこと。また、サービスエリアが重複しないようにするのも大切だ。
プライマリカテゴリのシーズン変更:
「プライマリカテゴリ」はローカル検索における最重要のランキング要因である。季節性のあるサービスを提供するビジネス(例: 夏は造園で、冬は除雪)ならば、季節の変わり目にプライマリカテゴリを更新し、その時期のサービスで上位表示を狙う必要がある
- 投稿の最大活用:
マルチメディアの活用: 1枚の画像だけの投稿はやめる。複数の写真や動画を1つのグーグル投稿にドラッグ&ドロップして、より魅力的なコンテンツにする
顧客として投稿する: 個人のグーグルアカウントを使って、自分のビジネスプロフィールに動画や更新情報を投稿する。これにより「顧客からの最新情報」セクションが表示され、プロフィール上でより多くの貴重なスペースを確保できる
“知る人ぞ知る”施策ばかりだ。ローカル検索での露出とエンゲージメント、検索順位を向上させるために利用してみたい。
- ローカルSEOがんばってる人用(ふつうの人は気にしなくていい)
グーグル、スパム アップデートとコア アップデートを連続リリース
いつものアップデート内容 (Google Search Central on LinkedIn) 海外情報
グーグルは、2026年3月のスパム アップデートと2026年3月のコア アップデートを立て続けにリリースした。
スパム アップデートは2026年3月24日(太平洋時間)に展開が始まり、1日かからずに完了した。一方コア アップデートは、3日後の2026年3月27日(同時間)に展開が始まり、まだ継続中だ。最長で2週間程度を見込んでいる。
スパム アップデートもコア アップデートも、内容は通常のアップデートのようだ。アナウンスでは、特に普段と変わったことには触れていない。
本日(2026年3月24日)、グーグル検索に対して2026年3月のスパム アップデートをリリースしました。
これは通常のスパム アップデートであり、すべての言語と地域を対象に展開されます。展開が完了するまで数日かかる場合があります。スパム アップデートの詳細については、https://lnkd.in/gshkDEU3 をご参照ください。
展開が完了次第、ランキングリリース履歴ページを更新します:https://lnkd.in/eYHy_9hF
本日(2026年3月27日)、2026年3月のコア アップデートをグーグル検索にリリースしました。
これは、あらゆる種類のサイトから検索者にとって関連性が高く満足度の高いコンテンツをより適切に表示するための定期的なアップデートです。ロールアウトが完了するまでに最長2週間かかる場合があります。
ロールアウトが完了次第、ランキングリリース履歴ページを更新します: https://lnkd.in/ebyUgyiv
もしアップデートの影響を受けた可能性が疑われるようであれば、公式ガイダンスを参照してほしい(もっとも、スパム アップデートの影響を受けるようなサイトの管理者はこのコラムの読者にはいないと信じているが)。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
コア アップデートの展開はどうして完了までに数週間もかかるのか?
広範囲にわたるので段階的に進行する (John Mueller on Bluesky) 海外情報
2026年3月のコア アップデートの例に漏れず、コア アップデートの展開を完了するのに2週間〜3週間かかるのが通常だ。なぜこのくらいの時間がかかるのだろうか?
グーグルのジョン・ミューラー氏は次のように説明している:
通常、コア アップデートの「段階」については公表していない。これは検索アルゴリズムとシステムに対する大規模で広範な変更であるため、「すべてを一度に」ではなく、「段階的に」進めなければならないことがあるからだ(完全に反映されるまで時間がかかることがあるのも、そのため)。
要するに、単一の「コア アップデート マシン」のスイッチがONにされるわけではなく(すべてのアップデートが同じ流れというわけではなく)、各チームが取り組んできた内容に基づいて変更を行っており、どのシステムやコンポーネントが対象なのかは、アップデートによって異なることがある。
コア ランキングシステムは「単一のコンポーネント」ではなく、「多数のランキングシステム」で構成されている。グーグルが公表するコア アップデートでは、コア ランキングシステムが広範囲にわたって更新される。コア ランキングシステムを構成するコンポーネントであっても、1つとか2つのような小規模であればアップデートしても公表しない(それでも、目立つランキング変動を起こすことがあるが)。
公表されるコア アップデートは広範囲にわたるので、段階的に更新が進むのだ。「えいっ!」と一発で終わらせるわけではない。
- ホントにSEOを極めたい人だけ
海外SEO情報ブログの
掲載記事からピックアップ
AI検索に関連する新情報を2件ピックアップ。
- Google、AI OverviewからAI Modeへのシームレス遷移をPC検索でもテスト開始
モバイルでは導入済み
- SEOがんばってる人用(ふつうの人は気にしなくていい)
- BingウェブマスターツールのAI Performanceにグラウンディングクエリと引用ページのマッピングレポートが追加される
Bing WMTも利用してAI検索最適化
- SEOがんばってる人用(ふつうの人は気にしなくていい)
