うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!【SEO情報まとめ】
「グーグルは最初の15MBしかインデックスしない」という情報が、多くの不安や疑問を呼んだ。この仕様に関する詳細をグーグルが公開しているので、読んで安心してほしい。
今回は小粒なネタが多いが、ほかにも「title・descriptionの文字数」「内部リンクの本数」「リンクのnofollow比率」などなど、幅広いトピックであなたのSEO知識を伸ばす情報をお届けする(個人的には2ページ目最初の「SEOとCMS」も好きなトピックだ)。
- titleタグとmeta descriptionタグは最大何文字?
- 内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
- 2つのサイトマップに同じURLを記載するとまずい?
- nofollowリンクと通常リンクの理想的な比率とは?
- グーグル検索SEOに強いCMSはどれか?
- 動画のインデックス状況がつぶさにわかるレポートがSCに導入へ
- 共有IPアドレスのサイトはSEOに弱いのか?
- GA4に直帰率が復活! ただしUAの直帰率とは違う
- 2022年7月第1回のオフィスアワー: 特定地域の情報を検索結果に表示させたい、別々のURLのMFI移行、インスタグラムSEOなど
- Googleの脅威!? 若者はレストランを探すときに検索もマップも使わない、ビジュアルなTikTokとInstagramで見つける
- 検索ランキングアップデート履歴の一覧ページをGoogleが公開
今週のピックアップ
うちのサイトは大丈夫? Googlebotは15MBまでしかインデックスしないって!
テキスト処理の制限、大多数のサイトには影響なし (グーグル検索セントラル ブログ) 国内情報
Googlebotに関する技術ドキュメントに次のような説明が最近追加された。
Googlebot は、HTML ファイルまたはサポートされているテキストベース ファイルの最初の 15 MB の部分をクロールできます。HTML で参照されるリソース(画像、動画、CSS、JavaScript など)は個別に取得されます。ファイルが最初の 15 MB を超過すると、Googlebot はクロールを停止し、ファイルの最初の 15 MB のみをインデックス登録の対象とします。ファイルサイズの上限は、非圧縮データに適用されます。他のクローラでは制限が異なる場合があります。
新しい仕様ではない。以前からこうだったことをドキュメントに明文化しただけだ。しかし、この仕様について多くの質問と誤解が出てきたため、グーグルはブログであらためて解説した。
次の6つの質問に対して回答している:
- この 15 MB の上限にはどのような影響がありますか?
- 15 MB を超過するとコンテンツはどうなりますか?
- 15 MB の上限が適用されるコンテンツ タイプを教えてください。
- Googlebot が画像または動画を認識できないということですか?
- データ URI は HTML のファイルサイズに加算されますか?
- ページのサイズを確認するにはどうすればよいですか?
グーグルのドキュメントを見る前に、「画像とか動画とか入れたら、ページの総サイズで15MBなんてあっという間に超過してしまう!」と焦る人もいるかもしれない。しかし心配ない。この15MB制限は(基本的に)HTMLのサイズが対象だ。そのため、影響を受けるサイトはごくごくわずかだ。
- 15MB制限の対象となる ―― 最初にリクエストしたコンテンツ(一般的にはHTMLドキュメント)
- 15MB制限の対象とならない ―― ページに埋め込んでいる画像、動画、JavaScript、CSSなど
1ページのHTMLファイルだけで15MBを超えるようなページは非常に少ない。HTTPArchiveのデータを参照すると、HTMLドキュメントのバイト数の中央値は次のようになっている(この記事を書いている時点での最新データ)。
- PC 向けページ ―― 31.1 KB
- モバイル向けページ ―― 29.6 KB
15MB(約15,360KB)にはほど遠い。
おそらく15MB制限はPDF、Word、Excel、PowerPointといった巨大になりがちなドキュメントを主な対象としていると考えるのが適切だろう。
ということで、通常のWebページを公開している場合には、実質的には気にかける必要がない仕様だと言える(そもそも、新しい仕様ではなくグーグルはずっとこの15MB制限でやってきていたのだから!)。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
グーグル検索SEO情報①
titleタグとmeta descriptionタグは最大何文字?
制限なし (John Mueller on Twitter) 海外情報
title
タグとmeta description
タグの文字数に制限はあるのだろうか?
こんな疑問を抱いたことがある人は多いかもしれない。title
タグは検索結果のタイトルリンクに最もよく使われる要素だし、meta description
タグは検索結果のスニペットに使われる場合がある要素だ。
こうした疑問に、グーグルのジョン・ミューラー氏は次のように回答している:
制限は存在しない。
title
タグのテキストやmeta description
タグのcontent属性に指定できる文字数の制限は、HTML5の仕様にはない。仕様上は、好きなだけ長くしていい。ミューラー氏の回答も、これに沿っている。
とはいえ、ミューラー氏の回答は、質問者が知りたかったことではないだろう。「HTML5の仕様」と「グーグルの処理」は同一ではない。実際、検索結果のタイトルリンクとスニペットにはおおよその表示文字数制限がある。
この制限は、たとえばデスクトップ検索において日本語の場合、タイトル30文字弱・スニペット80文字弱といったところで、この文字数を超えると検索結果で省略表示される(実際の制限はテキストが含む文字種によって異なる)。
また、元のtitle
タグが長すぎると、検索結果ではグーグルが修正したタイトルで表示される原因になる。元のmeta description
が長い場合も、利用されたとしても一部分だけになるだろう(そもそも、meta description
が必ずしもスニペットに利用されるとは限らない)。
HTML5の仕様として文字数の制限はなくても、title
タグとmeta description
タグは検索結果に表示されたときの見え方も考慮に入れて設定するのがいい。
実際の検索結果を定期的に観察していれば、表示文字数の制限が変わったときにも気づけていいだろう(頻繁ではないがそれなりに変わっている)。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
内部リンクの件数を正確に知りたい! ⇒方法なし、調べる意味なし
リンク数はサイトの評価を測る指標ではない (John Mueller on Twitter) 海外情報
内部リンクの情報を正確に詳細に調べるにはどうすればいいのだろうか?
Search Consoleで確認できる内部リンクレポートのデータ精度に関してあれこれ質問してきたサイト管理者に、グーグルのジョン・ミューラー氏が次のようにコメントした:
リンクを数える客観的な方法はない。内部リンクレポートについては、技術ドキュメントを参照してほしい。
リンクの本数を気にしてはいけない ―― どのツールがレポートするものであれ。リンクを正しく計測する“正しい”方法は存在しない。解釈の仕方はさまざまだ。
リンクは、それ自体が何かの指標であると考えるのではなく、人々がサイト(やコンテンツ)に到達する手段として考えるべきだ。どんなツールが提示するリンクであっても、その本数はランキング要因ではない。
There is no objective way to count links. As for that report, check out the docs :)
— 🫧 johnmu of switzerland (personal) 🫧 (@JohnMu) July 22, 2022
Don't focus on the number of links any particular tool shows -- there is no "correct" way to count links, interpretations vary wildly. Think of links as a way that people can reach your site, not as a metric of its own. The number of links any tool shows is not a ranking factor.
— 🫧 johnmu of switzerland (personal) 🫧 (@JohnMu) July 22, 2022
SEOにおいてリンクは重要で、外部リンクであっても内部リンクであっても、ランキングに影響を与えうる要素であることは確かだ。しかし、単純に本数が多ければ評価が上がるというものではない。
そもそも、ミューラー氏が繰り返し指摘するように本数を正確に測る方法はない。内部リンクであれば(サードパーティ製の)ツールを使ってそれなりに実数に近い本数を取得できるかもしれない。しかし、そうして内部リンクの本数が明確になったとしても、
- サイト全体の共通フッターからのリンク
- 詳細に解説しているコンテンツ内部からのリンク
をどちらも1本と数えることに意味があるとは思えない。やはり数が多ければいいというものでもない。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
2つのサイトマップに同じURLを記載するとまずい?
問題なし、ただし一貫性を保つこと (Google SEO office-hours) 海外情報
同じURLを2つのサイトマップに記載して、片方のサイトマップではhreflangのアノテーションを登録し、もう片方のサイトマップでは普通にURLを登録するとしたら、検索に悪い影響が出ますか?
英語版のオフィスアワーに投稿された質問だ。グーグルのジョン・ミューラー氏によればまったく問題ないとのことである。hreflang用のサイトマップと通常のサイトマップを別々に送信し、同一のURLを両方のサイトマップに記載するのはよくある構成だそうだ。
これはhreflangに限らない。どんなURLであっても、同じURLを複数のサイトマップに記載していいし、それがクロールやインデックス、ランキングにマイナスに影響することはない(もっともプラスに働くこともない)。
ただし一貫性を保たなければならないとミューラー氏は注意を促している。たとえば、次のような状況をイメージしてほしい:
同じURLなのに、片方のサイトマップではドイツ語のページだとhreflangで指定していて、別のサイトマップではフランス語のページだとhreflangで指定している
同じURLなのに、片方のサイトマップでは20年前に更新したとlastmodで指定しているのに、別のサイトマップでは5分前に更新したとlastmodで指定している
こんなサイトマップが送信されると、グーグルはどちらのサイトマップの情報を利用すべきか混乱してしまう。しまいには、hreflangやlastmodを完全に無視してしまうかもしれない。
同じURLを複数のサイトマップに記載することに問題はないが、一貫性を保つことが重要だ。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
nofollowリンクと通常リンクの理想的な比率とは?
そんなものはない (Reddit) 海外情報
nofollow
を付けたリンクnofollow
なしの通常のリンクこの2種類のリンクの理想的な比率を教えてほしい
こんな質問が、Reddit(レディット)のSEO掲示板に投稿された。
グーグルのジョン・ミューラー氏は(「51:52」と冗談を書き込んでから)シンプルにこう答えた:
理想的な比率なんて存在しない。
リンクの本数を気にする人はたくさん見てきたが、「nofollowリンクと通常リンクの比率」を気にする人は初めて見た気がする。もちろんグーグルは、そんな比率を気にしていない。だからあなたも、「必要ならばnofollowを使い、不要ならばnofollowをつけない」ただそれだけでいい。
rel="nofollow"
(とその派生である、rel="sponsored"
とrel="ugc"
)に関しては、技術ドキュメントに説明がある。
- ホントにSEOを極めたい人だけ
ソーシャルもやってます!