AI最適化のために、「生成AIで紹介してもらえるページ」にしたい ―― でも、何をどうすればいいの? 大量のページとAI引用を調査して見えてきた「AIに引用されやすい文章のパターン」を紹介する。
今週は、すべて海外情報だ!
AI向け文章パターンのほかにも、「MarkdownでAIO/GEO」「SEOが弱いとAIでも弱い」などのAIネタがおもしろい。
ジョン・ミューラー氏の「インデックス登録リクエストをするのは時代遅れ(意訳)」というコメントとその解説も、いまのグーグルを改めて理解するのに重要だ。
ほかにも、(特にEC向け)クロール問題と対策、Search Consoleの新機能などなど、あなたのSEO力とビジネス力をアップさせる情報を、まとめてお届けする。
- AIに引用されやすい文章パターンとは? 120万件の検索結果と1万8千件の引用で判明したAIの“クセ”
- 「AI向けにMarkdownでコンテンツ配信」は最強のGEO/AIOになるか?
- MarkdownはAIのクロールに影響なし。実験からも明らかに
- SEOで順位ダウンするとAI検索の引用も減る!? SEOプロの分析から明らかに
- グーグルはインデックス登録リクエストを推奨しない。もう時代は変わったのだ!
- クロール問題の根本原因分析と対策
- SCの新機能はどこ行った? まだ使えていないんだが
- 検索トラフィックが減っても読者は増やせる。Atlanticoが証明した「直接訪問」の力
- サイト移行で発生するありがちなトラブル×8
- AIにコンテンツを書かせて問題ないかのシンプルな判断基準
- Google、AI OverviewとAI Modeで引用ページのプレビューを表示開始
- Google、February 2026 Discover Core Update(2026年2月のDiscoverコア アップデート)をリリース
今週のピックアップ
AIに引用されやすい文章パターンとは? 120万件の検索結果と1万8千件の引用で判明したAIの“クセ”
相関関係である点には注意 (Growth Memo) 海外情報
AIがコンテンツを引用する際の明確なパターンが見えてきた。ChatGPTはページの先頭30%にある情報を特に多く引用しており、その分布は「スキーのジャンプ台」のような形を描いていた。
ChatGPTの回答120万件と、実際に引用された18,012件のデータをケルビン・インディグ氏が分析したデータを紹介しよう。
引用されやすいコンテンツには共通点がある。それは、ニュース記事のようにわかりやすく、結論が冒頭にあり、具体的な情報が詰まっているという点だ。
引用される確率を大きく高める特徴は5つある:
- はっきりした断言
- 「質問と回答」の形式
- 具体的な固有名詞の多さ
- バランスの取れた文体
- ビジネス文書のような読みやすさ
これらの結果が示すのは、AIに取り上げてもらいたいコンテンツは、「物語を語るスタイル」で書くのではなく、「要点を整理した報告書」のように書くべきだということである。このスタイルを取り入れることで、AIが生成する回答に自分のコンテンツが引用される可能性が高まると思われる。
分析の詳細は次のとおりだ。
「スキーのジャンプ台」パターン
引用全体の44.2%は、コンテンツの冒頭30%から来ている。
31.1%はコンテンツの中間部分(30%〜70%)から。
24.7%はコンテンツの末尾30%から。フッター直前の「まとめ」や「結論」セクションでは引用が増えるが、ページの一番下(90%〜100%)では急減する。
特に引用されやすいのは、ページ冒頭から20%以内にある段落。
このパターンはデータとして統計的に明確に証明されている(P値0.0)。
AIは、大量のニュース記事や学術論文を学習している。これらは「結論を最初に書く」スタイルが基本なので、AIも自然と冒頭の内容を重視するようになっていると考えられる。伝えたい重要なことは冒頭に書き、大事な情報を記事の後半に隠さないようにする。
※Web担編注 勘違いしてほしくないのは、「冒頭に書いた内容が多く引用される」わけではない点だ。AIが好む文章構造が「冒頭や末尾に結論やポイントが整理して配置されている」ものだと解釈してほしい。
段落の中でどこが引用されるか
引用の53%は段落の「中間の文」から来ている。
段落の最初の文からはわずか24.5%。
段落の最後の文からは22.5%。
AIは段落全体をしっかり読んだうえで、「一番情報量が多い文」を選んで引用する。文の位置よりも、内容の充実度が重要である。
※Web担編注 こちらも「段落のなかで中間におけば引用されやすくなる」と解釈するべきではないだろう。「段落の冒頭や末尾には、ツカミやつなぎの文が来ることが多いため、AIが引用するのは本題である中間の文であることが多い」と解釈するのがよさそうだ。
引用されやすいコンテンツの5つの特徴
1. はっきりした断言
「〜とは〇〇のことだ」「〜を指す」といった明確な定義を含む文は、そうでない文に比べて約2倍引用されやすいとデータが示した(36.2%対20.2%)。
「誰が・何を・どうする」が一文で明確にわかる文章は、AIが一発で答えを見つけやすいため、引用されやすくなる。
まず明確な定義や直接的な結論から書き始める。
2. 「質問と回答」の形式
質問文を含むコンテンツは、含まないものより約2倍引用されやすい傾向がある(18.5%対9.5%)。
質問形式の引用のうち78.4%は見出しに由来している。
AIは「見出しの質問=ユーザーの問い」「直後の段落=その答え」として認識する。
回答の冒頭に見出しと同じキーワードを繰り返すと、さらに効果的だ。
見出しを質問形式にして、その直後に答えを書く構成にする。
3. 固有名詞や具体的な情報の多さ
AIによく引用されるテキストでは、固有名詞などの具体的な情報の割合が20.6%にのぼる(一般的なテキストでは約5%〜8%)。
ブランド名・ツール名・人名などの具体的な言葉は、AIが内容を正確に理解するための「道しるべ」になる。
「あるツール」「一般的な企業」といったぼかした表現を避け、具体的な名前を積極的に使おう。競合他社の名前を出すことも効果的。
4. バランスの取れた文体
主観性のスコア(0.0が完全に客観的、1.0が完全に主観的)でいうと、約0.47が最も引用されていた。
事実だけを淡々と並べた文章も、個人の意見ばかりの文章も、どちらも引用されにくい傾向がある。
AIは、事実に基づきながらも、それを読み解く視点や解説を加えた「専門家の分析」のような文体を好む。
事実の説明に加えて、その背景や意味を解説する文章を組み合わせる。
5. ビジネス文書のような読みやすさ
引用されやすいコンテンツの読みやすさの平均は、大学生レベルに相当するスコアだった。
引用されにくいコンテンツは、それより読み解く力が必要で、研究論文や博士論文レベルのスコアだった。
難しい言葉や長すぎる文章は引用されにくくなる。ただし、これは「簡単に書けばいい」という意味ではない。プロが読んでも納得できる、明確でわかりやすい文体が理想だ。
複雑さよりも明瞭さを優先する。
インディグ氏が分析から導き出した、AIに引用される確率を高めるための施策を簡潔にまとめる。
AIに評価されやすいコンテンツは、物語より「整理された報告書」に近い構成。
冒頭に重要な情報を置くスタイルは、AIだけでなく、忙しい読者にとっても読みやすい。
「徐々に盛り上がる」スタイルの文章はAIとの相性が悪く、「自信がない文章」だと判断されることがある。
AIが評価するのは、難易度を下げることではなく、「わかりやすい構造と正確な情報」。
重要な注意点がある。インディグ氏の分析は相関関係の調査によるものだ。相関関係と因果関係は異なる。「インディグ氏の推奨に従えばAI引用率が向上する」ものではない。
とはいえ、ここで挙げられている文章構造は、いわゆる「パラグラフ・ライティング」相当のものでもある。論理だてられていて、構造化されていて、具体的な記述を含む文章は、人間が理解しやすい文章の作り方だ。
この推奨に従うことは、AI引用とは無関係におすすめしたい。
今回の分析方法の概要は次のとおりだ:
- データセット: 120万件の検索結果、18,012件の位置的引用、11,022件の言語的(「言語的DNA」)分析
- データソース: Gauge(ChatGPTによる約300万件のAI回答と対応する引用、回答時点でスクレイピングされたウェブコンテンツ)
- 引用マッチングは文エンベディング(all-MiniLM-L6-v2)によって行われ、テキストを384次元ベクトルに変換
- 弱いマッチとハルシネーションを除外するための厳格な類似度閾値(コサイン類似度0.55)を設定
- 位置的深度と言語的特性(定義率、エンティティ密度、主観性スコア)を測定
- AI SEOがんばってる人用(ふつうの人は気にしなくていい)
グーグル検索SEO情報①
「AI向けにMarkdownでコンテンツ配信」は最強のGEO/AIOになるか?
グーグルとBingの反応はいかに? (Cloudflare) 海外情報
大手CDNプロバイダーのCloudflare(クラウドフレア)は、通常のHTMLページをMarkdown※(マークダウン)言語に自動変換して、AIクローラーとAIエージェントに向けて配信するサービスを公開した。
#」や「*」などの記号を使って、見出しや箇条書きといった文書構造を素早く作成できる軽量マークアップ言語。代表的な仕様としては、CommonMarkやGitHub Flavored Markdown(GFM)などがある。Markdownページを配信することで、次のような利点をCloudflareは想定している:
トークン使用量の削減 ―― MarkdownはHTMLと比較して少ない文字数で文章構造を表現できるため、内容理解に必要なトークン数を大幅に削減し、AIの処理コストを最大約80%削減する。
効率性の向上 ―― divラッパー、スクリプト、ナビゲーションマークアップなど、意味的な価値を持たない不要なHTML要素を排除する。
明確な構造 ―― AIシステムが解析しやすい、明示的で人間にも読みやすいフォーマットを提供する。
AI出力品質の向上 ―― 構造化されたコンテンツにより、エージェントやモデルの理解度と下流の処理結果が向上する。
計算オーバーヘッドの削減 ―― AIパイプライン内でのHTMLからMarkdownへの繰り返し変換を回避する。
処理の複雑さの軽減 ―― AIシステムのコンテンツ取り込みワークフローを簡素化する。
AIエコシステムとの整合性 ―― MarkdownはエージェントやAIツールの標準フォーマットとして広く採用されている。
コンテンツスキャンの高速化 ―― エージェントが「本質的なコンテンツ」と「非本質的なページ要素」をすばやく選別するのに役立つ。
なかなかスバラシイ。AI検索の最適化に打ってつけに思える。
だが本当にそうなのだろうか?
グーグル「スパム対策、どうするの?」
グーグルのジョン・ミューラー氏は、「Markdownページを別途配信することにどんな価値があるのか」と尋ねられ、次のように返した。
ウェブは雑然としたものであり、ウェブ上のコンテンツを利用するサービスはすべて、機能しないものを除外しなければならない。
もちろん、意図的に悪用しているもの(およびサイト)も除外する必要がある。DA(Domain Authority)のような基本的なSEOツールの指標でさえ、そうした処理をしている。
何を意味しているのか、少しわかりにくいかもしれない。 次のようなことを言いたいのだろう。
「スパム的または操作的な手法でランキングやAIシステムを操作しようとするサイトやページが必ず現れる」ことを前提に、そうした不適切なシグナルを正しく除外するのが、オンラインコンテンツを軸にサービスを提供する場合には必須だ。
もう少し噛み砕いてみよう。
「人間向けのHTMLコンテンツ」と「AI向けのバージョン」を別途提供するスタイルがOKになった場合、SEOをよく知る人間ならば、こんな風に考えるかもしれない:
AI向けMarkdownバージョンは、単にMarkdown化するだけでなく、「人間向けとまったく異なる、AIのエンジンをだます内容」にしてしまえばいいんじゃないか! そうすれば生成AIでの紹介が増えるはずだ!
そうしたスパムとの戦いを続けてきた検索エンジンからすると、単に提供されているからといってMarkdownの内容だけでサイトやページを評価することは、論外だろう(すぐにスパムの温床になってしまう)。行うべきアクションは、次のようなものになるだろう:
- 人間向けの「HTMLページの内容」を取得する
- AI向けの「Markdownの内容」を取得する
- その2種類で内容が食い違っていないかを確認する
HTMLだけならば①だけでよかったのに、別途提供されているMarkdownを利用する場合には②だけでなく①と③が必要になる。システムの処理に最適なMarkdownだったはずが、コストが高くなるだけなのだ。
つまり、Markdownでの配信は無意味だということだ。
Bing「変換ミス、だれが気付いて修正するの?」
マイクロソフトBingのファブリス・キャネル氏は、Markdownページ配信についての次のような見解を述べている。
HTMLページからMarkdownファイルへの変換が部分的に壊れてしまっていた場合、その不具合にどうやって気づくのか? 誰が修正するのか?
AI時代において、我々はHTMLのウェブページを完全に理解しており、標準以下のものは必要ない。
考えてみてほしい。我々はユーザーが実際に目にするものに基づいてランク付けする。クロール可能なAjaxと同様に、実在しないもの、あるいはSEO担当者によって適切に管理されていないものは淘汰されていく!
キャネル氏のコメントも否定的だ。
Cloudflareが訴求するような効果は、残念ながら現時点では期待できないように思う。結局、コンテンツの配信フォーマットの形態ではなく、最終的に核心となる要素は、あくまでもコンテンツの品質、関連性、そして信頼性だ。
もちろん、人間がだれもウェブページを見なくなって、すべての情報をAI経由で得るようになったら、状況はまた違ってくるだろうが……。
- AI SEOがんばってる人用(ふつうの人は気にしなくていい)
MarkdownはAIのクロールに影響なし。実験からも明らかに
優位性は見られず (Profound) 海外情報
AIクローラーにHTMLの代わりにMarkdownを提供すれば、実際にAIボットのトラフィックが増加するのだろうか?
その検証のために、6つのウェブサイトの381ページを対象にしたランダム化比較実験を、Profound(プロファウンド)が実施した。
結論としては、ボットにMarkdown形式で提供されたページのアクセス数は、わずかな増加にとどまった(実験期間は3週間):
ページあたりの中央値でボット訪問数が約1回増加し、平均値では約16%高かったものの、全体として統計的に有意な差は見られなかった。
もっとも多いChatGPT-UserのトラフィックはMarkdownページで全体で一貫して約20%の上昇を示したが、その効果は元々トラフィックの多いページに集中しており、統計的有意性には達しなかった。
調査の詳細は次のとおりだ:
- 全体的な結果:
- Markdownページはボット訪問数の中央値が約1回増加
- 平均トラフィックは約16%高いが、これはトラフィックの多い外れ値によるもの
- 統計的に有意な差なし
- ボットトラフィックの内訳:
- ChatGPT-User: 全ボットトラフィックの約73%(最大勢力)
- Meta/Facebook: 約20%
- OAI-SearchBot: 約4%
- ClaudeBot: 約2%
- GPTBot: 約1%
- ChatGPT-Userのトラフィック:※ChatGPTでユーザーからのリクエストを受けて動くボット
- Markdownで約20%の上昇を確認(全体で一貫した傾向)
- ただし、統計的有意性なし
- 効果はトラフィックの第60パーセンタイル以上に集中
調査結果に対するプロファウンドの解釈は次のとおり:
LLMはすでに数十億のウェブページで学習しており、HTMLの解析能力が非常に高い。
Markdownのクリーンさは現時点では統計的に有意なクロール優位性につながっていない。
データではMarkdownのほうが有利なように見えるが、観測された変動は自然なボットトラフィックのばらつきを反映している可能性がある。実験前の期間(1月13日〜18日)でも平均上昇率が+12%あり、優位性に見える変化はノイズである可能性が示唆される。
調査結果を踏まえて、プロファウンドは次のように結論づけている:
MarkdownはAIボットトラフィックを増やす特効薬ではない。フォーマットの切り替えではなく、コンテンツの品質・クロール可能性・構造・アクセシビリティを優先すべきである。
2026年後半にも改めて実験する予定で、結果が変わった場合は公表するとのことだ。
今回の調査概要は次のとおり:
- 調査設計: 6サイト、381ページを対象としたランダム化比較実験
- 189ページ:ボットには標準HTMLを提供
- 192ページ:ボットにはクリーンなMarkdownを提供
- 人間のユーザーには常にHTMLを表示
- 実施期間: 2026年1月19日〜2月8日(3週間)
- SEOがんばってる人用(ふつうの人は気にしなくていい)
SEOで順位ダウンするとAI検索の引用も減る!? SEOプロの分析から明らかに
当然の結果をデータで裏付け (Lily Ray on Substack) 海外情報
業界でも屈指のSEOプロであるリリー・レイ氏が、2026年1月のアルゴリズムアップデート(未公表)によって影響を受けた11のサブディレクトリをもとに、
- グーグルオーガニック検索の可視性の低下
- AI検索の引用数の低下
を調査した。すると、両者に高い相関関係があることが明らかになった。オーガニックトラフィックが減少したサブディレクトリはすべて、AIの総引用数においても減少したのだ。
調査の結果と分析の主要点は次のとおりだ。
全体としては相関関係あり
グーグルのオーガニックトラフィックを失った11のサブディレクトリすべてにおいて、AI検索の総引用数も減少した。
トラフィック低下の範囲はさまざま
サブディレクトリごとのオーガニックトラフィックの低下は-5.7%から-53.1%の範囲に及んだ。
平均低下率は次のとおり:
- オーガニックトラフィック: -26.7%
- AI総引用数: -22.5%
プラットフォーム別に引用数の低下率をみると、次のとおり:
ChatGPT ―― 平均-27.8%(11件中11件が減少)。最も低下率が高かったサイトでは-42.3%(サイトE)に達した。低下率は11件中5件で-34%を超え、オーガニックトラフィックの損失自体を上回るケースも多かった。
AIモード ―― 平均-23.8%(11件中11件が減少)。オーガニックの低下と密接に連動している。
Gemini ―― 平均-19.3%(11件中10件が減少)。グーグル製品でありながら低下は緩やかだった(現在の検索ランキングではなく、より広範または保存済みのナレッジベースを参照している可能性がある)。
Perplexity ―― 最も耐性が高く、平均-2.9%。減少したサイトは11件中4件のみだった。
ChatGPTはグーグルの検索順位と密接に連動
ChatGPTの引用数の変化は、グーグルの検索順位の変動と密接に連動していた。グーグルの製品ではないにもかかわらず、その連動はGeminiよりも強かったほどだ。
ChatGPTが結果を生成する際にグーグルの検索インデックスへ強く依存していることが示唆される。
Perplexityはそれほどグーグルに依存していない?
11件中7件のサブディレクトリで引用数が増加したことは、Perplexityがグーグルとは異なるパイプラインに依存しているという説を裏付けする。Perplexityが減少したケースでも、その低下幅はグーグルオーガニック損失の深刻度とは相関しなかった。
Perplexityの耐性は注目に値するが、2025年8月のウェブ訪問数はChatGPTが約58億回であったのに対し、Perplexityは1億4,820万回(Similarweb調べ)であり、実際にはChatGPTおよびAIモードでの低下の方がはるかに大きな影響をもたらす。
生成AIでの可視性はGoogle検索と関連アリ
分析から、レイ氏は次のように結論づけている:
強固なSEOパフォーマンスは、主要なLLMの大部分においてAI検索の可視性を支える基盤となっている。グーグルのオーガニックランキングは、依然として検索起因の可視性において圧倒的多数の結果を左右している。
戦術によっては、「AI上の可視性を高める」一方で「オーガニック順位を損なう」ものがある。たとえば次のような手法だ:
- 隠しプロンプトインジェクション
- クローキング
- 自己宣伝的なリスト記事
- など
こうした手法は、結果としてオーガニック検索とAI引用の両方の可視性を低下させてしまう可能性がある。グーグルのオーガニック検索における可視性が下がれば、AI検索(特にAIモードとChatGPT)における可視性も下がる可能性が高いからだ。
こうした相関性は今まで「そうに違いない」と多くの人が思っていたことではある。しかし、小規模だとはいえ調査でデータが明らかになったのは、ありがたいことだ。
- AI SEOがんばってる人用(ふつうの人は気にしなくていい)
グーグルはインデックス登録リクエストを推奨しない。もう時代は変わったのだ!
品質を上げることが唯一の解決策 (Jan-Willem Bobbink on LinkedIn) 海外情報
グーグルのジョン・ミューラー氏が「インデックスの強制登録(サイト管理者からのインデックス登録リクエスト)に頼るな」とリンクトインでの質問にコメントした。
この「インデックスの強制登録」とは、そのままではグーグルがインデックスしてくれないURLを、Search Consoleから「インデックス登録をリクエスト」したり、Index API(本来は求人情報やライブ配信動画向けの機能)を使ったりして、クロール・インデックスさせることを指している。
このコメントについて、SEO歴30年のヤン=ウィレム・ボビンク氏が持論を述べた。
要約は次のとおりだ:
ミューラー氏のコメントは、単なる技術的アドバイスではない。「グーグルのインデックス登録自体が品質フィルタになっている」ことを示している点で、非常に重要だ。
IndexCheckr(インデックス調査ツール)の調査によると、次のような状況だという:
- ツール処理対象1,600万ページのうち62%がインデックスされていない
- インデックス済みページの21%は後に削除された
2024年・2025年のコアアップデートやAIコンテンツの急増により、グーグルがインデックスに登録するページの選別はさらに厳格になっている。
これをSEOの観点からみるとこうなる:
インデックス登録は「技術的手順」ではなく、「品質の判断基準」にもなった(グーグルは、品質が認められないページをインデックスしない)
インデックスされなければ、AI検索(AI Overviews・ChatGPTなど)にも扱われない
「このページは独自の価値があるか?」を公開前に問うべき
薄いコンテンツはサイト全体のインデックス評価を下げる
強制登録が必要な時点で、コンテンツの品質が不十分というサインだと考えるべき
結論としては、強引にインデックスさせようとするのではなく、グーグルが自然にインデックスしたいと思えるコンテンツを作ることが唯一の本質的な解決策となる。
品質が低いコンテンツがインデックスされない状況はもう何年も前に定着したグーグル検索の標準仕様と言っていい。
- すべてのWeb担当者 必見!

