セマンティックSEOと構造化データのマークアップに関する5つの疑問に答える(前編)
この記事では、セマンティックSEOと構造化データのマークアップの現状について、「どんな戦術と戦略を考えればいいのか」という内容の質問から主なものを5つ選び、解説する。
僕は2013年6月、サンフランシスコで開催されたセマンティック技術に関するカンファレンス『SemTechBiz 2013』(Semantic Technology & Business Conference)に参加してきた。このカンファレンスは、セマンティック技術分野のクリエイターやデザイナー、セマンティックウェブ標準に関してさまざまな取り組みを行っている技術者、検索エンジン各社の代表などが一堂に会し、セマンティック技術業界の現状について話し合う場だ。
今回のカンファレンスで焦点となっていたのはセマンティック検索と構造化データのマークアップで、schema.orgやグーグルのナレッジグラフ、さらにはBingの「Snapshot」機能が広まりしつつあることや、Open Graph Protocolの影響が増していることを反映していた。
アーロン・ブラッドリー氏は、このカンファレンスについて、SemTechBiz 2013から学ぶべき検索マーケティングの重要ポイントをわかりやすくまとめた記事をSEOSkepticに書いた。この記事は、セマンティック検索分野に向かっていきたいと思っている人にはいい出発点になる。
ついでに自分の話で恐縮だが、2014年7月のMozCon 2014カンファレンスで、僕はこうした業界の移行に戦略的に適応する方法について講演する予定だ。
マーケターには、認知度を向上し、ブランドを構築し、エンゲージメントを推進するために選択できる活動が山ほどある。だが、世に出たばかりの新しい活動については、取り組むべき時期を決めることが難しい場合もある ―― 特に「グーグル」や「SEO」といった言葉が大きく関係してくる場合、特にそうだ。
SEO業界のありようを根底から変えるような動きが出てくると(僕は実のところ、業界がこうした変化の1つに近づいてきたと考えている)、「新たな戦術オプションを中心として、戦略をどのように構成すべきなのか」という質問が、検索業界の専門家に多く寄せられるようになる。この記事では、そうした質問の中から5つを取り上げ、セマンティックSEOと構造化データのマークアップの現状について明らかにしていきたい。
1. 「セマンティックSEO」は新しい用語か?
SEOコミュニティでは、用語と定義についての議論に長い時間をかける。僕らが長年取り組んできて業界ですでに定着している活動でさえ、例外ではない。そして、検索業界以外の技術分野の人たちについては、なおさらこれが当てはまる。自由になる時間がたっぷりあるときに、Hacker NewsでSEO関連のスレッドを見てみるといい。「SEO」が妥当な用語または分野であるかどうかについて、未だに合意に達していないことがわかるはずだ。
SEOの定義はさておき、セマンティック検索については、先に紹介したブラッドリー氏のSemTechBizに関する記事の中に、WebLibのタマス・ドズコックス氏が提唱した簡潔な定義が引用されている。
セマンティック検索とは、意味のある結果を生み出す検索、質問またはアクションのことであり、得られる結果に検索語句がまったく含まれない、あるいは検索テキストをまったく使わずに検索を行う、という場合すらありうる。
グーグルとBingがいかにセマンティックな検索結果に移行しつつあるかを考察することは、すばらしい出発点になる。
検索エンジンがユーザーの検索語句にセマンティックな検索結果を返す方向に次第に進みつつある状況を理解するための手引きとしては、ジャスティン・ブリッグズ氏がエンティティの検索結果について約1年前に投稿した記事が、今なお役に立つ。ただし、セマンティック検索結果における認知度を高めたり、セマンティック検索エンジン向けの最適化を実施したりする活動に関しては、まだ統一された用語が存在しない。
エンティティベースの検索結果に関する最適化の呼び方については、「エンティティベースSEO」「エンティティSEO」「検索エンティティ最適化」に至るまで、ありとあらゆるものを耳にしてきた。個人的には、「セマンティック検索最適化」または「セマンティックSEO」を推したいが、1つだけ確かなのは、結局のところ、それをどう呼ぼうと問題ではないということだ。
いずれにしても、今後のSEO担当者の職務内容説明書には、セマンティック検索環境への対応という項目が当たり前になるだろう。
2. 「エンティティベースの検索結果」は現在、どう表示されているか?
グーグルでは、エンティティベースの検索結果の第1弾として、「答えのカード」と「ナレッジグラフの結果」を表示するようになった。具体的には、グーグルで人・場所・メディアオブジェクトなどを検索すると、次のような結果をよく目にする。
上図は、グーグルで映画監督サム・ペキンパーの映画を検索した場合のナレッジグラフの結果だが、この場合、表示されるコンテンツは主にFreebaseの記述から生成されていることは明らかだ。
しかし、これよりも分析がはるかに難しい変化がある。それは、検索結果で上位に表示されるサイトの中に、次のようなサイトが出てきていることだ。
- 特定のキーワード検索に明白に最適化しているわけではないサイト
- SEO担当者が強いと見なすようなキーワードに一致するようなアンカーテキストを持つリンクプロファイルを持っていないようなサイト
たとえば、映画『2001年宇宙の旅』からの有名なせりふ「I'm sorry Dave」を検索してみると、次のような結果が表示された。
1ページ目に表示されるYouTubeのクリップやその他の検索結果は、オンページ最適化とアンカーテキストプロファイルという点で予想できそうな要素をすべて含んでいる。つまり、キーワードがタイトル/メタタグ/URLに使われていて、リンクプロファイルに検索語句と完全一致するアンカーテキストと部分一致するアンカーテキストの両方が含まれているということだ。
ところが、IMDbとWikiquoteのページは少し様子が異なっている。これらのいずれの要素についても強力なシグナルが含まれていない。IMDbのページへはリンクが多数張られているが、SEO担当者が期待するような、検索語句と部分一致または完全一致するアンカーテキストによるリンクは比較的少ない。さらに、このページのコンテンツ本文には確かに検索語句が含まれてはいるものの、SEO的なスイートスポットであるURLや内部アンカーテキスト、HTMLのtitle要素は、この語句に最適化されているわけではない。
このトピックについては、ジャンルカ・フィオレッリ氏がグラフとエンティティ認識に関する記事で言及し、これがウェブドキュメント全体における共起(co-occurrence)と共参照(co-reference)にどう関連するかを考察した。グーグルは2013年にWikilinks Corpusをリリースし、この中でエンティティ解決に追加する共参照のシステムについて説明した。具体的に言うと、異なる言及や検索語句は、どのようなタイミングで、同一のエンティティをウェブドキュメント全体で参照しているのだろう、という問題だ。
グーグルとマサチューセッツ大学のWikilinksプロジェクトは、Wikipediaの曖昧さを回避した項目「Banksy」にリンクするウェブドキュメント2件との「クロスドキュメントの共参照」について、優れた解説を行っている。
つまり、僕が示した上述の例で言うと、「I'm sorry Dave」で検索した場合、グーグルはかなり簡単に、IMDbページを共参照するウェブドキュメント全体でこの検索語句を2001: A Space Odyssey(『2001年宇宙の旅』)というエンティティに一致させ、HTMLの要素やアンカーテキストでキーワード文字列が一致しているかどうかにかかわらず、そのエンティティに対する検索結果を返せるということだ。
3. だったら、キーワードはもうおしまいなのか?
非常に興味深いことに、僕は、この点に関して異なる見解を持つ切れ者のSEO担当者が書いた2つの記事を読んでいた。
AJ・コーン氏は、「ユーザーの意図を判断し、それを関連する検索結果と一致させるのに、キーワードは不可欠である」という理由から、キーワードは依然として重要だという説得力ある推論を示てしいる。
エンティティベースのSEOやナレッジグラフの検索結果がローカライゼーション、パーソナライゼーション、エンティティの曖昧性回避を通じてユーザーの意図を推測しようとするが、「意図」という観点から言えば、「シアトルの病院」や「Xbox 360で最高のゲームは?」(答えはもちろん「Bioshock」だけど)といったキーワード文字列以上に明確なものなどない。
しかし、「ユーザーの意図を伝える強力な代弁者としてのキーワードが、少し勢いを失ってきた」可能性を示す兆候もいくつかある。たとえば、グーグルの「音声検索」は、ユーザーが過去に何を検索したか、ユーザーは誰か、どこにいるかを加味して、検索語句に含まれる意図を判断している。その検索結果には目に見えない「意図」が重なりあっており、キーワードに関する研究やリンクグラフ型のメトリクスではおそらくそれを解明できないということに、頑固で古いタイプのSEO担当者たちでさえも気付き始めている。
ブラッドリー氏は、先述のSemTechBizの記事(真面目な話、ぜひ読んでほしい)の中で、極めて重要な指摘をしている。それは、
モバイルがセマンティック検索革命の推進力となる
ということだ。グーグル、Bing、ヤフーのすべてが、モバイルの普及に災いの前兆を読み取り、デスクトップPCの緩やかな死を予想している。キーワードがお払い箱になることはないかもしれないが、ユーザーの意図を解明したり、関連する検索結果を提供したりするということになると、キーワードの他に、たくさんの要素が加味されるようになるだろう。
この記事は、前後編の2回に分けてお届けする。後編となる次回は、残り2つの疑問に対する回答を紹介する。後編を読む
ソーシャルもやってます!