SES London 2010 : ウェブの情報抽出の仕組みを紹介(註:題名より面白い!) | SEO Japan

SEO Japan - 2010年3月3日(水) 05:04
このページは、外部サイト SEO Japan の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「SES London 2010 : ウェブの情報抽出の仕組みを紹介(註:題名より面白い!)」 からご覧ください。
タイトルがイマイチですが原題が「Introduction to Information Retrieval on the Web」なので。SES運営会社であるインサイシブ・メディアのコンテンツ部門副社長であるマイク・グレハンがプレゼン形式で。

この人、確か元々結構有名な人な気が。。。数年前にSESで講演聞いたことあるような。ま、いいですか。

まずインパクトのある一言。
「Googleは世界中のありとあらゆる情報に簡単にアクセスできるようにする、と言っているが、十分に成功しているとは言えない。」
そしてワールド・ワイド・ウェブや検索エンジンの仕組みを紹介。久々に聞きました。。。内容は細かい&大体の人は知っていると思うのでスキップします。
以下、話の流れに沿ってポイントを。
・Googleは常にウェブの情報を収集し、また更新しようとする。何故ならウェブは常に拡大し続けている。
・検索エンジンのロボットはリンクを辿ってテキスト情報を収集する。それだけ。
・SEOはいかにGoogleに情報を効率的に取得させるかと言う作業。
・検索エンジンの情報解析の仕組みを理解すれば、必要とされるSEOは自然と明らかになる。「検索エンジンに理解されやすいページ」、いわゆる「サーチフレンドリーページ」をコーディングするテクニックは10年前から存在する。キーワードをTITLE、ヘッドライン、ボディコピーに特定のタグに記述する。グローバルナビゲーションを付ける、など。
しかしページの内容は誰でも自由に記述することができる。キーワードを詰め込んだページは簡単に作成できる。どの情報が正しいのか?
クラインバーグと言う科学者がリンク分析の概念を発明した。アルタビスタ(当時人気の検索エンジン)で「Search Engine」で検索してもアルタビスタが結果に出ない。日本の自動車メーカーについて検索してもTOYOTAやHONDAが検索結果に出ない。ページの内容以外の評価指標が必要と考えた。
そこでリンク分析の概念ができた。リンクを受けているページは信頼性が高いのでは?またページ同士の関連性もあるのでは?インターネット全体のリンク分析をしてみると、インターネットには、リンクの中心となるハブやオーソリティ的なサイトがあり、其々に特定の情報に関するコミュニティがあることが分かった。
それを検索エンジンのアルゴリズムに本格的に導入したのがGoogle。

そしてリンク対策がSEOの重要な作業となった。

そして様々な会社が「クリエイティブなリンクの取得方法」を考えてSEOを実施してきた。
・・・
現在のSEOは、
・HTMLページのテキスト
・リンクデータとアンカーテキスト
に加えて、
・ソーシャルメディア – タギング、ブックマーキング、レビューなど
も重要になってきた。しかしもっと進化していく必要がある。
・・・
ここでインターネットユーザーについて考えてみたい。ユーザーの行動には3種類ある:
1. インフォメーショナル – 情報を収集している
2. ナビゲーショナル – 訪問したいサイトが決まっている
3. トランザクショナル – 特定のアクションを行う
ユーザーの行動データには下記の2種類がある:
・ユーザーの検索キーワード
・ユーザーのページ遷移
Googleは上記を分析して検索結果の有益性を調べることができるまで進化している。
検索エンジン上での検索クエリーや検索結果のクリック率や滞在時間を分析しているだけではない。Googleツールバーを使っている人も多いだろうが、ツールバーがどれだけの情報をGoogleに供給しているか考えたことがあるだろうか?
・・・
さらにユーザーの意図まで理解することができるだろうか?
Googleは例えばこんな仮説を立てることができる。商品購入に関するキーワード検索(例:「パソコン 通販」など)が行われた場合、そもそもオルガニック検索の結果を出す必要があるのだろうか?全てアドワーズの商品広告でも良いのかもしれない。
実際にGoogleはそういう実験をしている。アドワーズの広告にプラスボタンを追加して、それをクリックすると、広告エリアが広がって商品写真とリンクで画面がいっぱいになる。オルガニック検索を出すことにこだわるよりユーザーにとっても便利かもしれない。
・・・
検索の未来はどうなる?
・UGC(ユーザー生成コンテンツ)とプロが作ったコンテンツの比率は5:1。圧倒的にUGCが多い。
・検索体験はもっと進化し便利になる。
・様々な種類の情報への需要が広がる。
・フィードバックのループによる改善が続く。
一番の変化はソーシャルネットワークで情報を探す行動が格段に増えること、かもしれない。既にYoutubeの検索回数はGoogleを超えるかも。ユーザーによるQ&Aサイトもニーズが高まっている(Naverを紹介)。

今後、ますます下記が加速化していく:
・ローカル、モバイル、ソーシャル、マルチメディア検索が統合されていく。
・ネット上のソーシャルコミュニティが生み出す情報が一方的なブランドメッセージのカウンターバランスとなる。
・アプリケーションが特定の情報を配信するツールとしてウェブブラウザーに置き換わる。
マーケティング手法も多様化せざるえない。
・・・
最後にYahoo!のサーチリサーチ部門副社長の「「HTMLとHTTPが、現在のコンテンツ流通の仕組みに適しているかは疑問だ」と言うコメントを紹介して終了。
・・・
。。。短期間で一気にウェブと検索エンジンの歴史、そして未来をSEOやマーケティングと関連付けて話してくれました。色々考えさせられることはありますが、まとめる言葉まで消化できてません。ただSEOに限定せずウェブの分野で新しい新規ビジネスを考えたくなるような内容でした!個人的にはキーノートよりはるかに示唆に富んでいて良かったです。
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

NSFW
NSFWは「Not safe for work」(職場で見ないほうがよい)という ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]