Live.comのEytan Seidman氏とのインタビューMicrosoftの検索事業について
マイクロソフトのLive Search担当プロダクトマネージャであるエイタン・シードマン(Eytan Seidman)氏と僕は、数か月前からインタビューのテーマについて何度かメールをやりとりしてきた。そしてついに、その成果をここにお届けできる(^-^)。
このインタビューで僕は、マイクロソフトが最近Live Searchに加えた変更や更新、エイタン氏と検索業界との関わりあいなどについて尋ねた。お楽しみあれ!
●Rand まずはこのインタビューを受けてくれて本当にありがとうございます。あなたをこのブログにお迎えできて心から喜んでいます。
ところで、あなたがマイクロソフトに入社するまでの経緯について少し話してもらえないでしょうか。そして、あなたはどうやってLive Searchのチームに加わることになったのでしょうか。また、現在の立場は?
●エイタン 私は、大学を卒業してすぐにマイクロソフトに就職しました。2000年の夏にマイクロソフトで研修をしたのですが、そのときにマイクロソフトが気に入り、2001年に卒業してからすぐマイクロソフトに就職したというわけです。
それから今までに私が手がけた製品は基本的に2つです。2001年から2003年まで、私はマイクロソフトのCRM(顧客関係管理)製品に取り組みました。中小規模企業における顧客管理を支援するアプリケーションです。2003年からは、検索関係の仕事を中心にさまざまなことに取り組んでいます。最初は、検索インフラの設計と構築の手伝いから始まりました。これがきっかけでSearch Engine Strategies(SES)やWebmasterWorldに関わることになったのです。
この1年半は、プログラムマネージャのチームでリーダーを務め、2つの大きな課題に取り組んでいます。関連性とその測定です。前者は、われわれが最良の結果を求めて検索を実行する際にもっとも肝心なものですし、後者は、その関連性をわれわれの検索エンジンでどのように測定するかということです。
●Rand あなたは、MSN/Live Searchの関係者の中で、サービスについて公の場で発言する数少ない1人ですよね。あなたはこれからもLiveサービスの広告塔を務めていくのですか? それとも、近い将来、もっと大きなチームが結成され、ウェブマスターや検索業界に対してLiveサービスを紹介していくと考えていいのでしょうか? そのチームには、どんな人が参加しますか?
●エイタン 何年にもわたってLive Searchの顔を務めてきた人は、私の他にも何人もいますよ。その1人が、私の上司にあたるラメズ・ナム(Ramez Naam)です。彼は、SESやWebmasterWorldで何度も話をしています。今後そのような役割を果たす人間を増やすかどうかについて、われわれも考えてはいますが、具体的に名前を挙げることはできませんし、予測もつきません。
●Rand Live Searchは最近、中核となる検索の関連性やインデックスのサイズなど、サービスの多くをアップグレードしましたよね。その変更についていくつか質問があります。
まず、人間視点から見た検索の関連性をどのように計測するのですか?「ユーザーたちはこっちの方が気に入っていて、その検索結果に満足しているよ」と告げるのは誰なのでしょうか? その満足度は、すべての種類の検索に当てはまると思いますか? それとも、非常に「一般的」だったり「人気のある」検索クエリに対してのみ当てはまるものなのでしょうか?
●エイタン 良い質問ですね。マイクロソフトには何通りもの検索品質測定メカニズムがあります。残念ながらそれを具体的にお話しすることはできませんが、「ブラインド」テストや、ユーザーがLiveサイトにどう関わっているかといったデータも含めて、われわれはさまざまなことを見ています。
満足度について言えば、全面的に改良を行っています。先ごろ開催したSearchificationのイベントで、われわれは「クエリの意図」をきちんと処理するという取り組みを取り上げました。つまり、人がどのような意味合いでそのクエリを入力しているのかを、より正確に理解するために膨大な作業を行っているのです。Live Searchのブログでは、それを示す1つの例として「nw coed soccer」(nw 女子学生 サッカー)というクエリを挙げています。このクエリを入力すると、前後関係から「nw」が「northwest」(北西)のことだと解釈します。これは一般的なクエリではありません。しかし、これはほんの一例で、もっともっと検索エンジンを使っていけば、皆さんは何度もこのような改良を目にすることになるでしょう。
●Rand 新しいLive Searchでは、検索結果にローカル検索、製品検索、インスタントアンサーなどの垂直型検索結果がたくさんスマートに統合されていますね。あなたのお気に入りはどれですか? これは、他の検索エンジンが提供しているものよりかなり優れているぞ、と思うのはどれですか?
●エイタン 私は、どれも本当にすごいと思っています。ただ、私が最もよく使うとほぼ間違いなく言えるのは、「Shopping Answer」という機能です。これはショッピングに関することならどんなことでも、即座に答えを返してくれる機能です。特にエレクトロニクス関係が優れています。たとえば、「Nikon D40x」というクエリを入力したとしましょう。そうすると、広告のすぐ下に、関連するインスタントアンサーが表示され、価格情報の一部とユーザーレビューのまとめを提供します。「特徴やレビューをさらに表示(More Features and Reviews)」をクリックすると、レビューの詳細情報を掲載したページが開きます。これはものすごい機能で、他社を凌いでいると私は思っています。ぜひとも自分で試してみてください。
●Rand 新しい関連性アルゴリズムを採用してから、インデックスにおけるスパムの取り締まりが強化されたように見えますが、これを成功に導いた技術あるいは戦術を話してもらえませんか(大まかな話でもかまいません)?
●エイタン ノーコメント(^-^)。●Rand では、これはどうでしょう――スパムとの戦いにおいて、Liveで現在、最優先事項に掲げているのは何ですか? 多くの人がスパム行為に関わり、その結果として検索エンジンからペナルティを科されている現状をご覧になっているでしょうから、ウェブマスターやサイトオーナーに気をつけるように言っておくことはありますか?
●エイタン それもノーコメントです。
●Rand 今回の刷新で、ウェブのインデックスが新しく(大きく)なり、アルゴリズムと検索結果も一新されたようですね。これは通常の「更新」、つまりインデックスやアルゴリズムの改良というのとは違っています。
更新を積み重ねるのではなく、装いを一新する方を選んだ理由をお聞かせください。Liveではこういうやり方が標準になるのでしょうか? それとも、これからも毎日、毎週、毎月といったようなスパンで現在のシステムが変更されていくと考えていいのでしょうか?
●エイタン Liveのサイトに対しては、常に改良を加えています。「Live Search Update」と銘打った今回の刷新は、われわれが積み重ねてきたさまざまな改善努力の総仕上げだったので、すべてを同時にリリースしようと決めたのです。特に今回のリリースには、わずか数か月の開発スパンでは実現困難な内容がたくさん組み込まれています。ですから、それらを全部まとめてリリースするというのは理にかなった選択でした。
今後の方向性についてはコメントできません。これでようやく、Liveサイトにさまざまな改良を容易に加えられるインフラが整い、われわれは非常にわくわくしています。このインフラを効果的に活用していくとともに、大きな改良を施すのに要する時間および方針修正のアイデアについては、現実を見据えていきたいと思っています。
●Rand Liveも今はウェブマスターツールを出していますよね。Liveのウェブマスターツールが目指すところは何ですか? マイクロソフトは、このデータへのアクセスを提供することで何を実現しようとしているのですか?
●エイタン われわれの成功には、ウェブマスターが大きく関わっています。基本的に、ウェブマスターが提供してくれるコンテンツがあってこそ、検索エンジンがエンドユーザーにとって役立つものになれるのです。ウェブマスターとより緊密な関係が築ければ、われわれは2つのことを達成できると考えています。
まず、ウェブマスターに、Live Searchが彼らの仕事にどれだけ役に立つか、そして、どのような点を改善すれば検索結果の上位に表示されるようになるかを理解してもらうことです。
たとえば、検索エンジンのクローラが認識しているものについて、詳しくわかるようになれば、顧客はより効果的な対処ができるようになります。それから、より多くのコンテンツをいち早く入手できるよう、人々と良好な関係を築けるようになりたいと考えています。たとえば、ログを調べてみると、Googlebotのみ特別に許可して、MSNBotは許可していないサイトがまだかなり多いということがわかりました。こうしたウェブマスターに接触して、彼らのコンテンツをインデックス化することでそのトラフィックを呼び込めれば、われわれはみんなにもっと貢献できると思うのです。
●Rand では、Live SearchのNeural Netについて。あなたは、このランキングシステムの進歩に満足していますか? 想定しうるかぎりの未来において、あなたがたはこのシステムを継続するつもりですか? 2005年の夏に初めて発表されて以来、何か大きな変更はありましたか?
●エイタン 全体として、われわれの中枢を担うランキング機能であるNeural Netは、きわめて順調に進化しています。インデックスのサイズを4倍に拡大したため、ランキングは基本的に以前より困難になっているはずなのに、検索エンジンのはじき出す関連性は向上し続けています。
ただ、われわれはいかなる聖域も設けない、と言っておきましょう。特定のテクノロジに固執しているわけではないのです。中核製品に携わる人や、マイクロソフト・リサーチ(MSR)の人たちは、常にNeural Netの改善に取り組んでいますし、もしかするとNeural Netに取って代わるさらに優れたシステムを開発しているかもしれません。れわれとしては、そちらの方がが顧客にずっと関連性の高い結果を提供できると考えれば、そっちにシフトするというわけです。
●Rand 間違っていたら訂正していただきたいのですが、Neural Netは、すばらしい検索結果とはこういうものだという「例」をたくさん示してやることで、長い時間をかけて学習し、さらに「賢く」なるものだと理解しています。このプロセスはどれくらい進んでいるとお思いですか? 現在われわれが目にしているのは、Neural Netの能力の10%でしょうか? 20%? 90%? まあ、詳細な数字は言えないでしょうが、50%より上ですか、下ですか?
●エイタン もっと多くのデータポイントがあれば、Netはもっと効果的に学習できるでしょう。そして、われわれは常にその点を改善しようとしています。しかし残念ながら、どの程度まで到達できていると思うかに関しては、詳細を明らかにすることはできません。
●Rand Live.comの検索結果でサイドバーに表示される「関連検索(related searches)」についてお尋ねします。あれは、検索語の持つ方向性や用途から意味的に関連性を評価しているのですか? それとも、そのクエリを検索した人の多くが、そこにリストアップされた語句も検索した、という点で関連性があるのですか?
●エイタン 関連検索は、「より具体的なもの」と「より広範なもの」の組み合わせです。ですから、たとえば「Eytan」で検索すれば、同じ語で検索した人のかなり多くが、特に「Eytan Seidman」を探していることがわかるのです。そしてまた、人々はより広範な検索結果を求めているかもしれない、という方向性のシナリオもあるのです。たとえば、「Perl」で検索すると、関連検索として「PHP」が示されます。というのは、「PHP」は広い意味で「Perl」に関連している傾向があるからです。
●Rand Live Searchのニュース検索機能はどうでしょう。ニュースソースは、何かの編集方針に則って選ばれるのですか? Live Searchのニュース検索に表示されたいと思っているニュースサイトは、どのようにすれば、そこに入れますか?
●エイタン はい、ニュースソースはわれわれの編集方針に則って選んでいます。いい質問ですね。常に検討してはいるのですが、ニュース検索の対象にしてほしいという申し入れを受け付ける正式な仕組みはありません。記事掲載を希望するサイトがあれば、私に知らせてください。そうすれば、私が担当者にそれを伝えます。
●Rand Liveチームの人たちが定期的に目を通しているフォーラムやグループ、ブログはありますか? あなたが特に気に入っているものや、価値があると思うものは? Liveチームの人たちが近いうちに参加を予定しているものはありますか?
●エイタン われわれは全員、SEOmoz(当然だね!)やTechmeme、TechCrunch、WebmasterWorld、SearchEngineWatch、Battelle、Search Engine Land、Sphinnなど、テクノロジおよび検索関係のニュースをほとんど読んでいます。われわれは今、WebmasterWorldに参加しています。WebmasterWorldにおける関与は、いったん参加した以上、必ずわれわれが可能な限り関わり続けることをまさに示すものです。いずれより多くのリソースを充て、もっと参加する場を増やしていければと思っています。それから、公式ブログには、読者に興味を抱いてほしいトピックを取り上げて、もっと頻繁に投稿していきます。
●Rand セバスチャン・ガード(彼のブログ)は、マイクロソフトが検索品質評価チームを使っているという話をしてくれました。それは、Searchificationのイベントでも取り上げられました(このスライド参照)し、Liveのメディア向けディスカッションでもよく取り上げられている話題のようです(評価チームがわれわれにX、YあるいはZというフィードバックを返した、というような話です)。セバスチャンの話から、どの検索エンジンも同じことをしているのに気がつきましたが、人を使った検索品質評価チームについて公に語っているのはマイクロソフトだけです(私の知るかぎり、どの検索エンジンにも――Googleのケース――人間の評価チームがあります)。
そこで、2つ質問があります。なぜ、他の検索エンジンは人間の手によるデータの編集を内緒にしているのだと思いますか? また、人間の品質評価にはどのような価値があると考えられますか? エンジニアのチームや機械ではなく、もっと多種多様な人を使う最大のメリットは何でしょう?
●エイタン それは、あまりおもしろいトピックだとは言えませんね(^-^)。
●Rand 主要なウェブ検索エンジンの中で、Liveはソーシャルメディアの分野における活動に消極的ですね。これは今後変わりますか? マイクロソフトはWeb 2.0やユーザー作成コンテンツ、プラットフォームとしてのウェブなどに価値があると思いますか? それとも、それらはすべて一時的な流行でしょうか?
●エイタン Web 2.0とは何なのか、私にはもうわからないんです。いや、まじめな話。ある人が口にしたというWeb 2.0に対する定義に、Zillowのリッチ・バートン氏が異を唱えていましたが、そのときバートン氏の発言が大筋でいいところをついていると思いますよ。該当の記事を示しておきましょう。
Live Searchでは、ユーザー作成コンテンツの価値を大いに認めています。いくつか例を挙げましょう。まずはローカル検索です。たとえば、「Kisaku Seattle, WA」で検索して、ローカル検索のインスタントアンサーをクリックすると、このようなページにジャンプします。この店には21人のユーザーの評価によって、総合で4.5個の星が付いていますね。これはユーザー作成コンテンツです。このデータは、続いてLive Search Mobileアプリケーションに流れます。Live Search Mobileアプリケーションを、Windows MobileかJava対応の携帯電話で利用すれば、同じデータを取り出すことができ、どこかでレストランを探しているときに大変役に立ちます。
これが、われわれのユーザー作成コンテンツの利用法です。ユーザーデータそのものが役に立つ、ということなんです。
もう1つ例を挙げましょう。それは、われわれがLive Search Mapsのコレクションに組み込んだ機能です。ユーザーは自分だけのコレクションを作成し、共有できるほか、そのコレクションを3次元動画化することもできるのです。これは、Searchificationで発表し、10月15日の週に正式にリリースします。
●Rand 「視覚的表示に基づくウェブページコンテンツの構造解析アルゴリズム」についての研究を発表したのは、マイクロソフトが最初でしたよね。それが、ランキングのアルゴリズムに適用する上で、使いやすく有益だとわかったということでしょうか? それはあまりにも処理負荷が高く、データを収集すべき膨大な数のウェブページには適用できない、と見る人もいます。
- http://research.microsoft.com/research/pubs/view.aspx?tr_id=690
- http://www.searchengineguide.com/articles/2005/0301_rc1.html
●エイタン この技術は、われわれにとって間違いなく重要です。たとえば、Live Newsなどでクエリを実行したときのことを考えてください。ニュースサイトでは、サイトナビゲーション用のテキストと他のテキストを分離することが非常に重要です。私たちのニュース検索結果とその説明文を見てください。主要な記事だけから、かなりうまく概要を引き出してきているのがわかるでしょう。
もうちょっと大まかな話をしましょう。MSRはウェブ検索の分野について膨大な研究を行っていますし、それを公表するもしないも彼らの自由です。われわれと緊密に協力してくれている人が、MSRのあちこちに大勢います。その相手の研究がどの程度まで進んでいるかによって、その成果をすぐにわれわれの製品に取り込むか、もう少し時間をかけて研究を続けてもらい、その完成を待つかが決まります。
コンピュータの処理能力については、それほど重要視していません。ユーザー体験を劇的に変えられるものがあるのなら、それを利用したいと思います。コンピュータの処理能力向上を目指して、われわれが行ってきた数々の投資については、この記事とこの記事でもっと詳しく読むことができます。
●Rand 将来における検索の「専門化」についてはどのようにお考えですか? 垂直検索、モバイル検索、ローカル検索などはやがて、それぞれに専門サイトが生まれてくるのでしょうか? それとも、「大手」検索エンジンがこういった検索分野をこれからも支配し続けていくのでしょうか?
●エイタン 私は、この先何が起こるかなどということを深く考える人間ではないのです。なぜ、Live Searchをはじめとする検索エンジンは、ショッピングや地域情報、エンターテインメント、ヘルスケアなどについて分野ごとの検索を提供しているのかと訊かれれば、それは顧客がそういう質問をするからです。つまりわれわれは、はっきりとわかる顧客のニーズに応えて、垂直検索機能を提供しているのです。
●Rand おっと、これを聞いておかなければ。有料リンクに関する話です。Googleはポリシーを公にしており、たびたび議論の的になりながら、いかなる種類のリンクであろうと有料リンクを扱うサイトオーナーは「nofollow」属性を使用しなければならず、これを怠った場合、そのウェブサイトには何らかの形でペナルティを与える可能性がある、と言っています。
Liveの有料リンクに対する姿勢は? 主に広告を目的としたリンクと、検索エンジンのランキング操作を意図したリンクの違いがわかるのですか? リンクの売買が疑われるサイトに対してLiveは何らかの対抗措置を取りますか? もし取るなら、これがサイト同士の潰し合いを招く可能性は?
私はあなたたちの基本方針にも、それをどのように実践していくかにも興味があります。Live Searchチームは有料リンクをどのように考えているのでしょうか? 有料リンクは常に罪悪でしょうか? その悪質さに程度の違いがありますか? 有料リンクの中でも、関連性が高くて良いリンクと信頼できないリンクとがありますか? ウェブマスターあるいはウェブサイトは、リンクを購入すると検索結果から排除される危険性があるのでしょうか? リンクを販売した場合は? リンク購入者を処罰すると、競合つぶしのリンク購入(高い順位を獲得している競合サイトの価値を損なわせるために、リンクを購入して、その高順位の競合サイトに向ける)を招く危険性がある、という心配はないのでしょうか?
●エイタン 私がこの業界で最もよく考えるのは、リンクの関連性と客観性の問題です。実際には、ほとんどの有料リンクが、a)明らかに客観的でなく、b)非常に関連性に乏しい、と言えます。そのような類のリンクについてお尋ねなら、その答えはまさにそのとおり、リスクがあります。ユーザー体験にとってプラスの価値をほとんど提供せず、事実上システムを欺こうとしているようなまやかしのリンクを許容することはありません。わずかながらグレーゾーンがあって、まったく問題のない有料リンクの使い方をしている人もいるのではないか? はい、います。しかし、われわれが目にしたうちの、ごくわずかな割合に過ぎません。
●Rand では最後に、個人的な質問になってしまうのですが、検索業界にあなたを駆り立てるものは何ですか? ご自分の仕事に情熱を感じる要素が特にあれば、それを教えてください?
●エイタン 私が検索で好きなことが3つあります。
1つ目は検索の作業そのものです。特に、ウェブ検索は人々が情報を探し出す方法を大きく変えています。その真っ只中にいるというのは本当に刺激的なものです。
2つ目はテクノロジです。われわれは、びっくりするほどおもしろい技術的な難題に日夜取り組んでいます。われわれが取り組む問題には多くの場合、数ペタバイトに及ぶデータの洗い出しが必要です。何千台ものマシンを使って作業するのですが、それはちょっと他では考えられないようなスケールです。
そして最後になりましたが、最も重要な要素が人です。自分の関わっているテクノロジがいかに好きでも、人とうまく関わりをもてなければ、その仕事を愛せるようには決してならないと思います。私は自分の仕事を愛しています。なぜなら、毎日毎日いろいろな人とたがいに影響し合えるから。技術面では、非常に頭のいい人たちが周りに何人もいて、私は彼らからたくさんのことを学んでいます。事業運営や経営管理の面でも、本当に優秀な人たちが周りにいて、さまざまなことが学べます。これこそ、私が本当に楽しめる環境です。
ここに参加してくれたエイタン氏とLiveチームの皆さんに心からお礼を言いたい。僕は今、Live Webmaster Portal Betaを立ち上げた人たち数人によるスクリーンショットをアップしようとしていて、今週中にはブログに掲載したいと思っている。
ところで、Live Searchの更新に関する詳細だけど、関連性についてはこの記事、製品検索に関してはこの記事、Live Search Mapsのアップグレードについてはこちらの最新記事をチェックしてほしい。レドモンドのエンジニアたちも忙しいね。
今から数週間のうちに、僕はレドモンドのLiveチームを訪ねて、Live Webmaster Portalのバージョン2について話を聞いてくるつもりだ。うまくいけば、その一部をみんなに紹介する許可が得られるかも。それから、バリー・シュワルツ氏がスクリーンショットのバージョン1を掲載してるよ。
追伸:それから、この間エリック・エンジェ氏がやったチャットインタビューも見逃さないように。Liveチームのラメズ・ナム氏ともう少し技術的な内容を話しているよ。はいはい。今週はインタビュー記事大当たりの週なんだよね。何と言えばいいか。つまり幸運は連れ立ってやってくるもんなのさ(^-^)。
ソーシャルもやってます!