このページは、外部サイト
SEO Japan の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「
ツイッターのクエリ数が1日10億件を突破」 からご覧ください。
今年の2月頃にツイッターのつぶやき数が月10億件を超えたというニュースが少し話題になりました。今回は、なんとツイッターにおける1日のクエリ数が10億件を超えたというニュースです。それに合わせて新しい検索技術も導入したそうです。 — SEO Japan ツイッターが昔のマクドナルドと同じ戦略を用いていたなら、今日、屋外の掲示板には「10億クエリを突破」と言うメッセージが描かれていたはずだ。さらに、ユーザーとマシンにクエリを提供していくため、ツイッターは新たな独自の検索テクノロジーを利用していくことが発表された。 このニュースはツイッターのエンジニアリング部門のブログで本日発表された。まずはテクノロジーの変更に焦点を絞り、次に楽しいスタッツについて取り上げよう。 新しい検索エンジンの中身 現在、ツイッターは新しい検索エンジンを利用している。しかし、実際には過去数週間にわたって利用されてきたようだ。しかし、既に公開されているこの検索エンジンの“ルック & フィール”自体は得に新しいわけではない。新しいのはあくまでもその“中身”である。 ユーザーが検索を行う実際の“エンジン”、つまりクエリを手に入れ、無数に存在するツイートの中から探し、そして、- 大抵の場合1秒以内で – 答えを返してくるソフトウェアに変更が加えられたのだ。 ツイッターによると、新しいテクノロジーは今後数年間にわたって用いられ、ツイートを介して現在流れるデータの50倍の量を処理するだけの馬力を持っているらしい。テクノロジーに興味がある人は、ツイッターのエントリを参考にしてもらいたい。 最大の変化の一つとして「転置インデックス」への移行が挙げられる。転置インデックスおよび現代の検索エンジンを詳しく知りたいなら、以下のリソースに目を通しておこう: Googleが情報を集め、結果を格付けする仕組み : 元々は司書のためにグーグルが投稿した。“分かりやすい言葉”で説明されている 検索について、ザ・シリーズ: ティム・ブレイ氏は初期の検索エンジンであり、有数の人気を誇った“オープン・テキスト”を共同で設立した人物である。現在、同氏はグーグルに勤めている。このシリーズで、ブレイ氏は検索エンジンを構築する際の基礎を詳しく説明している。 さらに時間を遡ることが可能 ツイッターの検索エンジンの弱点の一つが、時間が経過すると、数日前の検索を行うのが困難になる点である。今年の1月、私は「過去のツイートはどこへ消えた?」を投稿し、正月に投稿したツイートが1月の半ばには見つけることが出来ない件を伝えた。当時、検索に対する過去のツイートを保存するキャパシティがないとツイッターは私に説明していた。 9月半ばには、ツイッター検索では、4日前のツイートを検索することが出来ない状態になっていた。本日投稿されたエントリでは、ツイッターは新しいシステムは、「2倍の長さ」の検索を行うことが出来るようになったと主張しているが、これが期間のことを言っているのかどうかは分からない。それでも、1週間前までは遡って検索することが出来るようになっている。 1週間以上前のツイートを探すなら、別を当たれ 1週間以上前のツイートを検索したいだろうか?残念ながら、ツイッター検索はその願いを叶えてくれるわけではなく、また、ツイッター自身がこの期間を大幅に延長するつもりはない。ツイッターは6月(そして確認のため8月にも)私にグーグルやトプシーのような企業がアーカイブの検索に焦点を絞っているため、ツイッターは他の方法でサイトの検索を改善する点に狙いを定めていると言っていた。 この件に関しては、8月に投稿した「Topsy: 2008年5月のツイートを検索」のなかで詳しく説明している。このエントリには、ツイッター、トプシー、そして、グーグルがどこまで過去に遡るのかを表すチャートを掲載し、そして、「昔」のツイートを探す際のアドバイスを紹介している。一週間以上前のツイートはツイッターの感覚では昔と言わざるを得ないのではないだろうか。 新しいツイッター検索のルック & フィール ツイッターが、アーカイブ検索以外で、検索エクスペリエンスを改善する約束の下、既に実現していることがある。それは、9月半ばより展開されている、新しいツイッターのルック & フィールの一部とも言える優れた機能である。 新しいツイッターの検索を見ていないなら、 — または詳しく調査していないなら、「新しいツイッター & 検索、イラストで説明」を読めば新しい機能を理解することが出来るだろう。 私はこの変更点に衝撃を受けた。ツイッターは、専用のツイッター検索のサイト、そして、Twitter.comの検索ボックスの2箇所で検索サービスを提供しているのだ。私はツイッター検索が好きだったが、新しくデザインが変わったツイッター自体で検索を行うようになった。新しい機能により、検索に応じて見つけるツイートに関する前後関係を遥かに容易に得ることが出来るようになったのだ。その結果、最近はほとんどツイッター検索に戻ることはなくなった。 数字に注目! ツイッターのエントリには最新のスタッツの一部も掲載されている: ツイートが1000本/秒を突破 1万2,000クエリ/秒を突破 クエリが10億以上/日に達する(10億3680万/日) さらに数字を詳しく見ていく: 一ヶ月に310億個のクエリを処理 クエリ 対 検索 ツイッターが「クエリ/日」を挙げた点に注目してもらいたい。恐らく「検索」ではなく「クエリ」と言う言葉を意図的に使っていたのではないかと思う。なぜなら、グーグル、ヤフー!、ビングのような通常の検索エンジンとは異なり、ツイッターは人間の手によるものではない「検索」を多く扱っているからだ。「クエリ」と言う単語を使うことで、この違いを巧みに明確に示しているのだ。 当然ながら、人々はツイッターでツイートを検索している。しかし、多くの“検索”はまたツイッターのクライアントによって発せられる継続クエリでもある。例えば、自動的に誰かのアカウントへの全てのリプライを返すツイッターのツールは、マッチングに対して「検索」を行っている。 私はこの点は認めている。人間またはマシンからのリクエストをクエリとし、検索を人間が生成したクエリに限定する。ツイッターにクエリ全体の検索の数のみを伝えてもらうことが出来るなら、主要な検索エンジンとより正確に比較することが出来るのだ。 ツイッターが処理する自動のクエリを理解してもらうため、今年の前半に投稿したエントリ、「Twitter、1ヵ月に190億回検索を処理 Yahoo [...]