コメント投稿

グーグルのクラウドを支えるテクノロジー > 第66回 サーチエンジンのロードバランシング・アルゴリズム(パート3)

CTC教育サービス 2019/9/19 7:51 印刷用
よろしければこちらもご覧ください
※この記事は読者によって投稿されたユーザー投稿のため、編集部の見解や意向と異なる場合があります。また、編集部はこの内容について正確性を保証できません。

CTC教育サービスはコラム「グーグルのクラウドを支えるテクノロジー > 第66回 サーチエンジンのロードバランシング・アルゴリズム(パート3)」を公開しました。

###

はじめに
 前回に引き続き、2019年に公開された論文「Cache-aware load balancing of data center applications」を元にして、サーチエンジンのロードバランシングに関するアルゴリズムを紹介します。今回は、検索処理システムのシミュレーターを用いた評価結果を見ていきます。
シミュレーターによるキャッシュミスの測定
 これまで説明してきたように、このアルゴリズム(TARS)の目的は、検索処理サーバーが、ある単語についてのPL(検索結果の候補となるWebサイトのID番号の集合)取得する際に、そのデータがメモリー上のキャッシュに保存されている確率を高めて、データベースへのアクセス量を減らすことです。つまり、キャッシュミスの割合をできるだけ低くすることがゴールとなります。
 ここで、前回の図1で説明した仕組みを思い出してみましょう。そこでは、サーバーごとに担当する単語を設定しておき、自身が担当する単語についてはキャッシュミスは発生せず、逆に、担当しない単語については、一定の確率でキャッシュミスが発生するという素朴な仮定を置いていました。その上で、過去の検索文に含まれる単語の組み合わせを用いて、キャッシュミスを最小化するようにサーバーごとに割り当てる単語のグループ分けを行いました。

この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai266.html

よろしければこちらもご覧ください
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

XMLサイトマップ
検索エンジンに対して、サイト内にあるページをリストアップして伝えるファイル。XM ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]