グーグルのクラウドを支えるテクノロジー > 第95回 Dremel:10年間の進化を振り返る(パート2)

※この記事は読者によって投稿されたユーザー投稿のため、編集部の見解や意向と異なる場合があります。また、編集部はこの内容について正確性を保証できません。

CTC教育サービスはコラム「グーグルのクラウドを支えるテクノロジー > 第95回 Dremel:10年間の進化を振り返る(パート2)」を公開しました。

###

はじめに
 前回に続いて、2020年に公開された論文「Dremel: A Decade of Interactive SQL Analysis at Web Scale」を紹介していきます。論文のタイトルある「Dremel」は、Google社内のデータ分析ツールの名称で、Google Cloud Platformで提供されているBigQueryは、このDremelが元になっています。

Dremelのアーキテクチャーの特徴
 前回の記事でも触れたように、この論文では、2010年以降のDremelのアーキテクチャーの変化を紹介しており、現在のDremelの特徴を次の5つの観点から説明しています。

・ANSI準拠のSQL
・計算リソースとストレージリソースの分離
・In situ(イン・サイチュ)分析
・サーバーレスシステム
・カラム型ストレージ

 今回は、「In situ(イン・サイチュ)分析」と「サーバーレスシステム」の2つについて解説します。

In situ分析
 In situ分析というのは、分析専用のデータベースにデータをアップロードして分析するのではなく、他のアプリケーションが使用する既存のデータをそのままの形で分析するという考え方です。特にGoogle社内には、MapReduceなど、さまざまなデータ処理ツールがあります。たとえば、MapReduceが出力したデータをそのままの形で分析できれば、膨大なデータをアップロードする時間を節約することができます。

この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai295.html

これは広告です
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

XMLサイトマップ
検索エンジンに対して、サイト内にあるページをリストアップして伝えるファイル。XM ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]