Adobe Analyticsの巨大CSVファイルを前処理するならPythonライブラリ「Dask」が便利 | 清水誠メモ

清水誠メモ - 2018年10月18日(木) 12:20
このページは、外部サイト 清水誠メモ の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「Adobe Analyticsの巨大CSVファイルを前処理するならPythonライブラリ「Dask」が便利」 からご覧ください。

ユーザー単位で分析するカスタマーアナリティクスの場合、Google AnalyticsやAdobe Analyticsの画面で表示できるレポート機能が物足りないので、Data Warehouseなどで生データ(に近い集計データ)を抽出してTableauで集計することが多いですが、データが巨大だとBIツールで読み込めません。そんな時にPythonで巨大ファイルを並列処理し、不要なカラムやレコードを削除してからBIで読み込む方法についてです。

メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

今日の用語

ワイヤーサービス
プレスリリースを、メディアに配信し、さらにサービス事業者のWebサイトや提携メデ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]