Tableauのディメンションを整形。「参照元/メディア」を分割し、地域をグループ化する #6
今回は、Viz(ビズ)を作成するためのディメンションとメジャーの整形方法を紹介します。なお、本記事ではWeb担当者ForumのGoogleアナリティクスと接続し、記事のビジュアル分析をしていくための方法を紹介しています。
ディメンションとメジャーの整形
木田: 前回は、TableauとGoogleアナリティクスを接続してみました。今回は、データの可視化、すなわちVizの作成を行いましょう。以下のような、まっさらのシートが皆さんの画面に表示されているはずです。
二村: 先生! あれ? ディメンションに「メジャーネーム」、メジャーに「レコード数」「経度(生成)」「緯度(生成)」「メジャーバリュー」という項目が増えてます。
木田: それは自動的に追加されるものなので気にしなくて大丈夫です。
ここから、「ディメンション」と「メジャー」の整形を行います。データをTableauに取り込んだ後、すぐデータを可視化できる場合もありますが、通常は“ビジュアライズを始める準備”として、「項目の分割」「名前の変更」「階層化やグルーピング」「数値形式の指定」といったさまざまな整形を行うのが一般的です。
木田:面倒な準備作業ではありますが、オリジナルのデータを希望の形で取り扱うことができるフレキシビリティの裏返しだと言えます。整形は一度実施すれば、通常は二度と行わなくて大丈夫なので、さっそくやっていきましょう。
ディメンションの整形
「参照元/メディア」を「参照元」と「メディア」に分割する
木田: まずディメンションの整形からとりかかります。Web担当者Forumのサイトにどんな経路でユーザーが訪れているのかを知るために「参照元/メディア」を整形していきます。まず「参照元/メディア」を行シェルフにドラッグ&ドロップして、入れてください。
木田: 「参照元/メディア」のデータがずらっと表示されたと思います。「参照元/メディア」という項目は1つにまとまっているので、これを「参照元」と「メディア」に分割してみましょう。これを分けないとオーガニックからどれくらい来ているのかすら、分析できませんからね。
項目名と同じく「/」(スラッシュ)でデータが区切られているのがわかります。あと、項目の右側に「Abc」という文字が並んでいますが、これは仮の表示なので、いまは無視してください。ちなみに、項目をドラッグ&ドロップしているときに、カプセル錠剤みたいな形になるので「ピル」と呼びます。
木田: では、画面左端エリアの「参照元/メディア」を右クリックしてください。ここから「変換→分割」を実行してください。整形などに使えるさまざまな機能がメニュー表示されます。このメニューは、右端の小さな三角形をクリックしても表示可能です。
木田: するとカスタム分割画面が表示されるので、区切り文字の使用で「/」、分割で「すべて」を選択して、「OK」で保存します。
木田: すると「参照元/メディア」の下に、新しく「参照元/メディア - 分割済み1」「参照元/メディア - 分割済み2」というディメンションが作成されます。
木田: 先ほどと同様に「参照元/メディア - 分割済み1」「参照元/メディア - 分割済み2」のピルを行シェルフに入れてみてください。すごく綺麗に「/」(スラッシュ)の前後で分割されました。これで「参照元」と「メディア」を1つずつ別のディメンションとして扱えるようになったことがわかります。
四谷: これはいいですね。
分割した項目の名前を変更する
木田: 「参照元/メディア - 分割済み1」「参照元/メディア - 分割済み2」のままだと使いづらいので、項目にあわせて名前を変更しましょう。これも、右クリックメニューを使います。変更したいディメンションを右クリックして、「名前の変更」を実行してください。書き換えができるようになるので、「参照元」「メディア」に変更します。
木田: 書き換えが完了すると、ディメンションの表示だけでなく、右側のシェルフの表示名、シートの表示名も、ちゃんと書き換わります。
「シートのクリア」をする
木田: ここでいったん、シートをクリアしましょう。画面上部に×マークのアイコンボタン「シートのクリア」または、シェルフにある「ピル」をシェルフ外にドラッグ&ドロップすることでもシートをクリアできます。
日別のセッション数をメディア毎で見る
木田: では、日別のセッション数をメディア毎に見てみましょう。列シェルフに「日付」、行シェルフに「セッション」、マーク(色)に「メディア」をドラッグ&ドロップしてください。
四谷: あれ、先生! データがおかしいです。「年」だけの表示になっちゃってます!
木田: 列シェルフの表示を見ると「年(日付)」となっていますよね。「年(日付)」を右クリック(または、右端の▽をクリック)してメニューから「日」に切り替えてください。表示が日単位に変わります。
四谷・二村: おー! 日別のグラフが表示されました。
ディメンションの階層化
メディアの下位階層に参照元を入れる
木田: 次に分割した項目を階層化して、分析しやすくしていきます。「メディア」というディメンションは、一番大きな分類に当たりますので、「メディア」が上位階層、「参照元」が下位階層となるよう、ディメンションを「階層化」してみましょう。まず「参照元」を掴んで「メディア」にドラッグ&ドロップしてください。
なぜ、「メディア」が上位階層になるかというと、たとえば「オーガニック」のなかに、「Google」「Yahoo」「Bing」などの参照元が含まれるからです。ですから、「メディア」は、「参照元」も含む大きな概念なんですね。
木田: 「階層の作成」というダイアログが表示されるので、そのままOKします。すると「メディア, 参照元」のなかに「メディア」「参照元」が入っている状態になりました。
木田: 「シートのクリア」を行って、改めて行シェルフに「メディア, 参照元」をドラッグ&ドロップすると、行シェルフの「メディア」を見ると、左側に+記号が付いています。その「+」をクリックしてください。
木田: 自動的に下位階層にある「参照元」が行シェルフに配置されて、シート上に各メディアの参照元がずらっと表示されます。階層化されたことで、データ分析の世界で言う、いわゆる「ドリルダウン」が可能になりました。縮めるときは-記号をクリックすれば元に戻ります(ドリルアップ)。
木田: ちなみに、ドリルダウンはシート上でも操作可能です。シート上の「メディア」にカーソルを乗せると+記号が表示されますので、そこをクリックすると各「メディア」の「参照元」を表示することもできます。
四谷: なるほど!
特定要素だけをまとめる「グルーピング」
木田: 次は地域毎のグループを作る「グルーピング」をやってみましょう。あまりWeb担さんだと必要ないかもしれませんが、こういうこともできるよ、ということで覚えておくといいでしょう。
まずシートをクリアして、まっさらな状態から始めます。ここでは、ディメンションの「地域」に属するメンバーを以下の4つにグルーピングします。
- Hokkaido、Miyagi
- Tokyo、Chiba、Kanagawa、Saitama
- Aichi、Osaka、Fukuoka
- それ以外の地域すべて
木田: 行シェルフに「地域」を入れてください。いろんな地域が表示されます。世界各国の州レベルの情報が入ってきていますが、日本の府県は基本的に「Prefecture」が付いています。
これらの地域名は、「ディメンション」のメンバーなので「ディメンションメンバー」と呼びます。地域という「ディメンション」のなかに、「東京都」とか「大阪府」とかの「ディメンションメンバー」がいるわけですね。ここは混同しないように注意しましょう。
ではシートの表示から、ディメンションメンバーの「Hokkaido」をクリックして選択状態にしてください。続いてCtrlキーを押しながら「Miyagi Prefecture」をクリックしてください。すると「2個の項目を選択済み」というメッセージが表示されます。この状態でメッセージ上にあるクリップのアイコンボタン「メンバーのグループ化」をクリックします。
木田: 新しく「地域(グループ)」というディメンションが作成されました。このデータを見ると「Hokkaido & Miyagi Prefecture」という新しい項目が作られています。
同様の操作で、「Tokyo、Chiba、Kanagawa、Saitama」のグループ、「Aichi、Osaka、Fukuoka」のグループを作ってください。
木田: 「地域(グループ)」のピルの上で右クリックし、メニューの「グループの編集」を実行すれば、先ほどとは違った方法で、グループの新規作成や名前の変更が可能です。
木田: 「地域(グループ)」のピルの上で右クリックし、メニューの「グループの編集」を実行すると、グループ編集ダイアログが表示されます。グループ名はABC順でリスト化されています。グループ化したものを選択し、フィールド名を変更するとグループ名が変更できます。
木田: グループ編集ダイアログでは、グループの追加、グループの削除、ディメンションメンバーの検索なども可能です。「その他のディメンションメンバー」はグループメンバーを、1つ1つ選んでいくやり方だと大変なので、「グループの編集」で作成しましょう。
グループ編集ダイアログで、「フィールド名」に「その他」と入力し、メンバーを該当するメンバーをCtrlキー(またはShiftキー)を押しながら選択すると複数選べます。選択後「'その他'を含める」をオンにします。すると残っていた他地域すべてをまとめた「その他」というグループになります。OKすると、グループが4つにまとまったことが確認できます。
木田: グループ分けできると、たとえば地域別のセッション数をグラフで表示することもできるようになります。いろいろな分け方ができると思いますので、ぜひいろいろなグルーピングを試してみてください。
最後に大事な「保存」を!
木田: 今回は、ディメンションの分割や名前の変更、階層化、グループ化などいろいろと学んできました。操作の仕方を少し理解してもらえたと思いますので、接続したデータを触ってみてください。思いがけない切り口や考え方が見つかるかもしれません。
それで、次回ここからの続きをスムーズに再開できるように、ここまでの作業を保存しておきましょう。「ファイル」メニューの「名前を付けて保存」を実行します。
木田: ファイルの種類を「Tableauパッケージドワークブック(*.twbx)」に切り替えて、わかりやすい名前で保存しておきましょう。
木田: Tableauの保存形式には次の2つがあります。
- Tableauパッケージドワークブック(*.twbx)
ビジュアライズに関する設定も保存されています。グラフの形式や色、使っているディメンションやメジャーといった“設計図”ですね。これらと一緒に実際のデータも保存されます。 - Tableauワークブック(*.twb)
ワークブックのほうは“設計図”しか保存されません。ですから、データを持っていない人ともやりとりする場合は、必ずパッケージドワークブックを選ぶ必要があります。
四谷・二村: なるほど! ありがとうございました。
次回は、ユーザータイプの分類、パラメータの除去を解説していきます。
ソーシャルもやってます!