Tableauを使い始めて、まずひっかかるのが、メジャー・ディメンションの概念だと思います。
Tableauに限らずBIツールでデータの「形式・型」をどのように保持するかが重要です。
今日は、メジャー・ディメンションを理解して、
データ分析に必須なデータの前処理を押さえておきましょう!
メジャー・ディメンションってなんだろう。。。
メジャーが数字データ
ディメンションが文字列や日付や地理データに区分されます
メジャー・ディメンションとは
Tableauの固有の表現です。
最初とっつきにくいですが、名前だと思って覚えましょう。
メジャーが数字データ(四則演算するような数字データ)
ディメンションが数字以外のデータ(文字列、日付、地理データ等)
という理解で始めは充分です。
Tableauの画面上では、以下の画像の場所をメジャー・ディメンションと定義しております。
カラム名の横にデータ型が青になっているのが、ディメンション
カラム名の横にデータ型が緑になっているのが、メジャー
★大事なポイント
データをどちらに振分するかは取込時に自動でしてくれるが
必ずしも正確ではないので、変更の必要がある
はい。ここがとても大事ポイントです。
実際に、このディメンションとメジャーがどういった定義なのかは前段で説明しましたが、
まず、データを取り込みしたらデータの各カラムから
Tableauが自動でメジャー・ディメンションに振り分けしてくれます。
サンプルを用意いたしました。
下記、画像の上段がExcelデータです。こちらをTableauに取り込むと、
まず、以下のようにメジャー・ディメンションの振り分けがされます。
ここで思い出してみましょう。
メジャーが数字データ(四則演算するような数字データ)
ディメンションが数字以外のデータ(文字列、日付、地理データ等)
定義としては、上記でしたね。
“都道府県名”や”元号”といったカラムは、[文字列]として認識してほしいので、ディメンションに振分けされていて問題なさそうですね。
また、”人口”のカラムについても、[数字]データでよさそうですね。四則演算するような性質のデータですよね。
では、”西暦”はどうでしょうか。数字なので、メジャー?
いえいえ、”西暦”を四則演算するような性質ではないので、ディメンションとして定義してほしいですね。
では、”都道府県コード”こちらは、どうでしょうか?
こちらも、数字ですが、あくまでも都道府県名に紐づく、固有値ですね。四則演算するような数字データではありませんので、こちらも、メジャーではなく、ディメンションに振分けしてほしいものですね。
どうですか、何が、メジャーで何をディメンションにしたらいいのかイメージがつきましたでしょうか?
これは、データ分析をするうえで、非常に大事な”データ持ち方”の考え方です。
メジャー・ディメンションの修正方法
ここでは、メジャー・ディメンションの修正方法についての紹介です。
修正方法は幾つかありますが、いずれも簡単です。
データ型を変更したいカラムを選択し、データ型を変更する
変更したいカラムをドラック&ドロップで移動
データの型を変更