01
節
CSVから分析する
Data StudioはCSVを取り込んで簡易統計分析を行う画面です。変数型を設定し、分析ウィザードで手法、変数、結果を順に確認します。
- scale
- nominal
- ordinal
- text
- date
02
節
対応する分析
記述統計、頻度表、相関分析、t検定、カイ二乗検定、線形回帰に対応します。テキストではトークン頻度、TF-IDF、チャート出力を扱えます。
03
節
CSVを入れる前に整えること
Data Studioに入れるCSVは、1行が1観測、1列が1変数になるように整えます。列名は短く、意味が分かり、記号や空白を使いすぎない名前にします。
欠損値、日付形式、カテゴリ名の表記揺れは、分析前に確認します。たとえば「Japan」「JP」「日本」が同じカテゴリを意味するなら、事前に統一します。
- 1行1観測にする
- 1列1変数にする
- 列名を短く明確にする
- 欠損値の表し方を統一する
- カテゴリ名の表記揺れを直す
04
節
分析結果の読み方
統計結果は、数値だけで判断せず、データの作られ方、サンプル数、変数の意味、外れ値の有無と一緒に読みます。相関があることは、因果関係があることを意味しません。
チャートは、読者に何を見せたいかを決めてから選びます。分布を見るならヒストグラム、カテゴリ比較なら棒グラフ、関係を見るなら散布図が基本です。