少しわかりやすく表すと…
分散や標準偏差はデータの散らばりぐあいを示す値です。平均値を基準にとり、そこからどのくらいデータがちらばっているかを調べます。データと平均値との差が重要になります。
さらにわかりやすく表すと…
分散は平均値との差の2乗和です。
標準偏差は分散の平方根で表されます。
では、この結果がエクセルで作成する「基本統計量」と一致するか?検証してみましょう!
※ 実は分散には2つの算出方法があります。 VARPとVARです。
今回の身長のデータの場合、これを元にすべての人の傾向を算出するのであればVARを使います。
(このデータ数ではありえませんが、あくまでたとえです。)
また、このデータのグループだけの傾向を見たいのであればVARPを使います。
まずはVARを使って、エクセルの基本統計量と比べてみました。
では、VARPの方法で分散を算出してみましょう。
VARPの分散の公式は以下です。
式の分母の部分を実際の標本数にします。
D12の値を標本数である10で割ります。
ここでは、エクセル関数の中からVARPを使って、その結果を照合してみましょう。
まとめ
(標本)分散 VARP サンプルについて言及したい場合
不偏分散 VAR サンプルから母集団を推定したい場合(エクセルの基本統計量)
演習1:「date」シートの女性の身長データを元に上記の個別に計算する方法で基本統計量を算出してみましょう。
ここではエクセルの基本統計量と照合する為にVARを使います。
(新しいシートを作成して、そこにデータをコピーしてから作成します。シート名は「基本統計量2」とします。
演習2:上記の結果とエクセルの分析ツールの「基本統計量」のデータを比べてみましょう。
演習3:最初に作成した、平均点が同じクラスAとBの成績をVARPを使って分散の値を出し、2つのクラスを比較してみましょう。