基本統計量を作成しましょう。

  1. 新規にシートを作成「基本統計量」という名前にします。
  2. 下記のデータを入力しましょう。
  3. 合計は関数SUMを使ってだしましょう。
  4. 標本数は関数COUNTを使います。
    =COUNT(B2:B11) ・・・ 意味:範囲内の数値データの入っているセルの数を数えます。
  5. 平均は合計÷標本数で出しましょう。



  6. 平均の公式です。
少しわかりやすく表すと…

分散・標準偏差を求めましょう

分散や標準偏差はデータの散らばりぐあいを示す値です。平均値を基準にとり、そこからどのくらいデータがちらばっているかを調べます。データと平均値との差が重要になります。
  1. 分散の公式です。
さらにわかりやすく表すと…
分散は平均値との差の2乗和です。
標準偏差は分散の平方根で表されます。  
  1. 「基本統計量」のシートを開きます。
  2. C列にに身長−平均の式を入力します。
    (セル参照の式を作成して下にコピーする場合は、平均の入っているセルを絶対参照にします)
  3. D列に身長の2乗の式を入力します。
    (2乗は^2 キャレットを使います。)
  4. D12には差の2乗の合計を入力します。
  5. D13はD12を標本数−1の値で割ると、分散が求められます。
    ここで求めた分散は不偏分散といいます。
    データ数が多くなると、分散は一般には大きくなる傾向があります。これを修正するために(データ数−1)で割ります。
  6. さらにD14に標準偏差を作成します。
    標準偏差は分散の平方根です。 =SQRT(D13) の式で求められます。
  7. 下図のように作成して完成です。

では、この結果がエクセルで作成する「基本統計量」と一致するか?検証してみましょう!

  1. 「データ」リボンの「データ分析」を使って「基本統計量」の「統計情報」を作成します。
  2. 新しいシートに作成されるので、比較しやすいように「基本統計量」シートにコピーして比べてみましょう。

※ 実は分散には2つの算出方法があります。 VARPとVARです。

今回の身長のデータの場合、これを元にすべての人の傾向を算出するのであればVARを使います。
(このデータ数ではありえませんが、あくまでたとえです。)
また、このデータのグループだけの傾向を見たいのであればVARPを使います。
まずはVARを使って、エクセルの基本統計量と比べてみました。

では、VARPの方法で分散を算出してみましょう。
VARPの分散の公式は以下です。



式の分母の部分を実際の標本数にします。
D12の値を標本数である10で割ります。

ここでは、エクセル関数の中からVARPを使って、その結果を照合してみましょう。

まとめ
 (標本)分散 VARP サンプルについて言及したい場合
 不偏分散  VAR サンプルから母集団を推定したい場合(エクセルの基本統計量)

演習1:「date」シートの女性の身長データを元に上記の個別に計算する方法で基本統計量を算出してみましょう。
    ここではエクセルの基本統計量と照合する為にVARを使います。
   (新しいシートを作成して、そこにデータをコピーしてから作成します。シート名は「基本統計量2」とします。

演習2:上記の結果とエクセルの分析ツールの「基本統計量」のデータを比べてみましょう。

演習3:最初に作成した、平均点が同じクラスAとBの成績をVARPを使って分散の値を出し、2つのクラスを比較してみましょう。