ｆ検定 – 分散比の検定｜ピーチ・ルーム

今回の主役は、平均ではなく分散です。フィッシャーさんが開発したＦ検定は、２つのデータ群の「ばらつきが等しいかどうか」を判定する検定。地味に見えますが、次回学習する「ペアではないｔ検定」の使い分けを決める、いわばｔ検定の前さばきを担う重要な検定です。

この記事で学習できること

Ｆ検定がなにを調べる検定なのか
分散比（Ｆ値）の考え方
ExcelのF.TEST関数での計算方法
分析ツールでの計算方法
ｔ検定との関係（なぜ先にＦ検定をするのか）

Ｆ検定はなにを調べるのか

たとえば、男性顧客と女性顧客の購入金額を比べたいとします。平均を比べる前に、まず確認しておきたいのが「２つのグループのばらつき方は同じだろうか？」という点です。

帰無仮説：２群の分散は等しい
対立仮説：２群の分散は等しくない

ばらつきが同じ（等分散）なら、次のｔ検定はステューデント方式。ばらつきが違うなら、ウェルチ方式。導入記事で紹介した、ゴセットさん→フィッシャーさん→ウェルチさんの歴史が、ここで一本の流れにつながってくるわけですね。

分散比（Ｆ値）の考え方

Ｆ検定の計算はシンプルで、２つの群の分散の比率を取るだけです。

Ｆ値 ＝ 一方の群の分散 ÷ もう一方の群の分散

もし２群のばらつきがまったく同じなら、Ｆ値はちょうど１になります。１から大きく離れるほど「分散が等しい」という仮説が怪しくなっていく、という理屈です。

さえちゃんＦ値が１に近ければ、ばらつきは「おそろい」ってことだね！

「どれだけ離れたら怪しいのか」の判定には、カイ２乗検定のときと同じように専用の分布表（Ｆ分布表）を使いますが、Excelで計算する分には、ｐ値を読むだけでOKです。

ExcelのF.TEST関数で計算する

=F.TEST(配列1, 配列2)

引数は２つのデータ範囲だけ。返ってくる値が、そのまま「２群の分散は等しい」という帰無仮説に対する両側検定のｐ値です。

ｐ値が0.05より小さい → 分散は等しくないと判断 → 次はウェルチのｔ検定へ
ｐ値が0.05以上 → 分散が等しくないとは言えない → 次はステューデントのｔ検定へ

分析ツールで計算する

リボンの「データ」→「データ分析」→「Ｆ検定: ２標本を使った分散の検定」でも計算できます。

こちらは片側検定として出力される点に注意してください。出力された「Ｐ(Ｆ<=ｆ) 片側」を２倍すると、F.TEST関数の結果（両側）とおおむね一致します。各群の分散・観測された分散比・Ｆ境界値まで一覧になるので、こちらもレポート用に便利です。

実務でのワンポイント

Ｆ検定は「分散の違いそのもの」を調べる目的でも使えます。

たとえば、２つの製造ラインで作られた製品の重量データ。平均が同じでも、ばらつきが大きいラインは品質が不安定だと評価できます。サービス業なら、応対時間のばらつきが大きい窓口は対応品質にムラがある、という見方もできますね。「平均は同じなのにクレームが多い」ようなケースの正体は、だいたい分散の方に隠れています。

まとめ

Ｆ検定は「２群の分散（ばらつき）が等しいか」を調べる検定
Ｆ値は分散の比率。１から離れるほど「等分散」が怪しくなる
ExcelならF.TEST関数で両側のｐ値が一発で出る
結果によって、次に使うｔ検定（ステューデント／ウェルチ）が決まる

これで、ペアではないｔ検定を迎え撃つ準備が整いました。次の記事で、ｔ検定シリーズの総仕上げです。おつかれさまでした。