Home / ピーチ・ルーム / t検定 – ペアではないデータ群の検定
PeachRoom — 統計講座8

t検定 – ペアではないデータ群の検定

t検定シリーズの総仕上げです。今回は、男性顧客と女性顧客、店舗Aと店舗Bのように、別々の対象を比べるt検定。ペアのt検定と違ってデータに対応関係がないため「独立した2標本のt検定」とも呼ばれます。導入記事のパターン3・パターン4に該当する内容です。

この記事で学習できること

  • 「ペアではない」データとはなにか
  • ステューデントのt検定とウェルチのt検定の使い分け
  • ExcelのT.TEST関数での計算方法
  • 分析ツールでの計算方法
  • t検定シリーズ全体の総まとめ

ペアではないデータとは?

ペアのt検定では「同じ対象の前後」を比べました。今回は別々のグループ同士の比較です。

  • 男性顧客と女性顧客の平均購入金額
  • 店舗Aと店舗Bの平均客単価
  • 研修を受けたチームと受けていないチームの成績

データが1対1で対応していないので、人数が違っていても構いません(男性30人と女性42人、でもOKです)。

手順:まずF検定、それからt検定

ペアではないt検定には、2つの方式がありました。

  • ステューデントのt検定:2群の分散が等しいと仮定できる場合
  • ウェルチのt検定:2群の分散が等しくない場合

どちらを使うかを決めるのが、前回学習したF検定です。流れを整理すると、こうなります。

  1. F.TEST関数で2群の分散を検定する
  2. p値が0.05以上 → 等分散とみなしてステューデント
  3. p値が0.05より小さい → ウェルチ
さえちゃんさえちゃんまずF検定でばらつきをチェック、それから方式を選ぶ。順番が大事だね!

ちなみに近年の統計学では「最初からウェルチを使えばよい」という考え方も有力です。ウェルチのt検定は等分散でも問題なく機能するためです。ただ、Excelの実務やビジネス統計の試験では上記の2段階方式が標準ですので、まずはこの流れで覚えておきましょう。

ExcelのT.TEST関数で計算する

ペアのt検定と同じT.TEST関数を使います。違いは第4引数だけです。

=T.TEST(配列1, 配列2, 尾部, 検定の種類)

  • 検定の種類「2」:等分散を仮定した2標本(ステューデント)
  • 検定の種類「3」:分散が等しくないと仮定した2標本(ウェルチ)

たとえば男性の購入金額がB2:B31、女性がC2:C43に入っていて、F検定で等分散と判断できたなら、

=T.TEST(B2:B31, C2:C43, 2, 2)

返ってくる値がp値です。0.05より小さければ「男女の平均購入金額には統計的に有意な差がある」と判断します。

分析ツールで計算する

分析ツールにも、それぞれ専用のメニューが用意されています。

  • t検定: 等分散を仮定した2標本による検定」(ステューデント)
  • t検定: 分散が等しくないと仮定した2標本による検定」(ウェルチ)

出力には各群の平均・分散・観測数・t値・p値(片側/両側)がまとまります。レポートに添付するなら、F検定の結果と合わせて「等分散性を確認した上でこの方式を選んだ」と書けると、分析の説得力がぐっと上がりますよ。

t検定シリーズ 総まとめ

ここまでの5記事で、導入記事のパターン1〜5がすべてつながりました。

比べたいもの使う手法Excel
基準値と手元のデータ1標本t検定T.DIST系関数で対応
同じ対象の前後ペアのt検定T.TEST(種類1)
別々の2群(等分散)ステューデントのt検定T.TEST(種類2)
別々の2群(非等分散)ウェルチのt検定T.TEST(種類3)
3群以上一元配置分散分析分散分析: 一元配置

迷ったら、まず「データはペアか、独立か、3群以上か」を確認する。独立した2群なら、F検定で分散をチェックしてから方式を選ぶ。この順番さえ覚えておけば、t検定で道に迷うことはもうありません。

長かったt検定シリーズ、これにて完結です。おつかれさまでした!

ピーチ・ルームの一覧へ