t検定シリーズの総仕上げです。今回は、男性顧客と女性顧客、店舗Aと店舗Bのように、別々の対象を比べるt検定。ペアのt検定と違ってデータに対応関係がないため「独立した2標本のt検定」とも呼ばれます。導入記事のパターン3・パターン4に該当する内容です。
この記事で学習できること
- 「ペアではない」データとはなにか
- ステューデントのt検定とウェルチのt検定の使い分け
- ExcelのT.TEST関数での計算方法
- 分析ツールでの計算方法
- t検定シリーズ全体の総まとめ
ペアではないデータとは?
ペアのt検定では「同じ対象の前後」を比べました。今回は別々のグループ同士の比較です。
- 男性顧客と女性顧客の平均購入金額
- 店舗Aと店舗Bの平均客単価
- 研修を受けたチームと受けていないチームの成績
データが1対1で対応していないので、人数が違っていても構いません(男性30人と女性42人、でもOKです)。
手順:まずF検定、それからt検定
ペアではないt検定には、2つの方式がありました。
- ステューデントのt検定:2群の分散が等しいと仮定できる場合
- ウェルチのt検定:2群の分散が等しくない場合
どちらを使うかを決めるのが、前回学習したF検定です。流れを整理すると、こうなります。
- F.TEST関数で2群の分散を検定する
- p値が0.05以上 → 等分散とみなしてステューデント
- p値が0.05より小さい → ウェルチ
ちなみに近年の統計学では「最初からウェルチを使えばよい」という考え方も有力です。ウェルチのt検定は等分散でも問題なく機能するためです。ただ、Excelの実務やビジネス統計の試験では上記の2段階方式が標準ですので、まずはこの流れで覚えておきましょう。
ExcelのT.TEST関数で計算する
ペアのt検定と同じT.TEST関数を使います。違いは第4引数だけです。
=T.TEST(配列1, 配列2, 尾部, 検定の種類)
- 検定の種類「2」:等分散を仮定した2標本(ステューデント)
- 検定の種類「3」:分散が等しくないと仮定した2標本(ウェルチ)
たとえば男性の購入金額がB2:B31、女性がC2:C43に入っていて、F検定で等分散と判断できたなら、
=T.TEST(B2:B31, C2:C43, 2, 2)
返ってくる値がp値です。0.05より小さければ「男女の平均購入金額には統計的に有意な差がある」と判断します。
分析ツールで計算する
分析ツールにも、それぞれ専用のメニューが用意されています。
- 「t検定: 等分散を仮定した2標本による検定」(ステューデント)
- 「t検定: 分散が等しくないと仮定した2標本による検定」(ウェルチ)
出力には各群の平均・分散・観測数・t値・p値(片側/両側)がまとまります。レポートに添付するなら、F検定の結果と合わせて「等分散性を確認した上でこの方式を選んだ」と書けると、分析の説得力がぐっと上がりますよ。
t検定シリーズ 総まとめ
ここまでの5記事で、導入記事のパターン1〜5がすべてつながりました。
| 比べたいもの | 使う手法 | Excel |
|---|---|---|
| 基準値と手元のデータ | 1標本t検定 | T.DIST系関数で対応 |
| 同じ対象の前後 | ペアのt検定 | T.TEST(種類1) |
| 別々の2群(等分散) | ステューデントのt検定 | T.TEST(種類2) |
| 別々の2群(非等分散) | ウェルチのt検定 | T.TEST(種類3) |
| 3群以上 | 一元配置分散分析 | 分散分析: 一元配置 |
迷ったら、まず「データはペアか、独立か、3群以上か」を確認する。独立した2群なら、F検定で分散をチェックしてから方式を選ぶ。この順番さえ覚えておけば、t検定で道に迷うことはもうありません。
長かったt検定シリーズ、これにて完結です。おつかれさまでした!
