ここからは、いよいよt検定の実践編です。最初に学習するのは、t検定の中でいちばん考え方がシンプルな「ペア(一対)の標本によるt検定」。前回の導入記事でいうと、パターン2にあたります。
この記事で学習できること
- 「ペア(対応のある)データ」とはなにか
- ペアのt検定の考え方
- ExcelのT.TEST関数での計算方法
- 分析ツールでの計算方法
- 結果(p値)の読み取り方
ペアとなるデータとは?
ペアのデータとは、同じ対象を2回測定したデータのことです。
- 薬の投与前と投与後の血液検査の数値
- 研修の受講前と受講後のテストの点数
- ダイエットプログラム開始前と終了後の体重
ポイントは「同じ人(同じ対象)の前後を比べている」こと。Aさんの投与前とAさんの投与後、Bさんの投与前とBさんの投与後……と、データが必ず1対1で対応しています。だから「対応のあるt検定」とも呼ばれます。
逆に、男性グループと女性グループの購入金額のように、別々の対象を比べる場合は「ペアではない」t検定になります。こちらは別の記事で学習しますので、まずはペアに集中しましょう。
考え方:差を取れば、話がシンプルになる
ペアのt検定の発想は、実はとてもシンプルです。
各ペアについて「後 − 前」の差を計算してしまいます。すると、2列あったデータが「差」の1列だけになりますね。
| 受講者 | 受講前 | 受講後 | 差(後−前) |
|---|---|---|---|
| Aさん | 62 | 71 | +9 |
| Bさん | 55 | 60 | +5 |
| Cさん | 70 | 69 | -1 |
| Dさん | 48 | 58 | +10 |
| Eさん | 66 | 72 | +6 |
もし研修にまったく効果がないなら、この「差」の平均は0付近になるはずです。そこで、
- 帰無仮説:差の平均は0である(効果なし)
- 対立仮説:差の平均は0ではない(効果あり)
として、「差の平均が0からどれだけ離れているか」を検定します。これがペアのt検定の正体です。差を取った時点で、データ群は1つになっているわけですから、考え方としては1標本t検定とほぼ同じなんですね。
ExcelのT.TEST関数で計算する
Excelでは、T.TEST関数で一発計算できます。
=T.TEST(配列1, 配列2, 尾部, 検定の種類)
- 配列1:受講前のデータ範囲
- 配列2:受講後のデータ範囲
- 尾部:両側検定なら「2」、片側検定なら「1」(迷ったら両側の「2」でOKです)
- 検定の種類:ペアのt検定は「1」
たとえば受講前がB2:B21、受講後がC2:C21に入っているなら、
=T.TEST(B2:B21, C2:C21, 2, 1)
この計算結果として返ってくるのが、そのままp値です。
分析ツールで計算する
リボンの「データ」→「データ分析」→「t検定: 一対の標本による平均の検定」を選ぶ方法もあります。
こちらはp値だけでなく、各群の平均・分散・t値・自由度まで一覧で出力してくれるので、レポートとして残すときに便利です。T.TEST関数は速報用、分析ツールは報告書用、という使い分けがおすすめです。
結果の読み取り方
有意水準を5%(0.05)とした場合:
- p値が0.05より小さい → 帰無仮説を棄却。「前後の差は統計的に有意」と判断
- p値が0.05以上 → 帰無仮説を棄却できない。「差があるとは言い切れない」と判断
p値の考え方そのものに不安がある方は、統計講座6の「p値」の記事に戻って復習してからの方が、すっと入ってくると思います。
まとめ
- ペアのデータ=同じ対象の前後比較
- 差を取ってしまえば、1標本の検定と同じ考え方になる
- ExcelならT.TEST関数の第4引数「1」で計算できる
ペアのt検定は、F検定による等分散の確認が不要です(差の1列に変換してしまうため、2群の分散を気にする必要がないからです)。この点でも、最初に学ぶt検定として最適なんですね。
次の記事では、比較したいグループが3つ以上あるときの話に進みます。実はそこに、t検定の意外な落とし穴が待っています。おつかれさまでした。
