Home / ピーチ・ルーム / t検定 – ペアとなるデータ群の検定
PeachRoom — 統計講座8

t検定 – ペアとなるデータ群の検定

ここからは、いよいよt検定の実践編です。最初に学習するのは、t検定の中でいちばん考え方がシンプルな「ペア(一対)の標本によるt検定」。前回の導入記事でいうと、パターン2にあたります。

この記事で学習できること

  • 「ペア(対応のある)データ」とはなにか
  • ペアのt検定の考え方
  • ExcelのT.TEST関数での計算方法
  • 分析ツールでの計算方法
  • 結果(p値)の読み取り方

ペアとなるデータとは?

ペアのデータとは、同じ対象を2回測定したデータのことです。

  • 薬の投与前と投与後の血液検査の数値
  • 研修の受講前と受講後のテストの点数
  • ダイエットプログラム開始前と終了後の体重

ポイントは「同じ人(同じ対象)の前後を比べている」こと。Aさんの投与前とAさんの投与後、Bさんの投与前とBさんの投与後……と、データが必ず1対1で対応しています。だから「対応のあるt検定」とも呼ばれます。

逆に、男性グループと女性グループの購入金額のように、別々の対象を比べる場合は「ペアではない」t検定になります。こちらは別の記事で学習しますので、まずはペアに集中しましょう。

さえちゃんさえちゃん同じ人の「前」と「後」をくらべるから、ペアって呼ぶんだね!

考え方:差を取れば、話がシンプルになる

ペアのt検定の発想は、実はとてもシンプルです。

各ペアについて「後 − 前」のを計算してしまいます。すると、2列あったデータが「差」の1列だけになりますね。

受講者受講前受講後差(後−前)
Aさん6271+9
Bさん5560+5
Cさん7069-1
Dさん4858+10
Eさん6672+6

もし研修にまったく効果がないなら、この「差」の平均は0付近になるはずです。そこで、

  • 帰無仮説:差の平均は0である(効果なし)
  • 対立仮説:差の平均は0ではない(効果あり)

として、「差の平均が0からどれだけ離れているか」を検定します。これがペアのt検定の正体です。差を取った時点で、データ群は1つになっているわけですから、考え方としては1標本t検定とほぼ同じなんですね。

ExcelのT.TEST関数で計算する

Excelでは、T.TEST関数で一発計算できます。

=T.TEST(配列1, 配列2, 尾部, 検定の種類)

  • 配列1:受講前のデータ範囲
  • 配列2:受講後のデータ範囲
  • 尾部:両側検定なら「2」、片側検定なら「1」(迷ったら両側の「2」でOKです)
  • 検定の種類:ペアのt検定は「1

たとえば受講前がB2:B21、受講後がC2:C21に入っているなら、

=T.TEST(B2:B21, C2:C21, 2, 1)

この計算結果として返ってくるのが、そのままp値です。

分析ツールで計算する

リボンの「データ」→「データ分析」→「t検定: 一対の標本による平均の検定」を選ぶ方法もあります。

こちらはp値だけでなく、各群の平均・分散・t値・自由度まで一覧で出力してくれるので、レポートとして残すときに便利です。T.TEST関数は速報用、分析ツールは報告書用、という使い分けがおすすめです。

結果の読み取り方

有意水準を5%(0.05)とした場合:

  • p値が0.05より小さい → 帰無仮説を棄却。「前後の差は統計的に有意」と判断
  • p値が0.05以上 → 帰無仮説を棄却できない。「差があるとは言い切れない」と判断

p値の考え方そのものに不安がある方は、統計講座6の「p値」の記事に戻って復習してからの方が、すっと入ってくると思います。

まとめ

  • ペアのデータ=同じ対象の前後比較
  • 差を取ってしまえば、1標本の検定と同じ考え方になる
  • ExcelならT.TEST関数の第4引数「1」で計算できる

ペアのt検定は、F検定による等分散の確認が不要です(差の1列に変換してしまうため、2群の分散を気にする必要がないからです)。この点でも、最初に学ぶt検定として最適なんですね。

次の記事では、比較したいグループが3つ以上あるときの話に進みます。実はそこに、t検定の意外な落とし穴が待っています。おつかれさまでした。

ピーチ・ルームの一覧へ