Udemyで講座を受講しよう!
PeachRoom

統計学の初学者に難しい「p値」を理解しよう!

Yujiro Sakaki

統計学の講座を行っている中で、多くの方がp値の理解に苦労しています。実際、私もこの値の意味を理解するまで、かなりの時間を要しました。

理解できたようで、説明ができない。p値とは、そういった値だと思います。

統計学の講座を最初に担当したとき、わかりやすいようになかなか指導できず、悶絶していました。今ですら、限られた時間内での説明は緊張の連続です。

それではまず、この「p値」の読み方から紐解いていきましょう。

Check Point

この記事で学習できること

  • p値の読み方
  • p値とは何か?
  • 有意水準「α(アルファ)」
  • p値の捉え方

p値の読み方

英語では「p-value」(probability-valueの略)と表記されることが多いため、これを日本語のカタカナ読みに直すと「ピーバリュー」。

これが最もふさわしい読み方です。

統計学の書籍では「p値」の読み方が明記されていないので、この時点で初学者にとってひとつのハードルが用意されています。

それでは最初のハードルを乗り越えたので、このp値について理解していきましょう。

p値は、偶然の起きる確率

p値とは、私たちが観測したデータが、単なる偶然によるものかどうかを測るための確率の値です。

例えば、サイコロを投げて連続して「3」が出る確率を考えてください。サイコロが公平なら、連続して「3」が出る確率は非常に低いです。

では、サイコロを50回振って「3」が15回出たらどうでしょう?

このサイコロは公平なのかどうか? 疑問を投げかけます。本当にこのサイコロはちゃんとしたサイコロなのか? イカサマダイスじゃないのかな?

p値が高ければ、観測された結果が偶然によるものである可能性が高いと解釈されます。

つまり、公平だと言えるわけです。p値が低ければ、偶然性が低い、つまりイカサマダイスである可能性が疑われます。

しかし、ここで難しいのが、p値はあくまで「データが偶然によるものかどうか」を測る指標であり、必ずしも「真実」を示すものではないのです。

偶然が重なることもあります。ゲームの場合には「運」の要素が含まれていることもあるからです。だから、p値の捉え方が難しいんですね。

では、p値が高い・低いを決めるボーダーラインについて、次なる用語、有意水準(ゆういすいじゅん)を解説をいたします。

有意水準(ゆういすいじゅん)

有意水準とは、偶然による可能性のボーダーラインを決定する水準です。一般的に、このボーダーラインは5%とされています。

ギリシャ文字の α(アルファ)を使って、

α = 0.05

と表現します。これは、偶然によるものと判断する確率の上限を意味します。

有意水準が低い(例えば、α = 0.01)ほど、その結果が偶然によると判断するのに厳しい基準を設けていることになります。

有意水準1%、医療統計では厳格なこの基準を使いますね。

逆に、有意水準が高い(例えば、α = 0.10)場合は、より柔軟な基準を設けていることになります。

有意水準10%、緩めにボーダーラインを引いて、判断を間違えたとしてもさほど損害は出ないだろう、というときこの水準を使ったりします。ですので、

α = 0.01 (有意水準1%)

α = 0.05 (有意水準5%)

α = 0.10 (有意水準10%)

有意水準は、この3種類を使い分けると覚えておきましょう。この有意水準の設定は、統計的な分析において、非常に重要な手順となります。

有意水準を設定してから分析

分析の際、事前に定めた有意水準に基づいて結果を評価します。先に設定をしないと、出力されたp値と有意水準を比較して、恣意的な評価をしてしまいますからね。

例えば、α = 0.05と設定した場合、その数値を基準にして、結果が偶然によるものかどうかを判断します。

計算結果が α よりも大きければ、その結果は偶然による可能性が高いと考えられ、α よりも小さければ偶然による可能性が低いと判断されます。

有意水準は、一般的に5%が採用されます。

ここまでの記事で、偶然性の高い・低いがp値で、それを判断する有意水準というボーダーラインを学習しました。

それでは、ちょっとした練習問題を用意しましたので、さらにp値を深めていきましょう。

ちょっとした練習問題

私のエクセル講座で、受講生の満足度調査を行ったとします。

アンケート調査数54人で「満足:34人」「普通:14人」「不満:6人」でした。Excelを使って計算をすると、p値は約0.4%と算出されました。

CHISQ.TEST(カイスクエア・テスト)関数というものを使って算出するため、この関数の説明だけで1つの記事が出来上がってしまいます。

そのため、p値の算出方法については割愛させていただきます。p値の計算方法は、また別の記事で記載します。

p値 = 約0.4%

さあ、この値からここまでの記事より、どのようなことが説明できるでしょうか? ちょっとだけ考えてみてください。

練習問題の解説

p値 = 約0.4%

この値より、満足度調査における偶然性は限りなく低い、と見ることができます。では、ちょっとややこしくなりますが、ここからイカサマダイスの話になぞらえます。

このアンケート結果は、イカサマダイスのように偏った目が出ている! ということになります。つまり、この満足度の内訳は、偶然性が低いとp値から言えるわけです。

サイコロは、偶然性が高くなければゲームに支障をきたしますが、アンケート結果はp値が低いほうが偶然性が低い=きちんとした結果となって表れている、と評価することができますよね。

p値が低いと、統計的に意義があると言えます。

この意義を、統計用語では「有意(意味が有る)」であると表現します。つまり、有意水準とは、意味のある水準というわけです。

しかし、p値が低い=統計的に意義があると判断できますが、これが必ずしも実用的な意義を持つとは限りません。

例えば、p値が低くても、その効果の大きさや実用的な重要性は、別途評価する必要があるからです。

講座の成功は、満足した人数が80%未満であれば、目標未達成。何が足らなかったのかを反省し、講座の改善をしなければなりません。また、不満が10%未満であれば目標達成、という基準を引いていれば、今回は成功と言えます。

つまり、p値だけにフォーカスするのではなく、すべての状況から総合的に判断する必要があります。点ではなく、面で物事を判断しないといけないのです。

「アンケート結果は、そのときよけりゃいいんだよ」

こういう声も聞こえてきます。確かにそうなのですが、アンケート結果がよくても「たまたまよかった」という結果では、次回以降の講座が心配です。

次の講座のためにも、意味のあるアンケート結果が欲しいですよね。

帰無仮説と対立仮説へ

さて、ここまでがp値の話ですが、実は仮説検定というお話で、帰無仮説と対立仮説の話の中に、p値がごっそりと関わっていきます。

まずは、ここまでの内容を理解してください。この次に帰無仮説と対立仮説をお話ししますので、そこでp値がさらに理解できるはずです。

今回の記事はここまで、ご一読お疲れさまでした!

Advertisement
ABOUT ME
榊 裕次郎
榊 裕次郎
Excel講師
1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2024年は、佐賀県に行って「呼子のイカ」を思いっきり食べたいです。

引き続き、青森・秋田・岩手でのお仕事ご依頼、お待ちしております!
記事URLをコピーしました