母平均を推察する標準誤差
講座レビューを毎日受け取っている私にとって、標準誤差(ひょうじゅんごさ)という値は、不確実なデータから信頼する情報を引き出すための重要な指標です。
この記事で学習できること
- 標準誤差
英語では「Standard Error(スタンダード・エラー)」と呼ばれ、「SE」と略されることもあります。では、標準誤差が何故重要なのか、学習してきましょう。
実際に数字を追っていないと伝わりづらいのですが、「平均値に引き戻す力」が存在するんだ
第7講座
標準誤差は、母集団の平均値を標本に基づいて推定する際に用いられる指標です。
例えば5段階評価で、私の講座を受講した30人から得られたレビューの平均値が「4.3」だとします。
標準誤差が「±0.3」と算出された場合、母集団の平均レビュー値は「4.0~4.6」の間にあると推定できます。
この推定値は、現時点のサンプルに基づくもので、将来的に変わる可能性があります。
しかし、短期間(例えば3カ月程度)は、この範囲内に収束すると考えることができ、日々の評価を見る際の大きな安心材料となるわけです。
悪い評価を受けたとしても、最終的には推定範囲内に戻るから大丈夫! と考えられるだけで、ストレスを軽減することができます。これが「平均値に戻す力」なのです。
その力は、受講した人が多ければ多くなるほど強くなっていきます。
標準誤差の計算方法
標準誤差の計算式は、以下のとおりです。
標準誤差 = 標準偏差 ÷ √ データの件数
標準偏差は、平均値からのばらつきを示し、データの件数を平方根で割ることで、サンプルサイズの影響を適切に考慮します。
例えば、高校3年生男子の平均身長が170cm、標準偏差が5cm、サンプルサイズが25人の場合、標準誤差は「5÷√25」→「5÷5」で1cmになります。つまり、全国の男子高校3年生の平均身長は、169cmから171cmの範囲に収まると推定できます。
標準偏差は、分散の平方根であることを思い出してみてね。標準偏差をデータの件数の平方根で割ることで、標準誤差が計算されるんだよ。平方根がつきまとうので、しっかりついてきてね!
標準偏差をデータ件数の平方根で割る意味
標準偏差は、データの平均からどれだけばらついているかを表す指標で、1σ(シグマ)として表されることは学習しました。
データがどれだけばらついているかを示すこの指標は、サンプルの数が増えても変わりません。しかし、サンプルの数が増えることで、平均値の精度は上がっていきます。
これは、サンプル数が増えるほど母集団に近づくためです。
ただし、サンプルサイズが倍になったとしても、その分だけ平均値の信頼性が倍になるわけではありません。サンプル数を2倍にした場合でも、平均値の信頼性の向上はそれに比例せず、より小さな増加にとどまります。
信頼性の向上は、サンプルサイズの平方根に比例するということがわかっています。
例えば、先ほどの高校生の身長の例では、データを100人に増やしても、信頼性の向上は4倍にはなりません。これがより小さな増加なんですね。つまり、サンプル数が4倍になったとしても、標準誤差は2倍小さくなるだけなんですね。
サンプル数が増えると、平均値の推定精度は向上しますが、その効果はサンプルサイズの平方根に従って、徐々に減少していきます。
これが、信頼性の向上が「小さな増加にとどまる」理由です。
まとめ
標準誤差はレビューを受けている人たちにとって、非常に強力な値だと信じています。
ただ、繰り返しになりますが、標準誤差は現時点で計測した推定母平均であり、未来永劫この値が留まらないということを覚えておいてください。
私自身も平均レビュー4.3を維持するために、わかりやすい指導を心がけていきますね。
定期的に標準誤差をチェックするのは大切なことですね!