Udemyで講座を受講しよう!
PeachRoom

母集団と標本 – 標本の抽出方法

Yujiro Sakaki

統計学では、データを母集団として扱うか、標本として扱うかによって、計算式の作成方法が若干異なります。

分析の前提となる母集団と標本について、基本をしっかりと押さえておきましょう。

Check Point

この記事で学習できること

  • 母集団
  • 標本
  • 5つの標本抽出法
    • 単純無作為抽出法
    • 系統抽出法
    • 多段抽出法
    • 集落抽出法(クラスター抽出法)
    • 層別抽出法

母集団は英語でpopulation、標本はsample。Excelの関数もPとSが末尾についているのは、母集団として計算するか、標本として計算するかを使い分けているんだよ

第5講座

母集団とは、研究や分析の対象となる全体のことを指します。例えば、ある国の全住民、特定の企業の全従業員などが母集団にあたります。

しかし、母集団のデータを集めることは不可能に近いため、より小さな「標本」を利用して分析を行うのが一般的です。

新型コロナウイルスの蔓延で在宅業務を余儀なくされた2020年度の国勢調査ですら、回収率は81.3%でした。国勢調査のような大規模な調査でも、母集団全体のデータを完全に収集することは難しいのです。

ですので、母集団データを扱う機会は極めて稀なことなのです。

標本とは?

標本とは、母集団の一部の要素の集合データを指します。この標本を用いることで、母集団全体の特性を推測することができます。

一般的には、収集したデータを標本として分析をすることがほとんどなので、母集団と標本の話はここでおしまいですが、もう少し深堀していきましょう。

母集団から標本データを抽出する、というケースも考えてみましょう。母集団から標本データを抽出するときに重要なことは、標本データに偏りがあってはいけません

ここでは、調査の候補が決まっていて、けれども偏りなく標本を抽出するためにはどうしたらいいか? その標本抽出法について、代表的な5つの抽出法をご紹介します。

5つの標本抽出法

標本を抽出する方法は、主に5つの方法が挙げられます。

単純無作為抽出法

この方法では、母集団の各要素が等しい確率で選ばれます。

例えば、Excelなどを用いて母集団データにそれぞれ乱数を発生させます。各データと紐づけ、昇順に並び替えて上位100名を選出する、という方法がこれにあたります。

等しい確率で出力されることを前提にしているため、真の乱数かどうかは別の議論になります。乱数が本当に乱数なのか? を証明する話はまだまだ先ですね。でも、面白いのでお楽しみに!

系統抽出法

母集団を一定の順序で並べ、定期的な間隔で要素を選択します。例えば、ある列に並んだ人々から、10人ごとに1人を選ぶ場合がこれに該当します。

手元にコンピューターがないときに使える便利な手法でもあります。

多段抽出法

これは、複数の段階を経て標本を選びます。例えば、まず都道府県をランダムに選び、そして地域を選んで、調査地区を設定するようなイメージです。

都道府県の全数調査をする場合、コストや人件費などが莫大にかかります。それをできるかぎり緩和させるため、このように調査範囲を絞り込んでいく方法です。

ただし、多段抽出法は偏りが出やすいので、厳密なランダムではなく、前もって調査地区の規模をグルーピングしてから抽出したほうがいいでしょう。恣意的な操作が入る場合もありますが、偏りを防ぐための調整であれば問題ありません。

都市部ばかりの抽出になってしまったら、それこそ問題ですからね。

集落抽出(クラスター抽出)法

母集団を似たようなグループ(クラスター)に分け、ランダムにいくつかのクラスターを選び、選ばれたクラスター内の全要素を調査します。

例えば、特定の地域のいくつかの学校を選び、その学校内の全生徒を調査するようなイメージです。こちらも偏りが想定されますが、選ばれたクラスター内で全数調査を行えるため、コストや労力の削減が可能です。

私が小学生のときも、そういえば何かの調査対象として選ばれたらしく、ピンク色をした紙にアンケートを取った記憶がありますね。

何のアンケートだったかは覚えがないのですが…。

クラスターとは、ブドウの房をイメージした言葉なんですよ

層別抽出法

母集団を、異なる特徴を持つ層に分け、各層からランダムに標本を抽出します。これにより、母集団の多様性を標本に反映させることができます。

代表的なのは、大学でアンケートを取る際、その大学生の男女比率が6:4であれば、アンケートも男女6:4で取るといった具合です。男性3、女性7の割合でアンケートを取得したら、女性の意見の偏りが出てしまいますからね。

以上、5つの標本抽出方法でした。

まとめ

母集団と標本は、統計学において基本的な概念です。

また、標本の抽出方法を覚えておくことで、偏りのない標本抽出が可能となるでしょう。5つの抽出法は、統計の現場でなくてもワークショップやセミナー、パーティーなどでも応用できそうですよね。

以上、母集団と標本についての学習でした。母集団と標本について、そして標本の抽出方法を5つ、しっかりと覚えておいてください。

次の記事は、母集団で求める分散と標本で求める分散に入ります!

Advertisement
ABOUT ME
榊 裕次郎
榊 裕次郎
Excel講師
1981年10月生まれのてんびん座、東京都出身。趣味は、旅行と料理とワイン。2024年は、佐賀県に行って「呼子のイカ」を思いっきり食べたいです。

引き続き、青森・秋田・岩手でのお仕事ご依頼、お待ちしております!
記事URLをコピーしました