第8章 8-2 / データの収集:実験・観察・調査

実験研究と観察研究

このページで学ぶこと

前回はPPDACサイクルと「目的と目標」の話でした。今回からはより具体的に、データの集め方を見ていきます。

データを集める方法は、大きく分けて実験研究観察研究の2つがあります。本ページでは、それぞれの違い、処理群と対照群の発想、プラセボを使った臨床試験、そして5-3でも登場した統計学者フィッシャーが提唱した「実験計画の三原則」を整理します。

1. 実験研究と観察研究 ─ 2つのアプローチ

データを集めるとき、大きく分けて2つのアプローチがあります。実験研究観察研究です。両者の違いは、「研究者が条件を操作するかどうか」にあります。

実験研究

実験研究(experimental study)は、研究者が能動的に条件を操作してデータを取る研究です。「ある条件を加えると、結果がどう変わるか」を確かめるのが目的です。

実験研究の特徴は、「原因を意図的に作り出して、結果を観測できる」こと。だから、第4章で学んだ「因果関係」に近づきやすいのです。

観察研究

観察研究(observational study)は、研究者は条件を操作せず、自然のままの状態を観測する研究です。すでに起きていること、起きつつあることを記録して分析します。

観察研究では、研究者は「観察する側」。倫理的に介入できない場合(喫煙の影響を強制実験することはできない)や、すでに起きているデータを使う場合に有効です。

2つのアプローチの比較

観点 実験研究 観察研究
研究者の関わり能動的に条件を操作受動的に観測のみ
因果関係の特定強い弱い(相関までが基本)
コスト高い比較的低い
倫理的制約強い(介入できない場合あり)弱い
新薬の臨床試験、A/Bテスト疫学調査、市場調査
POINT

実験研究は「原因を作り出して結果を見る」、観察研究は「自然な状態を観測する」。因果関係を特定したいなら実験研究が強いですが、倫理やコストの観点で観察研究を選ぶ場面も多くあります。

さえちゃん
さえ

「条件を操作する」か「観察するだけ」か! この区別がデータの集め方の最初の分かれ道だよ!

2. 処理群と対照群 ─ 比較するという発想

実験研究で大切なキーワードが、処理群対照群です。実験で何かの効果を測るときに必ず登場する、基本中の基本のセットアップです。

処理群と対照群

この2つのグループを比較することで、「条件を与えたことによる差」を見つけることができます。「処理群だけ」を見ても、その結果が新薬のおかげなのか、もともとそうだったのかわからないからです。比較するからこそ、効果がわかる──これが処理群と対照群の発想です。

例:新薬の臨床試験

風邪薬の効果を確かめたいとしましょう。100人の風邪患者に協力してもらい、こんな実験を計画します。

EXAMPLE
  • 処理群(50人):新薬を投与する
  • 対照群(50人):新薬を投与しない
  • 1週間後、両グループの症状の改善度を比較する

もし処理群のほうが対照群より明らかに症状が改善していれば、新薬に効果がある可能性が高いと言えます。同じくらいなら、効果はないか、あっても小さい。比較対象としての対照群があるから、新薬の効果が客観的に評価できるんです。

POINT

実験研究の基本は「処理群と対照群の比較」。条件を与えるグループと与えないグループを並べて比較することで、条件の効果が見えてきます。比較対象がない実験は、結果を解釈できないと覚えてください。

3. プラセボ ─ 偽薬という工夫

ここで、新薬の臨床試験における有名な工夫を紹介します。プラセボ(偽薬、placebo)の話です。

プラセボとは

プラセボとは、有効成分を含まない、見た目だけ薬と同じもののことです。色・形・味・大きさは本物の薬と区別がつかないように作られていますが、中身は乳糖や砂糖など、薬理効果のない物質。本物の薬と並べて投与しても、外見からは判別できません

なぜ偽薬が必要なのか

なぜ、わざわざ偽薬を作るのでしょうか? 答えは、「薬を飲んでいるという気持ち」だけでも症状が改善することがあるからです。これをプラセボ効果と呼びます。

たとえば、本物の新薬を処理群に、何も投与しない人を対照群にして比較したとします。処理群のほうが症状が改善した──しかし、これが本当に薬の効果なのか、それとも「薬を飲んだという心理的な安心感」による改善なのかが、区別できません。

そこで、対照群には「中身は何もないが、薬と見分けがつかないプラセボ」を投与します。すると:

両グループとも「薬を飲んだ」という心理状態は同じになります。両者の差を比較すれば、「純粋な薬の効果」だけを取り出せるわけです。

二重盲検法という発展形

より厳密にするための工夫として、二重盲検法(にじゅうもうけんほう、double-blind)があります。これは、患者だけでなく、薬を投与する医師にも、それが本物かプラセボか知らせない方法です。

なぜ医師にも知らせないのでしょうか? もし医師が「これは本物」と知っていると、患者への接し方や観察の仕方に無意識にバイアス(偏り)が入ってしまうからです。「期待」は意外と研究結果に影響する──だから両方とも盲(blind)にしておく、というわけです。

POINT

プラセボは「心理的効果と純粋な薬の効果を分離する」ための工夫です。「薬を飲んでいる」という気持ちだけでも症状は変わる。だからこそ、対照群にも見分けがつかないプラセボを投与することで、本物の効果を測ることができます。

さえちゃん
さえ

プラセボの発想って奥深いよね! 「気持ちの効果」と「実際の効果」を切り分けるって、人間の心の影響まで考えてるんだよ!

4. フィッシャーの三原則 ─ 信頼できる実験のために

実験研究を信頼できるものにするための、いつでも使える3つの原則があります。提唱者は、5-3でも登場した統計学者ロナルド・A・フィッシャー。彼が農業実験の現場で確立した「フィッシャーの三原則」として知られています。

三原則の全体像

原則 英語 目的
① 局所管理Local Control条件をそろえて、ばらつきの原因を減らす
② 無作為化Randomization偏りなくサンプルを割り当てる
③ 繰り返しReplication同じ条件で複数回行い、偶然の影響を減らす

順番に詳しく見ていきましょう。

① 局所管理(Local Control)

局所管理は、「実験条件のうち、本来興味のない条件をそろえる」ことです。たとえば肥料の効果を調べたいときに、土壌の質や日当たりがバラバラだと、結果が肥料の効果なのか土壌の差なのか区別できません。調べたい条件以外を揃えておくことで、純粋に注目したい効果だけを見られるようにします。

EXAMPLE
  • 肥料実験:土壌・日当たり・水やりの量を揃える
  • 授業の効果実験:同じ学年・同じ時間帯・同じ教室で行う
  • ダイエットの効果検証:年齢層・性別・運動習慣を揃える

② 無作為化(Randomization)

無作為化は、「サンプルをどのグループに入れるかを、ランダム(無作為)に決める」ことです。研究者の意図や、何らかのパターンに従ってグループ分けすると、偏り(バイアス)が入る恐れがあります。

たとえば、新薬の臨床試験で、「症状が軽い人を処理群、重い人を対照群」と分けたら、結果は最初から偏ってしまいますよね。くじ引き、ランダム関数、抽選などで機械的に振り分けることで、偏りのないグループ分けが可能になります。

これは8-4「無作為抽出法」とも深く関係する考え方です。

③ 繰り返し(Replication)

繰り返しは、「同じ条件での実験を、複数回(または複数のサンプルで)行う」ことです。1回だけの実験では、偶然の影響を排除できません。複数回行うことで、結果の信頼度が高まります。

EXAMPLE
  • 肥料Aの効果を1区画だけで試すのではなく、5区画で試す
  • 新薬の効果を10人ではなく、1,000人で試す
  • A/Bテストを1日ではなく、1週間継続する

第3章で学んだ標準偏差の発想にもつながりますが、サンプル数が多いほど、結果のばらつきが小さくなり、偶然による誤差を取り除けます。これは統計学の根幹をなす考え方のひとつです。

三原則をまとめると

フィッシャーの三原則は、それぞれが「実験における誤差や偏りの原因」を取り除くために設計されています。

この3つを揃えることで、誰がやっても同じ結果が得られる、信頼できる実験ができるんですね。フィッシャーが約100年前に確立したこのフレームワークは、今でも医学・農学・心理学・マーケティングなど、あらゆる分野の実験計画の基礎として使われています。

POINT

フィッシャーの三原則は、局所管理・無作為化・繰り返し。これら3つを実践することで、信頼できる実験データが得られます。「実験計画法」と呼ばれる分野の出発点になった、歴史的に重要な考え方です。

さえちゃん
さえ

5-3で出てきたフィッシャー、ここでも登場! 統計学の歴史を作った巨人だよ! 100年前のアイデアが今も全分野で使われてるって、すごいことだよね!

5. 実験研究と観察研究、どちらを選ぶか

ここまで実験研究の話が中心でしたが、最後に「実際の現場でどう使い分けるか」を整理しておきます。

実験研究を選ぶ場面

観察研究を選ぶ場面

実務的には、観察研究のほうが圧倒的に多いです。ビジネスの現場では、すでに集まっているデータを分析することがほとんどですし、A/Bテストのような小規模な実験を除けば、本格的な実験研究はあまり行われません。だからこそ、観察研究の限界──第4章で学んだ「相関は因果ではない」という原則──を心に留めておくことが大切なんですね。

まとめ

第8章2回目の本ページ、ポイントを整理しておきましょう。

実験研究と観察研究、それぞれの特性を理解して使い分けることが、信頼できるデータ分析の第一歩です。次回は全数調査と標本調査──「全員調べるか、一部だけ調べるか」というデータ収集のもう一つの大きな選択肢を学びます。