実験研究と観察研究
前回はPPDACサイクルと「目的と目標」の話でした。今回からはより具体的に、データの集め方を見ていきます。
データを集める方法は、大きく分けて実験研究と観察研究の2つがあります。本ページでは、それぞれの違い、処理群と対照群の発想、プラセボを使った臨床試験、そして5-3でも登場した統計学者フィッシャーが提唱した「実験計画の三原則」を整理します。
1. 実験研究と観察研究 ─ 2つのアプローチ
データを集めるとき、大きく分けて2つのアプローチがあります。実験研究と観察研究です。両者の違いは、「研究者が条件を操作するかどうか」にあります。
実験研究
実験研究(experimental study)は、研究者が能動的に条件を操作してデータを取る研究です。「ある条件を加えると、結果がどう変わるか」を確かめるのが目的です。
- 新薬を投与すると、症状はどう変わるか
- 肥料の量を変えると、収穫量はどう変わるか
- 広告のデザインを変えると、クリック率はどう変わるか
実験研究の特徴は、「原因を意図的に作り出して、結果を観測できる」こと。だから、第4章で学んだ「因果関係」に近づきやすいのです。
観察研究
観察研究(observational study)は、研究者は条件を操作せず、自然のままの状態を観測する研究です。すでに起きていること、起きつつあることを記録して分析します。
- 喫煙者と非喫煙者で、肺がんの発症率に違いがあるか
- 地域別の人口と犯罪発生率の関係を調べる
- 顧客の年齢と購入商品の傾向を分析する
観察研究では、研究者は「観察する側」。倫理的に介入できない場合(喫煙の影響を強制実験することはできない)や、すでに起きているデータを使う場合に有効です。
2つのアプローチの比較
| 観点 | 実験研究 | 観察研究 |
|---|---|---|
| 研究者の関わり | 能動的に条件を操作 | 受動的に観測のみ |
| 因果関係の特定 | 強い | 弱い(相関までが基本) |
| コスト | 高い | 比較的低い |
| 倫理的制約 | 強い(介入できない場合あり) | 弱い |
| 例 | 新薬の臨床試験、A/Bテスト | 疫学調査、市場調査 |
実験研究は「原因を作り出して結果を見る」、観察研究は「自然な状態を観測する」。因果関係を特定したいなら実験研究が強いですが、倫理やコストの観点で観察研究を選ぶ場面も多くあります。
「条件を操作する」か「観察するだけ」か! この区別がデータの集め方の最初の分かれ道だよ!
2. 処理群と対照群 ─ 比較するという発想
実験研究で大切なキーワードが、処理群と対照群です。実験で何かの効果を測るときに必ず登場する、基本中の基本のセットアップです。
処理群と対照群
- 処理群(treatment group):試したい条件を与えるグループ。例えば新薬を投与する人たち
- 対照群(control group):その条件を与えないグループ。例えば新薬を投与しない人たち
この2つのグループを比較することで、「条件を与えたことによる差」を見つけることができます。「処理群だけ」を見ても、その結果が新薬のおかげなのか、もともとそうだったのかわからないからです。比較するからこそ、効果がわかる──これが処理群と対照群の発想です。
例:新薬の臨床試験
風邪薬の効果を確かめたいとしましょう。100人の風邪患者に協力してもらい、こんな実験を計画します。
- 処理群(50人):新薬を投与する
- 対照群(50人):新薬を投与しない
- 1週間後、両グループの症状の改善度を比較する
もし処理群のほうが対照群より明らかに症状が改善していれば、新薬に効果がある可能性が高いと言えます。同じくらいなら、効果はないか、あっても小さい。比較対象としての対照群があるから、新薬の効果が客観的に評価できるんです。
実験研究の基本は「処理群と対照群の比較」。条件を与えるグループと与えないグループを並べて比較することで、条件の効果が見えてきます。比較対象がない実験は、結果を解釈できないと覚えてください。
3. プラセボ ─ 偽薬という工夫
ここで、新薬の臨床試験における有名な工夫を紹介します。プラセボ(偽薬、placebo)の話です。
プラセボとは
プラセボとは、有効成分を含まない、見た目だけ薬と同じもののことです。色・形・味・大きさは本物の薬と区別がつかないように作られていますが、中身は乳糖や砂糖など、薬理効果のない物質。本物の薬と並べて投与しても、外見からは判別できません。
なぜ偽薬が必要なのか
なぜ、わざわざ偽薬を作るのでしょうか? 答えは、「薬を飲んでいるという気持ち」だけでも症状が改善することがあるからです。これをプラセボ効果と呼びます。
たとえば、本物の新薬を処理群に、何も投与しない人を対照群にして比較したとします。処理群のほうが症状が改善した──しかし、これが本当に薬の効果なのか、それとも「薬を飲んだという心理的な安心感」による改善なのかが、区別できません。
そこで、対照群には「中身は何もないが、薬と見分けがつかないプラセボ」を投与します。すると:
- 処理群:本物の新薬を投与(薬の効果+心理的効果)
- 対照群:プラセボを投与(心理的効果のみ)
両グループとも「薬を飲んだ」という心理状態は同じになります。両者の差を比較すれば、「純粋な薬の効果」だけを取り出せるわけです。
二重盲検法という発展形
より厳密にするための工夫として、二重盲検法(にじゅうもうけんほう、double-blind)があります。これは、患者だけでなく、薬を投与する医師にも、それが本物かプラセボか知らせない方法です。
なぜ医師にも知らせないのでしょうか? もし医師が「これは本物」と知っていると、患者への接し方や観察の仕方に無意識にバイアス(偏り)が入ってしまうからです。「期待」は意外と研究結果に影響する──だから両方とも盲(blind)にしておく、というわけです。
プラセボは「心理的効果と純粋な薬の効果を分離する」ための工夫です。「薬を飲んでいる」という気持ちだけでも症状は変わる。だからこそ、対照群にも見分けがつかないプラセボを投与することで、本物の効果を測ることができます。
プラセボの発想って奥深いよね! 「気持ちの効果」と「実際の効果」を切り分けるって、人間の心の影響まで考えてるんだよ!
4. フィッシャーの三原則 ─ 信頼できる実験のために
実験研究を信頼できるものにするための、いつでも使える3つの原則があります。提唱者は、5-3でも登場した統計学者ロナルド・A・フィッシャー。彼が農業実験の現場で確立した「フィッシャーの三原則」として知られています。
三原則の全体像
| 原則 | 英語 | 目的 |
|---|---|---|
| ① 局所管理 | Local Control | 条件をそろえて、ばらつきの原因を減らす |
| ② 無作為化 | Randomization | 偏りなくサンプルを割り当てる |
| ③ 繰り返し | Replication | 同じ条件で複数回行い、偶然の影響を減らす |
順番に詳しく見ていきましょう。
① 局所管理(Local Control)
局所管理は、「実験条件のうち、本来興味のない条件をそろえる」ことです。たとえば肥料の効果を調べたいときに、土壌の質や日当たりがバラバラだと、結果が肥料の効果なのか土壌の差なのか区別できません。調べたい条件以外を揃えておくことで、純粋に注目したい効果だけを見られるようにします。
- 肥料実験:土壌・日当たり・水やりの量を揃える
- 授業の効果実験:同じ学年・同じ時間帯・同じ教室で行う
- ダイエットの効果検証:年齢層・性別・運動習慣を揃える
② 無作為化(Randomization)
無作為化は、「サンプルをどのグループに入れるかを、ランダム(無作為)に決める」ことです。研究者の意図や、何らかのパターンに従ってグループ分けすると、偏り(バイアス)が入る恐れがあります。
たとえば、新薬の臨床試験で、「症状が軽い人を処理群、重い人を対照群」と分けたら、結果は最初から偏ってしまいますよね。くじ引き、ランダム関数、抽選などで機械的に振り分けることで、偏りのないグループ分けが可能になります。
これは8-4「無作為抽出法」とも深く関係する考え方です。
③ 繰り返し(Replication)
繰り返しは、「同じ条件での実験を、複数回(または複数のサンプルで)行う」ことです。1回だけの実験では、偶然の影響を排除できません。複数回行うことで、結果の信頼度が高まります。
- 肥料Aの効果を1区画だけで試すのではなく、5区画で試す
- 新薬の効果を10人ではなく、1,000人で試す
- A/Bテストを1日ではなく、1週間継続する
第3章で学んだ標準偏差の発想にもつながりますが、サンプル数が多いほど、結果のばらつきが小さくなり、偶然による誤差を取り除けます。これは統計学の根幹をなす考え方のひとつです。
三原則をまとめると
フィッシャーの三原則は、それぞれが「実験における誤差や偏りの原因」を取り除くために設計されています。
- 局所管理:体系的な誤差(環境差など)を取り除く
- 無作為化:人為的な偏り(研究者の意図など)を取り除く
- 繰り返し:偶然による誤差を取り除く
この3つを揃えることで、誰がやっても同じ結果が得られる、信頼できる実験ができるんですね。フィッシャーが約100年前に確立したこのフレームワークは、今でも医学・農学・心理学・マーケティングなど、あらゆる分野の実験計画の基礎として使われています。
フィッシャーの三原則は、局所管理・無作為化・繰り返し。これら3つを実践することで、信頼できる実験データが得られます。「実験計画法」と呼ばれる分野の出発点になった、歴史的に重要な考え方です。
5-3で出てきたフィッシャー、ここでも登場! 統計学の歴史を作った巨人だよ! 100年前のアイデアが今も全分野で使われてるって、すごいことだよね!
5. 実験研究と観察研究、どちらを選ぶか
ここまで実験研究の話が中心でしたが、最後に「実際の現場でどう使い分けるか」を整理しておきます。
実験研究を選ぶ場面
- 因果関係を特定したい(本当に原因なのかを確かめたい)
- 新しい施策の効果を測りたい(新薬・新機能・新キャンペーンなど)
- 条件を操作することに倫理的・経済的問題がない
観察研究を選ぶ場面
- 条件の操作が倫理的にできない(健康に害のある条件など)
- すでに起きているデータを分析したい(過去の購買履歴など)
- 長期的な変化や、社会全体の傾向を見たい
実務的には、観察研究のほうが圧倒的に多いです。ビジネスの現場では、すでに集まっているデータを分析することがほとんどですし、A/Bテストのような小規模な実験を除けば、本格的な実験研究はあまり行われません。だからこそ、観察研究の限界──第4章で学んだ「相関は因果ではない」という原則──を心に留めておくことが大切なんですね。
まとめ
第8章2回目の本ページ、ポイントを整理しておきましょう。
- 実験研究:研究者が条件を操作してデータを取る
- 観察研究:自然な状態を観測するだけ
- 処理群と対照群:実験で必ず使う比較のセットアップ
- プラセボ:心理的効果と純粋な薬の効果を分離するための工夫
- 二重盲検法:患者と医師の両方に本物・偽物を知らせない方法
- フィッシャーの三原則:局所管理・無作為化・繰り返し
実験研究と観察研究、それぞれの特性を理解して使い分けることが、信頼できるデータ分析の第一歩です。次回は全数調査と標本調査──「全員調べるか、一部だけ調べるか」というデータ収集のもう一つの大きな選択肢を学びます。