第8章 8-2 / データの収集：実験・観察・調査

実験研究と観察研究

このページで学ぶこと

前回はPPDACサイクルと「目的と目標」の話でした。今回からはより具体的に、データの集め方を見ていきます。

データを集める方法は、大きく分けて実験研究と観察研究の2つがあります。本ページでは、それぞれの違い、処理群と対照群の発想、プラセボを使った臨床試験、そして5-3でも登場した統計学者フィッシャーが提唱した「実験計画の三原則」を整理します。

1. 実験研究と観察研究 ─ 2つのアプローチ

データを集めるとき、大きく分けて2つのアプローチがあります。実験研究と観察研究です。両者の違いは、「研究者が条件を操作するかどうか」にあります。

実験研究

実験研究（experimental study）は、研究者が能動的に条件を操作してデータを取る研究です。「ある条件を加えると、結果がどう変わるか」を確かめるのが目的です。

新薬を投与すると、症状はどう変わるか
肥料の量を変えると、収穫量はどう変わるか
広告のデザインを変えると、クリック率はどう変わるか

実験研究の特徴は、「原因を意図的に作り出して、結果を観測できる」こと。だから、第4章で学んだ「因果関係」に近づきやすいのです。

観察研究

観察研究（observational study）は、研究者は条件を操作せず、自然のままの状態を観測する研究です。すでに起きていること、起きつつあることを記録して分析します。

喫煙者と非喫煙者で、肺がんの発症率に違いがあるか
地域別の人口と犯罪発生率の関係を調べる
顧客の年齢と購入商品の傾向を分析する

観察研究では、研究者は「観察する側」。倫理的に介入できない場合（喫煙の影響を強制実験することはできない）や、すでに起きているデータを使う場合に有効です。

2つのアプローチの比較

観点	実験研究	観察研究
研究者の関わり	能動的に条件を操作	受動的に観測のみ
因果関係の特定	強い	弱い(相関までが基本)
コスト	高い	比較的低い
倫理的制約	強い(介入できない場合あり)	弱い
例	新薬の臨床試験、A/Bテスト	疫学調査、市場調査

POINT

実験研究は「原因を作り出して結果を見る」、観察研究は「自然な状態を観測する」。因果関係を特定したいなら実験研究が強いですが、倫理やコストの観点で観察研究を選ぶ場面も多くあります。

さえ

「条件を操作する」か「観察するだけ」か！　この区別がデータの集め方の最初の分かれ道だよ！

2. 処理群と対照群 ─ 比較するという発想

実験研究で大切なキーワードが、処理群と対照群です。実験で何かの効果を測るときに必ず登場する、基本中の基本のセットアップです。

処理群と対照群

処理群（treatment group）：試したい条件を与えるグループ。例えば新薬を投与する人たち
対照群（control group）：その条件を与えないグループ。例えば新薬を投与しない人たち

この2つのグループを比較することで、「条件を与えたことによる差」を見つけることができます。「処理群だけ」を見ても、その結果が新薬のおかげなのか、もともとそうだったのかわからないからです。比較するからこそ、効果がわかる──これが処理群と対照群の発想です。

例：新薬の臨床試験

風邪薬の効果を確かめたいとしましょう。100人の風邪患者に協力してもらい、こんな実験を計画します。

EXAMPLE

処理群（50人）：新薬を投与する
対照群（50人）：新薬を投与しない
1週間後、両グループの症状の改善度を比較する

もし処理群のほうが対照群より明らかに症状が改善していれば、新薬に効果がある可能性が高いと言えます。同じくらいなら、効果はないか、あっても小さい。比較対象としての対照群があるから、新薬の効果が客観的に評価できるんです。

POINT

実験研究の基本は「処理群と対照群の比較」。条件を与えるグループと与えないグループを並べて比較することで、条件の効果が見えてきます。比較対象がない実験は、結果を解釈できないと覚えてください。

3. プラセボ ─ 偽薬という工夫

ここで、新薬の臨床試験における有名な工夫を紹介します。プラセボ（偽薬、placebo）の話です。

プラセボとは

プラセボとは、有効成分を含まない、見た目だけ薬と同じもののことです。色・形・味・大きさは本物の薬と区別がつかないように作られていますが、中身は乳糖や砂糖など、薬理効果のない物質。本物の薬と並べて投与しても、外見からは判別できません。

なぜ偽薬が必要なのか

なぜ、わざわざ偽薬を作るのでしょうか？答えは、「薬を飲んでいるという気持ち」だけでも症状が改善することがあるからです。これをプラセボ効果と呼びます。

たとえば、本物の新薬を処理群に、何も投与しない人を対照群にして比較したとします。処理群のほうが症状が改善した──しかし、これが本当に薬の効果なのか、それとも「薬を飲んだという心理的な安心感」による改善なのかが、区別できません。

そこで、対照群には「中身は何もないが、薬と見分けがつかないプラセボ」を投与します。すると：

処理群：本物の新薬を投与（薬の効果＋心理的効果）
対照群：プラセボを投与（心理的効果のみ）

両グループとも「薬を飲んだ」という心理状態は同じになります。両者の差を比較すれば、「純粋な薬の効果」だけを取り出せるわけです。

二重盲検法という発展形

より厳密にするための工夫として、二重盲検法（にじゅうもうけんほう、double-blind）があります。これは、患者だけでなく、薬を投与する医師にも、それが本物かプラセボか知らせない方法です。

なぜ医師にも知らせないのでしょうか？もし医師が「これは本物」と知っていると、患者への接し方や観察の仕方に無意識にバイアス（偏り）が入ってしまうからです。「期待」は意外と研究結果に影響する──だから両方とも盲（blind）にしておく、というわけです。

POINT

プラセボは「心理的効果と純粋な薬の効果を分離する」ための工夫です。「薬を飲んでいる」という気持ちだけでも症状は変わる。だからこそ、対照群にも見分けがつかないプラセボを投与することで、本物の効果を測ることができます。

さえ

プラセボの発想って奥深いよね！　「気持ちの効果」と「実際の効果」を切り分けるって、人間の心の影響まで考えてるんだよ！

4. フィッシャーの三原則 ─ 信頼できる実験のために

実験研究を信頼できるものにするための、いつでも使える3つの原則があります。提唱者は、5-3でも登場した統計学者ロナルド・A・フィッシャー。彼が農業実験の現場で確立した「フィッシャーの三原則」として知られています。

三原則の全体像

原則	英語	目的
① 局所管理	Local Control	条件をそろえて、ばらつきの原因を減らす
② 無作為化	Randomization	偏りなくサンプルを割り当てる
③ 繰り返し	Replication	同じ条件で複数回行い、偶然の影響を減らす

順番に詳しく見ていきましょう。

① 局所管理（Local Control）

局所管理は、「実験条件のうち、本来興味のない条件をそろえる」ことです。たとえば肥料の効果を調べたいときに、土壌の質や日当たりがバラバラだと、結果が肥料の効果なのか土壌の差なのか区別できません。調べたい条件以外を揃えておくことで、純粋に注目したい効果だけを見られるようにします。

EXAMPLE

肥料実験：土壌・日当たり・水やりの量を揃える
授業の効果実験：同じ学年・同じ時間帯・同じ教室で行う
ダイエットの効果検証：年齢層・性別・運動習慣を揃える

② 無作為化（Randomization）

無作為化は、「サンプルをどのグループに入れるかを、ランダム（無作為）に決める」ことです。研究者の意図や、何らかのパターンに従ってグループ分けすると、偏り（バイアス）が入る恐れがあります。

たとえば、新薬の臨床試験で、「症状が軽い人を処理群、重い人を対照群」と分けたら、結果は最初から偏ってしまいますよね。くじ引き、ランダム関数、抽選などで機械的に振り分けることで、偏りのないグループ分けが可能になります。

これは8-4「無作為抽出法」とも深く関係する考え方です。

③ 繰り返し（Replication）

繰り返しは、「同じ条件での実験を、複数回(または複数のサンプルで)行う」ことです。1回だけの実験では、偶然の影響を排除できません。複数回行うことで、結果の信頼度が高まります。

EXAMPLE

肥料Aの効果を1区画だけで試すのではなく、5区画で試す
新薬の効果を10人ではなく、1,000人で試す
A/Bテストを1日ではなく、1週間継続する

第3章で学んだ標準偏差の発想にもつながりますが、サンプル数が多いほど、結果のばらつきが小さくなり、偶然による誤差を取り除けます。これは統計学の根幹をなす考え方のひとつです。

三原則をまとめると

フィッシャーの三原則は、それぞれが「実験における誤差や偏りの原因」を取り除くために設計されています。

局所管理：体系的な誤差(環境差など)を取り除く
無作為化：人為的な偏り(研究者の意図など)を取り除く
繰り返し：偶然による誤差を取り除く

この3つを揃えることで、誰がやっても同じ結果が得られる、信頼できる実験ができるんですね。フィッシャーが約100年前に確立したこのフレームワークは、今でも医学・農学・心理学・マーケティングなど、あらゆる分野の実験計画の基礎として使われています。

POINT

フィッシャーの三原則は、局所管理・無作為化・繰り返し。これら3つを実践することで、信頼できる実験データが得られます。「実験計画法」と呼ばれる分野の出発点になった、歴史的に重要な考え方です。

さえ

5-3で出てきたフィッシャー、ここでも登場！　統計学の歴史を作った巨人だよ！　100年前のアイデアが今も全分野で使われてるって、すごいことだよね！

5. 実験研究と観察研究、どちらを選ぶか

ここまで実験研究の話が中心でしたが、最後に「実際の現場でどう使い分けるか」を整理しておきます。

実験研究を選ぶ場面

因果関係を特定したい(本当に原因なのかを確かめたい)
新しい施策の効果を測りたい(新薬・新機能・新キャンペーンなど)
条件を操作することに倫理的・経済的問題がない

観察研究を選ぶ場面

条件の操作が倫理的にできない(健康に害のある条件など)
すでに起きているデータを分析したい(過去の購買履歴など)
長期的な変化や、社会全体の傾向を見たい

実務的には、観察研究のほうが圧倒的に多いです。ビジネスの現場では、すでに集まっているデータを分析することがほとんどですし、A/Bテストのような小規模な実験を除けば、本格的な実験研究はあまり行われません。だからこそ、観察研究の限界──第4章で学んだ「相関は因果ではない」という原則──を心に留めておくことが大切なんですね。

まとめ

第8章2回目の本ページ、ポイントを整理しておきましょう。

実験研究：研究者が条件を操作してデータを取る
観察研究：自然な状態を観測するだけ
処理群と対照群：実験で必ず使う比較のセットアップ
プラセボ：心理的効果と純粋な薬の効果を分離するための工夫
二重盲検法：患者と医師の両方に本物・偽物を知らせない方法
フィッシャーの三原則：局所管理・無作為化・繰り返し

実験研究と観察研究、それぞれの特性を理解して使い分けることが、信頼できるデータ分析の第一歩です。次回は全数調査と標本調査──「全員調べるか、一部だけ調べるか」というデータ収集のもう一つの大きな選択肢を学びます。