因果推論の基礎
3-1では「相関関係と因果関係の違い」を学びました。本ページでは、その先にある「では、どうすれば因果関係に迫れるのか」という因果推論の基礎を扱います。処置群と対照群を分けて比較する必要性、因果効果の推定を歪める交絡因子、分析対象を定める段階で生じる選択バイアスという3つのポイントを、A/Bテストの実例を交えて整理します。
因果推論は、第3章の締めくくりであり、次の第4章以降で扱う実践的な分析設計にもつながる重要なテーマです。ここまでの相関・検定の知識を土台に、もう一歩踏み込んで理解していきましょう。
1. 処置群と対照群を分けて比較する
「新しい施策が本当に効果を生んだのか」を確かめたいとき、その施策を受けたグループの結果だけを見ても、因果効果は判断できません。なぜなら、施策の影響なのか、それとも季節要因や偶然のブレなのかを区別できないからです。
そこで必要になるのが、ある特定の処置に対して、その他の変数や外部の影響を除いた効果を測定するために、処置群(実験群)と対照群に分けて比較・分析するという発想です。実際に施策(処置)を行うグループを処置群(実験群)※1、施策を行わない、あるいは従来どおりのグループを対照群※2と呼びます。この2つのグループを、施策以外の条件をできるだけそろえたうえで比較することで、初めて「施策の効果」を他の要因と切り分けて測定できます。
Webサービスの実務でよく使われるのがA/Bテスト※3です。ユーザーをランダムに2つのグループに分け、一方には新しいデザイン(処置群)、もう一方には従来のデザイン(対照群)を見せて、購入率などの指標を比較します。ランダムに割り付けることがポイントで、これにより2つのグループの性質(年齢層や利用頻度など)が平均的にそろい、結果の差を施策の効果として解釈しやすくなります。
- 購入ボタンの色を変更する施策を検証したいとき、訪問者をランダムに2グループに分ける
- 処置群: 緑色のボタンを表示するグループ
- 対照群: 従来どおり赤色のボタンを表示するグループ
- 同じ期間・同じ条件で両グループの購入率を比較することで、「ボタンの色を変えた効果」だけを取り出して評価できる
もし処置群だけを施策の前後で比較する(たとえば先月と今月のボタン色を変えて比較する)方法を取ってしまうと、季節性やキャンペーンなど、施策以外の要因の影響を排除できません。対照群を同時に用意して比較することで、初めて「施策そのものの効果」を他の外部要因から切り分けられます。
特定の処置の効果を測定するには、処置群(実験群)と対照群に分けて比較・分析する必要があることを知っているのがDS検定の必須項目です。「片方だけ見る」のではなく「変化させたグループ」と「変化させなかったグループ」を同時に比較することが、因果推論の出発点です。
「新しい施策をやったら数字が上がった!」だけだと、それが本当に施策のおかげか分からないよね。対照群と比べて初めて「施策の効果」って言えるんだ。
2. 交絡因子 ― 双方に影響を与える隠れた変数
処置群と対照群を単純に比較するだけでは、正しい因果効果を推定できない場合があります。その代表的な原因が交絡因子(共変量)※4です。
交絡因子とは、ある変数が他の変数に与える影響(因果効果)を推定したい場合に、その原因と考えている変数と、結果と考えている変数の双方に影響を与えてしまっている第3の変数のことです。この交絡因子を考慮せずに分析すると、本当は関係のない2つの変数の間に、見せかけの関係(疑似相関)が生まれてしまいます。
- 「喫煙者は疾病の発症率が高い」というデータが得られたとします
- ここで、年齢という変数が、「喫煙しているかどうか」にも「疾病を発症しやすいかどうか」にも、両方に影響を与えている可能性があります(高齢の人ほど喫煙歴が長く、かつ高齢であること自体が疾病リスクを高めるなど)
- 年齢を考慮せずに単純に喫煙と疾病の関係だけを見ると、年齢の影響を喫煙の影響と取り違えてしまう恐れがある
- 年齢層ごとに層別して比較する、あるいは年齢を統計的に調整するなどの方法で、交絡因子の影響を取り除く必要がある
実務でも、交絡因子は至るところに潜んでいます。「有料会員は継続率が高い」というデータの裏で、そもそも「サービスへの熱意が高い顧客ほど有料会員になりやすく、かつ継続もしやすい」という交絡因子(熱意)が隠れているかもしれません。因果推論を行う際は、「この関係を歪めている、両方に影響する第3の変数はないか」を常に疑う姿勢が求められます。
ある変数が他の変数に与える因果効果を推定したい場合、その双方に影響を与える共変量(交絡因子)の考慮が重要であると理解しておくことがDS検定のスキルチェック項目です。「原因と考えている変数」と「結果と考えている変数」の両方に影響する第3の変数がないかを疑いましょう。
交絡因子って言葉は難しく聞こえるけど、要は「実は裏で両方を操ってる犯人がいないか」ってことなんだよね。喫煙と病気の話は年齢が犯人、っていうのが定番の例だから覚えておこう!
3. 選択バイアス ― 分析対象を決める段階で生じる歪み
因果推論を歪めるもうひとつの要因が選択バイアス※5です。これは、分析の対象を定める段階で、データの選ばれ方に偏りが生じてしまうことによって起こります。交絡因子が「変数同士の関係」の問題であるのに対し、選択バイアスは「そもそもどのデータを分析対象にするか」という、より手前の段階で発生する問題です。
- 途中離脱者の除外: アプリの利用継続率を分析する際、「最後まで使い続けたユーザー」だけを対象にすると、そもそも定着しやすい層に偏ったデータで分析することになる
- 欠損データの除外: アンケートで「年収」の回答が欠損している人をまとめて除外すると、年収を答えたがらない層(高所得者・低所得者など)が結果的に分析から抜け落ちる
- 自己選抜: 満足度調査の回答者を「回答してくれた人」に限定すると、そもそも強い意見(非常に満足、または非常に不満)を持つ人ほど回答しやすいというバイアスが生じる
選択バイアスの厄介な点は、データの「量」を増やしても解消されないことです。3-1で扱った標本誤差はサンプルサイズを増やせば小さくなりますが、選択バイアスは「サンプルの選ばれ方そのもの」に問題があるため、いくらデータを集めても偏りは解消されません。分析対象を決める段階で、「この除外・この抽出方法によって、特定の性質を持つ人たちが結果的に排除されていないか」を確認する必要があります。
分析の対象を定める段階で選択バイアスが生じる可能性があることを理解しておくことがDS検定の必須項目です。途中離脱者の除外、欠損データの除外は選択バイアスの典型例であり、データの量では解決できない問題であることを押さえておきましょう。
「欠損データは面倒だから消しちゃえ」ってやりがちだけど、それ自体が偏りを生んじゃうことがあるから注意。「なぜ欠損しているのか」まで考えるクセ、大事だよ!
まとめ
第3章の締めくくりとして、因果推論の基礎を整理しました。振り返っておきましょう。
- 処置群と対照群 ― 施策の因果効果を測るには、処置を行うグループと行わないグループを分けて比較する必要がある。A/Bテストはその代表的な実践方法
- 交絡因子(共変量) ― 原因と結果の両方に影響を与える第3の変数を見落とすと、誤った因果関係を結論づけてしまう
- 選択バイアス ― 分析対象を決める段階(途中離脱者の除外、欠損データの除外など)で生じる偏り。データ量を増やしても解消されない
これで第3章「統計の基礎」はすべて完了です。記述統計から確率分布、相関分析、推定・検定、仮説検証、そして因果推論まで、統計学の土台を一通り学びました。この章末には確認問題を用意していますので、ぜひ知識の定着度をチェックしてみてください。
- 処置群(実験群) … ある施策や介入を実際に受けるグループのこと。A/Bテストでは新しい施策を見せる側のグループを指す。↩
- 対照群 … 施策や介入を行わない、比較のためのグループのこと。A/Bテストでは従来どおりの内容を見せる側を指す。↩
- A/Bテスト … 対象をランダムに2グループに分け、一方にのみ施策を適用して結果を比較する実験手法。Web施策の効果検証で広く使われる。↩
- 交絡因子(共変量) … 分析したい2つの変数の両方に影響を与えてしまう第3の変数のこと。これを見落とすと、見せかけの因果関係(疑似相関)を導いてしまう。↩
- 選択バイアス … 分析対象データの選ばれ方に偏りが生じることで、結果が歪んでしまうこと。途中離脱者の除外や欠損データの除外などが典型例。↩