統計的問題解決におけるデータの収集
いよいよ第8章「データの収集:実験・観察・調査」に入ります。これまでは「集まったデータをどう料理するか」を学んできましたが、第8章では一歩戻って、「そもそもデータをどう集めるか」を考えます。
本ページでは、データ分析の標準的フレームワークであるPPDACサイクルを整理し、その出発点である「問題の明確化」がいかに重要で、しかし難しいかを掘り下げます。実は、これがデータ分析でいちばん深い落とし穴なんです。
1. データ分析は「問題解決」のためにある
統計検定3級も終盤に差しかかってきました。ここで一度、立ち止まって考えてみたい問いがあります。
「データ分析って、何のためにやるんだろう?」
数字を計算するため? グラフを作るため? 検定に合格するため? ──いえ、それは手段です。データ分析の本当の目的は、「問題を解決すること」。困っていることや知りたいことがあって、その答えを出すためにデータを使う。これがデータ分析の本質です。
料理にたとえてみると
データ分析を料理にたとえるなら、これまで第1章〜第7章で学んできたのは「包丁の使い方」「火加減」「盛り付け方」といった調理技術です。とても大切なスキルです。でも、そのまえに「何を作るか」「誰のために作るか」「どんな食材を仕入れるか」を決めなければ、料理は始まりません。
第8章は、「データという食材を、どう仕入れるか」──この前段階の話です。良い料理は良い食材から。同じく、良い分析は良いデータから始まります。そしてさらに前段に、「そもそも何のために料理するのか」という根本の問いがあります。
データ分析は「問題を解決するための営み」です。データそのものや分析手法は手段にすぎません。「何のために分析するのか」を見失うと、どんなに高度な手法を使っても、本来欲しかった答えにはたどり着けません。
「何のためにこのデータを見ているの?」って自問する習慣、すごく大事だよ! 第8章では、その「目的」を立てる段階から丁寧に学んでいくよ!
2. PPDACサイクル ─ 統計的問題解決の標準フレーム
データ分析を体系的に進めるために、世界中で使われているフレームワークがPPDACサイクルです。問題解決の流れを5つの段階に整理したもので、ニュージーランドの統計教育で広まり、今では国際的な標準になっています。
5つの段階
PPDACという名前は、5つの段階の頭文字を取ったものです。
| 記号 | 段階 | やること |
|---|---|---|
| P | Problem(問題の明確化) | 解決したい問題は何か、何を知りたいかをはっきりさせる |
| P | Plan(調査の計画) | どんなデータを、どう集めるかを設計する |
| D | Data(データの収集) | 実際にデータを集める。実験・観察・調査など |
| A | Analysis(分析) | 集めたデータを分析する。第1章〜第7章のスキルが活きる |
| C | Conclusion(結論) | 分析結果から、最初の問題への答えを導く |
各段階を詳しく見ていく
それぞれの段階で、何をするのかを具体的にしておきましょう。
① Problem(問題の明確化)
解決したい問題、知りたいことを言葉にする段階です。例えば、こんな感じ。
- 「うちの店舗の売上が下がっている。原因を知りたい」
- 「新商品Aと新商品B、どちらをメインで売り出すべきか」
- 「社員の残業時間と業績に関係はあるのか」
ここがPPDACサイクルの出発点であり、もっとも重要な段階です。出発点が間違っていると、いくら丁寧に分析しても、欲しかった答えは得られません。本ページの後半で、この「問題の明確化」の難しさを掘り下げます。
② Plan(調査の計画)
問題を解くために「どんなデータが必要か」「どうやって集めるか」を設計する段階です。
- 必要なデータは何か(売上、来店客数、気温、口コミ評価など)
- どこから取るか(POSシステム、アンケート、現場観察など)
- いつ・どのくらいの期間集めるか
- 誰に・何人に対して調査するか
8-2「実験研究と観察研究」、8-3「全数調査と標本調査」、8-4「無作為抽出法」では、このPlanの段階で必要な知識を整理していきます。
③ Data(データの収集)
設計した計画に従って、実際にデータを集める段階です。アンケートを実施する、計測機器を設置する、過去の記録を集約する、など。計画通りに集められないこともよくあるので、現場での柔軟さも必要です。
④ Analysis(分析)
集めたデータを使って分析する段階。第1章〜第7章で学んだスキルがすべて活きるのがここです。度数分布表、ヒストグラム、相関係数、回帰直線──これらは全部、Aの段階で使う道具でした。
⑤ Conclusion(結論)
分析結果から、最初のProblemに対する答えを出す段階です。
- 「売上下降の主因は、平日の来店客数の減少だった」
- 「商品Aのほうが、20代女性の購入率が3倍高いとわかった」
- 「残業時間と業績の間には、明確な相関は見られなかった」
そして大切なのは、結論が出たら次のサイクルにつなげること。「平日の来店客数を増やすには、何をすべきか?」という新しい問題が生まれて、Pに戻る。データ分析は1回で終わるものではなく、サイクルとして回し続けるのです。
PPDACサイクルはProblem → Plan → Data → Analysis → Conclusionの5段階。サイクルなので、結論が出たら次の問題が生まれて、また回り始めます。分析は1回切りではなく、繰り返すことで深まっていくものです。
PPDACって覚えやすいフレームワーク! でもね、サイクルだから「グルグル回す」っていうのが大切なポイント! 1回やって終わり、じゃないんだよ!
3. いちばん難しいのは「P」 ─ 問題の明確化
ここからが本ページの核心です。PPDACサイクルの中でも、最初のP(Problem)がいちばん難しい──これは多くのデータ分析者が口を揃えて言うところです。
「明確化する」のはどこまで?
「問題を明確化しましょう」と言うのは簡単ですが、実は「どこまで明確化すればいいのか」という基準がありません。たとえば「売上を上げたい」という漠然とした願いから出発したとき、これをどこまで掘り下げればいいでしょうか?
- レベル1:「売上を上げたい」
- レベル2:「来店客数を増やすことで売上を上げたい」
- レベル3:「平日の来店客数を増やすことで売上を上げたい」
- レベル4:「平日午後の20〜30代女性の来店客数を増やしたい」
- レベル5:「平日午後14〜17時の20〜30代女性の来店客数を、今より20%増やしたい」
レベルが深くなるほど明確になりますが、深すぎると視野が狭くなり、別の重要な発見を見落とすリスクが出てきます。逆に、浅すぎると分析の方向性が定まらず、データを集めても答えが出ない。適切な深さを見極めるのが、ベテランの腕の見せどころです。
最初に決めたゴールが正しいとは限らない
もうひとつの難しさは、最初に立てた問題自体が間違っていることがある点です。「売上を上げたい」と思って分析を始めたら、実は「お客さんの満足度が低い」というもっと根本的な問題が見えてきた──そんなケースは珍しくありません。
つまり、分析を進めるうちに「最初の問題設定」自体を見直す必要が出てくる。これがデータ分析の難しさであり、面白さでもあります。
問題の明確化には「正解」がありません。最初に決めた問題で進めながら、分析の中で「本当に解くべき問題は何か?」を問い直し続ける──これがデータ分析の本当の姿です。
「これでいいのかな?」って迷うのが普通! ベテランでも問題設定で悩むんだよ! 大事なのは、迷いながらも考え続けること!
4. 目的と目標を取り違えないで
問題の明確化と並んで大切なのが、「目的」と「目標」の区別です。データ分析でも、ビジネスでも、人生でも──ここを間違えると、頑張っているのに望む結果にたどり着かない、という悲しい状況になりがちです。
目的と目標の違い
- 目的:最終的に達成したいこと。本当に手に入れたい状態
- 目標:目的に近づくための中間ゴール。目的を達成するための手段
目的は1つでも、目標は複数あることが多いです。そして、目標は手段なので、状況に応じて変えてもいいもの。一方で、目的を変えてしまうと、何のために頑張っているのかわからなくなります。
例:統計検定3級の場合
この講座を受講されているみなさんに、率直にお伝えしたいことがあります。
みなさんが本当に手に入れたいのは何でしょうか? おそらく──「データを使って判断できる力」「業務で数字を俯瞰的に見られるようになりたい」「ビジネスで成果を出したい」、こういったことではないでしょうか。これが目的です。
では、「統計検定3級に合格すること」はどうでしょうか? これは目的ではなく目標です。データ分析の基礎を体系的に学ぶための、優れたチェックポイント。3級を勉強する過程で、データの見方や分析の作法が身につく──だから受験する価値があるわけです。
ところが、ここで「3級合格」を目的にしてしまうと、おかしなことが起こります。
| 状態 | 行動 | 結果 |
|---|---|---|
| 目的=データで判断できる力 | 3級学習を通じて分析力を養う | 業務で数字が読めるようになる |
| 目的=3級合格そのもの | 過去問を解くだけの作業に | 合格しても業務で使えない |
テストだけ合格すればいいになってしまうと、本来の目的──売上を上げたい、業務を改善したい──には到達しません。試験の点数のために統計を学ぶのではなく、業務で活かすために統計を学ぶ。そのチェックポイントとして3級を受ける。この順番を大切にしてほしいんです。
現場でのリアルな例 ─ ダッシュボード開発
私自身、コンサルタントとして現場で何度も目にしてきた「目的と目標の取り違え」の例があります。
ある会社で、データを可視化するダッシュボードを開発したケース。目的は「データを可視化することで、ビジネスの意思決定を加速する」こと。目標は「ダッシュボードを構築する」こと。これは綺麗な目的・目標の関係に見えました。
ところが、ダッシュボードが完成して数か月後──誰も指標を見なくなっていたのです。なぜでしょうか? ダッシュボードが自動で数値を更新してくれるので、「数字は更新されている」という事実だけで安心してしまった。目標(ダッシュボード構築)が達成されたところで、思考が止まっていたんですね。
似たような話で、業務改善の現場でもこんなことがあります。「業務改善で楽になる → よりスピーディーに数字を把握して、別の重要な仕事に時間を回す」──これが本来の目的のはず。でも、しばしば「業務改善で楽になる → ただ楽をする」に変質してしまう現場があります。
これらは決して、関わった人たちが怠惰なわけではありません。目標を達成した瞬間に、目的を見失いやすい──これは人間の性質に近いものです。だからこそ、定期的に「これは何のためにやっているんだっけ?」と立ち戻る習慣が大切です。
目的(最終的に達成したいこと)と目標(そのための中間ゴール)を混同しないこと。目標は手段にすぎません。目標を達成しても、目的に向かっていなければ意味がない──これは私自身が今も気をつけ続けているテーマです。
3級の勉強って、目的じゃなくて目標! みんなが本当に欲しいのは「データで判断できる力」だよね! そこを忘れずに、楽しく勉強していこう!
5. 揺らいでも、立ち戻ればいい
ここまで「問題の明確化」「目的と目標の区別」を学んできましたが、実際の現場ではこれらは絶えず揺らぎます。最初に決めた問題が違っていることに気づく、目標を追ううちに目的を見失う、新しい情報が入ってきて全体像が変わる──分析作業中は常に、自分の立ち位置が揺れているものです。
揺らぐことは悪くない
ここで大切なのは、揺らぐことそのものは悪くないということ。むしろ、揺らぐから新しい発見があり、より深い理解に到達できます。問題なのは揺らいだまま流されてしまうことです。
立ち戻る習慣を持つ
揺らぎへの対処法はシンプルです。定期的に「立ち戻る」こと。
- 「私は今、何をしているんだっけ?」
- 「これは何のためにやっているんだっけ?」
- 「目的に近づいているかな?」
- 「最初に決めた問題は、今でも正しい?」
週に1回、月に1回、節目ごとに──時間を取って自分に問いかける。すると、知らないうちに脱線していたことに気づけます。気づけたら、軌道修正すればいい。それだけのことです。
私自身、講師として活動してきて、何度も「これは目的なのか、目標なのか?」を問い直してきました。ある時は受講生の合格率を追いかけすぎて、「学ぶ楽しさ」を見失いそうになったこともあります。誰でも、何度でも、揺らぎます。だから、立ち戻る習慣が大切なんです。
揺らぐのは自然なこと。定期的に立ち戻って、目的を再確認する習慣を持てば、揺らいでも軌道修正できます。データ分析でも、人生でも、これは普遍的に大切な姿勢です。
まとめ
第8章のスタートとなる本ページ、ポイントを整理しておきましょう。
- データ分析の本質:問題を解決すること。手法やデータは手段
- PPDACサイクル:Problem → Plan → Data → Analysis → Conclusion の5段階
- サイクルなので回し続ける:結論が出たら次の問題が生まれる
- P(問題の明確化)がいちばん難しい:明確化の深さに正解はない
- 目的と目標を取り違えない:目標は手段。目的を見失うと、頑張っても望む結果に到達しない
- 揺らいでも立ち戻る:定期的に「何のためにやっているか」を問い直す
第8章の残りのページでは、PPDACサイクルのPlanとDataの段階で必要になる、具体的な知識を整理していきます。次回は実験研究と観察研究──データの集め方の基本的な2つのアプローチを学びましょう。