第8章 8-1 / データの収集:実験・観察・調査

統計的問題解決におけるデータの収集

このページで学ぶこと

いよいよ第8章「データの収集:実験・観察・調査」に入ります。これまでは「集まったデータをどう料理するか」を学んできましたが、第8章では一歩戻って、「そもそもデータをどう集めるか」を考えます。

本ページでは、データ分析の標準的フレームワークであるPPDACサイクルを整理し、その出発点である「問題の明確化」がいかに重要で、しかし難しいかを掘り下げます。実は、これがデータ分析でいちばん深い落とし穴なんです。

1. データ分析は「問題解決」のためにある

統計検定3級も終盤に差しかかってきました。ここで一度、立ち止まって考えてみたい問いがあります。

「データ分析って、何のためにやるんだろう?」

数字を計算するため? グラフを作るため? 検定に合格するため? ──いえ、それは手段です。データ分析の本当の目的は、「問題を解決すること」。困っていることや知りたいことがあって、その答えを出すためにデータを使う。これがデータ分析の本質です。

料理にたとえてみると

データ分析を料理にたとえるなら、これまで第1章〜第7章で学んできたのは「包丁の使い方」「火加減」「盛り付け方」といった調理技術です。とても大切なスキルです。でも、そのまえに「何を作るか」「誰のために作るか」「どんな食材を仕入れるか」を決めなければ、料理は始まりません。

第8章は、「データという食材を、どう仕入れるか」──この前段階の話です。良い料理は良い食材から。同じく、良い分析は良いデータから始まります。そしてさらに前段に、「そもそも何のために料理するのか」という根本の問いがあります。

POINT

データ分析は「問題を解決するための営み」です。データそのものや分析手法は手段にすぎません。「何のために分析するのか」を見失うと、どんなに高度な手法を使っても、本来欲しかった答えにはたどり着けません。

さえちゃん
さえ

「何のためにこのデータを見ているの?」って自問する習慣、すごく大事だよ! 第8章では、その「目的」を立てる段階から丁寧に学んでいくよ!

2. PPDACサイクル ─ 統計的問題解決の標準フレーム

データ分析を体系的に進めるために、世界中で使われているフレームワークがPPDACサイクルです。問題解決の流れを5つの段階に整理したもので、ニュージーランドの統計教育で広まり、今では国際的な標準になっています。

5つの段階

PPDACという名前は、5つの段階の頭文字を取ったものです。

記号 段階 やること
PProblem(問題の明確化)解決したい問題は何か、何を知りたいかをはっきりさせる
PPlan(調査の計画)どんなデータを、どう集めるかを設計する
DData(データの収集)実際にデータを集める。実験・観察・調査など
AAnalysis(分析)集めたデータを分析する。第1章〜第7章のスキルが活きる
CConclusion(結論)分析結果から、最初の問題への答えを導く

各段階を詳しく見ていく

それぞれの段階で、何をするのかを具体的にしておきましょう。

① Problem(問題の明確化)

解決したい問題、知りたいことを言葉にする段階です。例えば、こんな感じ。

ここがPPDACサイクルの出発点であり、もっとも重要な段階です。出発点が間違っていると、いくら丁寧に分析しても、欲しかった答えは得られません。本ページの後半で、この「問題の明確化」の難しさを掘り下げます。

② Plan(調査の計画)

問題を解くために「どんなデータが必要か」「どうやって集めるか」を設計する段階です。

8-2「実験研究と観察研究」、8-3「全数調査と標本調査」、8-4「無作為抽出法」では、このPlanの段階で必要な知識を整理していきます。

③ Data(データの収集)

設計した計画に従って、実際にデータを集める段階です。アンケートを実施する、計測機器を設置する、過去の記録を集約する、など。計画通りに集められないこともよくあるので、現場での柔軟さも必要です。

④ Analysis(分析)

集めたデータを使って分析する段階。第1章〜第7章で学んだスキルがすべて活きるのがここです。度数分布表、ヒストグラム、相関係数、回帰直線──これらは全部、Aの段階で使う道具でした。

⑤ Conclusion(結論)

分析結果から、最初のProblemに対する答えを出す段階です。

そして大切なのは、結論が出たら次のサイクルにつなげること。「平日の来店客数を増やすには、何をすべきか?」という新しい問題が生まれて、Pに戻る。データ分析は1回で終わるものではなく、サイクルとして回し続けるのです。

POINT

PPDACサイクルはProblem → Plan → Data → Analysis → Conclusionの5段階。サイクルなので、結論が出たら次の問題が生まれて、また回り始めます。分析は1回切りではなく、繰り返すことで深まっていくものです。

さえちゃん
さえ

PPDACって覚えやすいフレームワーク! でもね、サイクルだから「グルグル回す」っていうのが大切なポイント! 1回やって終わり、じゃないんだよ!

3. いちばん難しいのは「P」 ─ 問題の明確化

ここからが本ページの核心です。PPDACサイクルの中でも、最初のP(Problem)がいちばん難しい──これは多くのデータ分析者が口を揃えて言うところです。

「明確化する」のはどこまで?

「問題を明確化しましょう」と言うのは簡単ですが、実は「どこまで明確化すればいいのか」という基準がありません。たとえば「売上を上げたい」という漠然とした願いから出発したとき、これをどこまで掘り下げればいいでしょうか?

レベルが深くなるほど明確になりますが、深すぎると視野が狭くなり、別の重要な発見を見落とすリスクが出てきます。逆に、浅すぎると分析の方向性が定まらず、データを集めても答えが出ない適切な深さを見極めるのが、ベテランの腕の見せどころです。

最初に決めたゴールが正しいとは限らない

もうひとつの難しさは、最初に立てた問題自体が間違っていることがある点です。「売上を上げたい」と思って分析を始めたら、実は「お客さんの満足度が低い」というもっと根本的な問題が見えてきた──そんなケースは珍しくありません。

つまり、分析を進めるうちに「最初の問題設定」自体を見直す必要が出てくる。これがデータ分析の難しさであり、面白さでもあります。

POINT

問題の明確化には「正解」がありません。最初に決めた問題で進めながら、分析の中で「本当に解くべき問題は何か?」を問い直し続ける──これがデータ分析の本当の姿です。

さえちゃん
さえ

「これでいいのかな?」って迷うのが普通! ベテランでも問題設定で悩むんだよ! 大事なのは、迷いながらも考え続けること!

4. 目的と目標を取り違えないで

問題の明確化と並んで大切なのが、「目的」と「目標」の区別です。データ分析でも、ビジネスでも、人生でも──ここを間違えると、頑張っているのに望む結果にたどり着かない、という悲しい状況になりがちです。

目的と目標の違い

目的は1つでも、目標は複数あることが多いです。そして、目標は手段なので、状況に応じて変えてもいいもの。一方で、目的を変えてしまうと、何のために頑張っているのかわからなくなります。

例:統計検定3級の場合

この講座を受講されているみなさんに、率直にお伝えしたいことがあります。

みなさんが本当に手に入れたいのは何でしょうか? おそらく──「データを使って判断できる力」「業務で数字を俯瞰的に見られるようになりたい」「ビジネスで成果を出したい」、こういったことではないでしょうか。これが目的です。

では、「統計検定3級に合格すること」はどうでしょうか? これは目的ではなく目標です。データ分析の基礎を体系的に学ぶための、優れたチェックポイント。3級を勉強する過程で、データの見方や分析の作法が身につく──だから受験する価値があるわけです。

ところが、ここで「3級合格」を目的にしてしまうと、おかしなことが起こります。

状態 行動 結果
目的=データで判断できる力3級学習を通じて分析力を養う業務で数字が読めるようになる
目的=3級合格そのもの過去問を解くだけの作業に合格しても業務で使えない

テストだけ合格すればいいになってしまうと、本来の目的──売上を上げたい、業務を改善したい──には到達しません。試験の点数のために統計を学ぶのではなく、業務で活かすために統計を学ぶ。そのチェックポイントとして3級を受ける。この順番を大切にしてほしいんです。

現場でのリアルな例 ─ ダッシュボード開発

私自身、コンサルタントとして現場で何度も目にしてきた「目的と目標の取り違え」の例があります。

ある会社で、データを可視化するダッシュボードを開発したケース。目的は「データを可視化することで、ビジネスの意思決定を加速する」こと。目標は「ダッシュボードを構築する」こと。これは綺麗な目的・目標の関係に見えました。

ところが、ダッシュボードが完成して数か月後──誰も指標を見なくなっていたのです。なぜでしょうか? ダッシュボードが自動で数値を更新してくれるので、「数字は更新されている」という事実だけで安心してしまった。目標(ダッシュボード構築)が達成されたところで、思考が止まっていたんですね。

似たような話で、業務改善の現場でもこんなことがあります。「業務改善で楽になる → よりスピーディーに数字を把握して、別の重要な仕事に時間を回す」──これが本来の目的のはず。でも、しばしば「業務改善で楽になる → ただ楽をする」に変質してしまう現場があります。

これらは決して、関わった人たちが怠惰なわけではありません。目標を達成した瞬間に、目的を見失いやすい──これは人間の性質に近いものです。だからこそ、定期的に「これは何のためにやっているんだっけ?」と立ち戻る習慣が大切です。

POINT

目的(最終的に達成したいこと)目標(そのための中間ゴール)を混同しないこと。目標は手段にすぎません。目標を達成しても、目的に向かっていなければ意味がない──これは私自身が今も気をつけ続けているテーマです。

さえちゃん
さえ

3級の勉強って、目的じゃなくて目標! みんなが本当に欲しいのは「データで判断できる力」だよね! そこを忘れずに、楽しく勉強していこう!

5. 揺らいでも、立ち戻ればいい

ここまで「問題の明確化」「目的と目標の区別」を学んできましたが、実際の現場ではこれらは絶えず揺らぎます。最初に決めた問題が違っていることに気づく、目標を追ううちに目的を見失う、新しい情報が入ってきて全体像が変わる──分析作業中は常に、自分の立ち位置が揺れているものです。

揺らぐことは悪くない

ここで大切なのは、揺らぐことそのものは悪くないということ。むしろ、揺らぐから新しい発見があり、より深い理解に到達できます。問題なのは揺らいだまま流されてしまうことです。

立ち戻る習慣を持つ

揺らぎへの対処法はシンプルです。定期的に「立ち戻る」こと。

週に1回、月に1回、節目ごとに──時間を取って自分に問いかける。すると、知らないうちに脱線していたことに気づけます。気づけたら、軌道修正すればいい。それだけのことです。

私自身、講師として活動してきて、何度も「これは目的なのか、目標なのか?」を問い直してきました。ある時は受講生の合格率を追いかけすぎて、「学ぶ楽しさ」を見失いそうになったこともあります。誰でも、何度でも、揺らぎます。だから、立ち戻る習慣が大切なんです。

POINT

揺らぐのは自然なこと。定期的に立ち戻って、目的を再確認する習慣を持てば、揺らいでも軌道修正できます。データ分析でも、人生でも、これは普遍的に大切な姿勢です。

まとめ

第8章のスタートとなる本ページ、ポイントを整理しておきましょう。

第8章の残りのページでは、PPDACサイクルのPlanDataの段階で必要になる、具体的な知識を整理していきます。次回は実験研究と観察研究──データの集め方の基本的な2つのアプローチを学びましょう。