第1章 1-5 / データの記述と要約

ローレンツ曲線とジニ係数

このページで学ぶこと

平均や標準偏差は「中心」や「ばらつき」を教えてくれますが、「富がどれくらい偏っているか」──不平等の度合いは、それだけではうまく表せません。そこで登場するのがローレンツ曲線ジニ係数です。所得格差のニュースで「ジニ係数が上昇」と聞いたことがあるかもしれませんね。

このページでは、累積の割合どうしを対応させて描くローレンツ曲線のしくみと、その曲線と「完全平等線」で挟まれた面積からジニ係数がどう生まれるかを、4世帯の小さな数値例で一歩ずつ計算しながら確かめます。図と式がセットで腑に落ちるはずですよ。

さえちゃん
さえ

「みんなが平等に持ってる」のか「一部の人に集中してる」のか。これを1本の曲線と1つの数字で表すのが、ローレンツ曲線とジニ係数だよ。計算は足し算と台形の面積だけ。怖がらずについてきてね!

1. なぜ「不平等」を測る道具が必要なのか

2つの町を考えてみましょう。どちらも住民の平均所得は同じ300万円です。でも、A町は全員がほぼ300万円ずつ。B町は大半が低所得で、ごく一部の大富豪が平均を押し上げている。平均は同じなのに、暮らしの実感はまるで違います

この「違い」を数字でとらえたいのが、不平等度の指標です。標準偏差でもばらつきは測れますが、所得や資産のように「全体のうち、上位の何割が、全体の何割を握っているか」を見たいときには、累積の割合に注目する専用の道具のほうが直感的です。それがローレンツ曲線です。

ローレンツ曲線のアイデア

ローレンツ曲線は、次の2つの「累積の割合」を対応させてプロットした曲線です。

たとえば「所得の低いほうから40%の世帯が、全所得の15%しか持っていない」なら、点 $(0.4,\ 0.15)$ を打つ、という具合です。これを下位から上位まで並べて結んだ折れ線(曲線)が、ローレンツ曲線になります。

2. 完全平等線(45度線)とローレンツ曲線

まず基準になる線を押さえましょう。もし全員がぴったり同じ所得なら、下位40%の人はちょうど全所得の40%を、下位70%なら70%を持っているはずです。つまり横軸の値と縦軸の値がいつも等しい。これを結ぶと、原点から右上の角 $(1,1)$ へ向かう45度の直線になります。これを完全平等線と呼びます。

POINT

完全平等線は $y=x$ の直線です。実際のデータでは、低所得層は人数の割に所得が少ないので、ローレンツ曲線は必ず完全平等線の下側にたるんで(下に膨らんで)描かれます。たるみが大きいほど不平等が大きい──これがローレンツ曲線の読み方の核心です。

下の図で、まっすぐな対角線が完全平等線、その下に弓なりにへこんでいるのがローレンツ曲線です。2本の線で挟まれた色のついた部分(面積 $A$)が「平等からのズレ」を表しています。

人数の累積割合(下位から) 所得の累積割合 0 1.0 0 1.0 完全平等線 ローレンツ曲線 A

完全平等線(破線)とローレンツ曲線(実線)。挟まれた面積 A が大きいほど不平等

3. ジニ係数の定義

ローレンツ曲線の「たるみ具合」を1つの数字にしたのがジニ係数です。発案者の名前(ジニ)から来ています。定義はとてもシンプルで、完全平等線とローレンツ曲線で挟まれた面積 $A$ を使って次のように書けます。

FORMULA

完全平等線とローレンツ曲線で挟まれた面積を $A$、ローレンツ曲線の下側の面積を $B$ とすると、 $$\text{ジニ係数} = \frac{A}{A+B} = \frac{A}{0.5} = 2A$$

ここで $A+B$ は、完全平等線・横軸・右端の縦線で囲まれる直角三角形の面積で、$\dfrac{1}{2}\times 1 \times 1 = 0.5$ です。だから「$A$ を $0.5$ で割る」=「$A$ を2倍する」だけで求まります。

ジニ係数の範囲と読み方

ジニ係数は必ず $0$ 以上 $1$ 以下の値を取ります。両端の意味をつかんでおきましょう。

ジニ係数状態ローレンツ曲線
0完全平等(全員が同じ所得)完全平等線とぴったり重なる($A=0$)
0 に近い平等に近いたるみが小さい
1 に近い不平等が大きいたるみが大きい
1完全不平等(1人が全部を独占)横軸ぎりぎりを這い、最後に急上昇

実際の国の所得ジニ係数は、おおむね $0.25$〜$0.6$ あたりに収まります。$0$ や $1$ はあくまで理論上の両端で、現実には出てこない、と覚えておくとよいでしょう。

さえちゃん
さえ

ポイントは「面積を2倍するだけ」! 三角形全体が $0.5$ だから、ズレの面積 $A$ を $0.5$ で割れば、それが「全体に対する不平等の割合」になるってわけ。次は実際に数えてみよう!

4. 数値例:台形近似でジニ係数を計算する

では、実際に手を動かしてみましょう。ある地区の4世帯の年間所得(万円)が、低い順に次のとおりだったとします。

DATA

4世帯の所得:100, 150, 250, 500(万円) 合計 1000 万円

ステップ1:累積割合を求める

世帯は4つなので、人数の累積割合は1世帯ごとに $0.25$ ずつ増えます。所得のほうは、低い世帯から順に足していき、合計 $1000$ で割って累積シェアにします。

世帯(低い順)所得累積所得人数の累積割合 $x$所得の累積割合 $y$
0(原点)000
第1世帯1001000.250.10
第2世帯1502500.500.25
第3世帯2505000.750.50
第4世帯50010001.001.00

この $(x,\,y)$ の5点 $(0,0),\,(0.25,0.10),\,(0.50,0.25),\,(0.75,0.50),\,(1,1)$ を順に結べば、ローレンツ曲線(折れ線)の完成です。先ほどの図は、まさにこのデータを描いたものです。

ステップ2:曲線の下の面積 $B$ を台形で求める

隣り合う2点の間は直線(台形の斜辺)でつながっています。台形の面積は「(上底+下底)÷ 2 × 幅」。ここでの「上底・下底」は左右の点の $y$ 座標、「幅」は $x$ の刻みで、つねに $0.25$ です。4つの台形を足し合わせます。

DERIVATION

$$ \begin{aligned} B &= \tfrac{0+0.10}{2}(0.25) + \tfrac{0.10+0.25}{2}(0.25) + \tfrac{0.25+0.50}{2}(0.25) + \tfrac{0.50+1.00}{2}(0.25)\\[2pt] &= 0.0125 + 0.04375 + 0.09375 + 0.1875\\[2pt] &= 0.3375 \end{aligned} $$

ステップ3:$A$ を出してジニ係数へ

三角形全体の面積は $0.5$ なので、平等線と曲線で挟まれた面積 $A$ は「全体 $-$ 曲線の下」で出ます。あとは $2A$ を計算するだけです。

DERIVATION

$$ \begin{aligned} A &= 0.5 - B = 0.5 - 0.3375 = 0.1625\\[2pt] \text{ジニ係数} &= 2A = 2 \times 0.1625 = 0.325 \end{aligned} $$

RESULT

この4世帯のジニ係数は 0.325。$0$(完全平等)と $1$(完全不平等)のあいだの、やや不平等寄り、と読めます。最も所得の高い1世帯(全体の25%)が、全所得の半分($1.00-0.50=0.50$)を占めていることが、たるみの大きさに表れています。

POINT

計算の流れは「累積割合を作る → 台形で曲線の下の面積 $B$ → $A=0.5-B$ → ジニ係数 $=2A$」の4手順。台形の幅はデータが等人数の組なら一定(ここでは $0.25$)なので、上底+下底をどんどん足していくだけです。試験でもこの手順がそのまま使えます。

5. 使いどころと注意点

ローレンツ曲線とジニ係数は、所得だけでなく資産・売上・市場シェアなど「一部に集中しているか」を見たいあらゆる場面で使えます。たとえば「上位2割の顧客が売上の8割を占める」といった集中度の議論も、同じ枠組みで扱えます。

便利な一方で、いくつか気をつけたい点があります。

さえちゃん
さえ

ジニ係数、ちゃんと自分の手で $0.325$ まで出せたね! 「曲線のたるみ=面積 $A$」「ジニ係数=$2A$」のセットさえ覚えておけば大丈夫。次は単位の違うデータを比べる『標準化』を学ぶよ!

まとめ

第1章 1-5、ポイントを整理します。

次回 1-6 標準化・変動係数・指数化 では、単位や規模の違うデータを同じ物差しに乗せて比べる方法を学びます。zスコア・偏差値・変動係数・指数化と、実務でも頻出の道具がそろい踏みです。