ローレンツ曲線とジニ係数
平均や標準偏差は「中心」や「ばらつき」を教えてくれますが、「富がどれくらい偏っているか」──不平等の度合いは、それだけではうまく表せません。そこで登場するのがローレンツ曲線とジニ係数です。所得格差のニュースで「ジニ係数が上昇」と聞いたことがあるかもしれませんね。
このページでは、累積の割合どうしを対応させて描くローレンツ曲線のしくみと、その曲線と「完全平等線」で挟まれた面積からジニ係数がどう生まれるかを、4世帯の小さな数値例で一歩ずつ計算しながら確かめます。図と式がセットで腑に落ちるはずですよ。
「みんなが平等に持ってる」のか「一部の人に集中してる」のか。これを1本の曲線と1つの数字で表すのが、ローレンツ曲線とジニ係数だよ。計算は足し算と台形の面積だけ。怖がらずについてきてね!
1. なぜ「不平等」を測る道具が必要なのか
2つの町を考えてみましょう。どちらも住民の平均所得は同じ300万円です。でも、A町は全員がほぼ300万円ずつ。B町は大半が低所得で、ごく一部の大富豪が平均を押し上げている。平均は同じなのに、暮らしの実感はまるで違います。
この「違い」を数字でとらえたいのが、不平等度の指標です。標準偏差でもばらつきは測れますが、所得や資産のように「全体のうち、上位の何割が、全体の何割を握っているか」を見たいときには、累積の割合に注目する専用の道具のほうが直感的です。それがローレンツ曲線です。
ローレンツ曲線のアイデア
ローレンツ曲線は、次の2つの「累積の割合」を対応させてプロットした曲線です。
- 横軸:所得の低い人から順に並べたときの人数の累積割合(下位何%の人か)
- 縦軸:その人たちが受け取っている所得の累積割合(全所得の何%か)
たとえば「所得の低いほうから40%の世帯が、全所得の15%しか持っていない」なら、点 $(0.4,\ 0.15)$ を打つ、という具合です。これを下位から上位まで並べて結んだ折れ線(曲線)が、ローレンツ曲線になります。
2. 完全平等線(45度線)とローレンツ曲線
まず基準になる線を押さえましょう。もし全員がぴったり同じ所得なら、下位40%の人はちょうど全所得の40%を、下位70%なら70%を持っているはずです。つまり横軸の値と縦軸の値がいつも等しい。これを結ぶと、原点から右上の角 $(1,1)$ へ向かう45度の直線になります。これを完全平等線と呼びます。
完全平等線は $y=x$ の直線です。実際のデータでは、低所得層は人数の割に所得が少ないので、ローレンツ曲線は必ず完全平等線の下側にたるんで(下に膨らんで)描かれます。たるみが大きいほど不平等が大きい──これがローレンツ曲線の読み方の核心です。
下の図で、まっすぐな対角線が完全平等線、その下に弓なりにへこんでいるのがローレンツ曲線です。2本の線で挟まれた色のついた部分(面積 $A$)が「平等からのズレ」を表しています。
完全平等線(破線)とローレンツ曲線(実線)。挟まれた面積 A が大きいほど不平等
3. ジニ係数の定義
ローレンツ曲線の「たるみ具合」を1つの数字にしたのがジニ係数です。発案者の名前(ジニ)から来ています。定義はとてもシンプルで、完全平等線とローレンツ曲線で挟まれた面積 $A$ を使って次のように書けます。
完全平等線とローレンツ曲線で挟まれた面積を $A$、ローレンツ曲線の下側の面積を $B$ とすると、 $$\text{ジニ係数} = \frac{A}{A+B} = \frac{A}{0.5} = 2A$$
ここで $A+B$ は、完全平等線・横軸・右端の縦線で囲まれる直角三角形の面積で、$\dfrac{1}{2}\times 1 \times 1 = 0.5$ です。だから「$A$ を $0.5$ で割る」=「$A$ を2倍する」だけで求まります。
ジニ係数の範囲と読み方
ジニ係数は必ず $0$ 以上 $1$ 以下の値を取ります。両端の意味をつかんでおきましょう。
| ジニ係数 | 状態 | ローレンツ曲線 |
|---|---|---|
| 0 | 完全平等(全員が同じ所得) | 完全平等線とぴったり重なる($A=0$) |
| 0 に近い | 平等に近い | たるみが小さい |
| 1 に近い | 不平等が大きい | たるみが大きい |
| 1 | 完全不平等(1人が全部を独占) | 横軸ぎりぎりを這い、最後に急上昇 |
実際の国の所得ジニ係数は、おおむね $0.25$〜$0.6$ あたりに収まります。$0$ や $1$ はあくまで理論上の両端で、現実には出てこない、と覚えておくとよいでしょう。
ポイントは「面積を2倍するだけ」! 三角形全体が $0.5$ だから、ズレの面積 $A$ を $0.5$ で割れば、それが「全体に対する不平等の割合」になるってわけ。次は実際に数えてみよう!
4. 数値例:台形近似でジニ係数を計算する
では、実際に手を動かしてみましょう。ある地区の4世帯の年間所得(万円)が、低い順に次のとおりだったとします。
4世帯の所得:100, 150, 250, 500(万円) 合計 1000 万円
ステップ1:累積割合を求める
世帯は4つなので、人数の累積割合は1世帯ごとに $0.25$ ずつ増えます。所得のほうは、低い世帯から順に足していき、合計 $1000$ で割って累積シェアにします。
| 世帯(低い順) | 所得 | 累積所得 | 人数の累積割合 $x$ | 所得の累積割合 $y$ |
|---|---|---|---|---|
| 0(原点) | ― | 0 | 0 | 0 |
| 第1世帯 | 100 | 100 | 0.25 | 0.10 |
| 第2世帯 | 150 | 250 | 0.50 | 0.25 |
| 第3世帯 | 250 | 500 | 0.75 | 0.50 |
| 第4世帯 | 500 | 1000 | 1.00 | 1.00 |
この $(x,\,y)$ の5点 $(0,0),\,(0.25,0.10),\,(0.50,0.25),\,(0.75,0.50),\,(1,1)$ を順に結べば、ローレンツ曲線(折れ線)の完成です。先ほどの図は、まさにこのデータを描いたものです。
ステップ2:曲線の下の面積 $B$ を台形で求める
隣り合う2点の間は直線(台形の斜辺)でつながっています。台形の面積は「(上底+下底)÷ 2 × 幅」。ここでの「上底・下底」は左右の点の $y$ 座標、「幅」は $x$ の刻みで、つねに $0.25$ です。4つの台形を足し合わせます。
$$ \begin{aligned} B &= \tfrac{0+0.10}{2}(0.25) + \tfrac{0.10+0.25}{2}(0.25) + \tfrac{0.25+0.50}{2}(0.25) + \tfrac{0.50+1.00}{2}(0.25)\\[2pt] &= 0.0125 + 0.04375 + 0.09375 + 0.1875\\[2pt] &= 0.3375 \end{aligned} $$
ステップ3:$A$ を出してジニ係数へ
三角形全体の面積は $0.5$ なので、平等線と曲線で挟まれた面積 $A$ は「全体 $-$ 曲線の下」で出ます。あとは $2A$ を計算するだけです。
$$ \begin{aligned} A &= 0.5 - B = 0.5 - 0.3375 = 0.1625\\[2pt] \text{ジニ係数} &= 2A = 2 \times 0.1625 = 0.325 \end{aligned} $$
この4世帯のジニ係数は 0.325。$0$(完全平等)と $1$(完全不平等)のあいだの、やや不平等寄り、と読めます。最も所得の高い1世帯(全体の25%)が、全所得の半分($1.00-0.50=0.50$)を占めていることが、たるみの大きさに表れています。
計算の流れは「累積割合を作る → 台形で曲線の下の面積 $B$ → $A=0.5-B$ → ジニ係数 $=2A$」の4手順。台形の幅はデータが等人数の組なら一定(ここでは $0.25$)なので、上底+下底をどんどん足していくだけです。試験でもこの手順がそのまま使えます。
5. 使いどころと注意点
ローレンツ曲線とジニ係数は、所得だけでなく資産・売上・市場シェアなど「一部に集中しているか」を見たいあらゆる場面で使えます。たとえば「上位2割の顧客が売上の8割を占める」といった集中度の議論も、同じ枠組みで扱えます。
便利な一方で、いくつか気をつけたい点があります。
- 1つの数字に圧縮しているので、ジニ係数が同じでもローレンツ曲線の形(どの層で偏っているか)は違うことがあります。可能なら曲線そのものも見るのが安全です。
- マイナスの値には向きません。所得に赤字(負)が混じると累積シェアの考え方が崩れます。
- 台形近似は区切りが粗いと面積を多少小さめに見積もる傾向があります。世帯数(区切り)が多いほど、真の曲線に近づき正確になります。
ジニ係数、ちゃんと自分の手で $0.325$ まで出せたね! 「曲線のたるみ=面積 $A$」「ジニ係数=$2A$」のセットさえ覚えておけば大丈夫。次は単位の違うデータを比べる『標準化』を学ぶよ!
まとめ
第1章 1-5、ポイントを整理します。
- ローレンツ曲線:横軸に人数の累積割合、縦軸に所得の累積割合をとった曲線。下に膨らむほど不平等
- 完全平等線:$y=x$ の45度線。全員が同じ所得ならこの線に一致する
- ジニ係数:平等線と曲線で挟まれた面積 $A$ を使って $\text{ジニ係数}=\dfrac{A}{0.5}=2A$。範囲は $0$〜$1$
- 計算手順:累積割合 → 台形で曲線下の面積 $B$ → $A=0.5-B$ → $2A$
- 注意:同じジニ係数でも曲線の形は異なりうる。負の値には使えない
次回 1-6 標準化・変動係数・指数化 では、単位や規模の違うデータを同じ物差しに乗せて比べる方法を学びます。zスコア・偏差値・変動係数・指数化と、実務でも頻出の道具がそろい踏みです。