戴尔指数(英语:Theil Index)又称为泰尔指数[1],是一个衡量经济不平等[2]的统计量。它也曾经用来衡量其他社会不平等现象,如种族隔离[3][4][5]。
戴尔指数主要是利用信息论中的资讯熵的概念导出的。戴尔指数等于资讯冗余,也就是资料最大可能资讯熵减去观测到的资讯熵,它是广义熵指数的特例,可以被视为冗余度、单样性、不平等、非随机性和可压缩性的度量。[5]
戴尔指数最早由荷兰鹿特丹伊拉斯姆斯大学的计量经济学家亨利·戴尔(Henri Theil)所提出。[5]
数学公式
假设一个人口为N的群体,其收入分别为xi (i = 1,...,N),则它的戴尔指数T定义为[6]:
-  
而戴尔指数L则定义为
-  
其中 为第 个人的收入, 为平均收入, 为人口数量。加总符号中的第一项可以理解为个人在总收入中所占的比例,第二项为该个人相对于均值的收入。
如果收入分布是个离散分布函数 fk (k = 0,...,W),其中fk是收入为k的人口比例,而W = Nμ 代表总收入,可以得知   。
它的戴尔指数T定义为:
-  
这里的 一样是收入平均
-  
其中应注意到收入k是一个整数,k=1代表最小收入增量(比如新台币1元)。
如果收入分布是个连续分布函数f(k),k取值0到无穷,其中f(k) dk 是收入为k 到 k + dk的人口数量,那戴尔指数T定义为:
-  
其中平均 为:
-  
一些常见连续概率分布的戴尔指数如下表所示:
| 收入分布函数 | PDF(x) (x ≥ 0) | 戴尔指数(纳特) | 
|---|
 | 狄拉克δ函数 |  | 0 |  | 连续型均匀分布 |  |  |  | 指数分布 |  |  |  | 对数正态分布 |  |  |  | 帕累托分布 |  | (α>1) |  | 卡方分布 |  |  |  | 伽玛分布 |  |  |  | 韦伯分布 |  |  |  
 
如果每一个人都有相同的收入,即等于均值,则指数为零。如果某个个人拥有所有的收入,则指数为 。TT 除以  可以将方程归一化到0到1的范围,但这样违反独立公理:  并不符合衡量不平等的标准。
信息论推导
戴尔指数导自克劳德·夏农的信息熵,他的一般数学形式为:
-  
其中  是从人群里找到 的几率。 是玻尔兹曼常数。在信息论中,当信息以二进制数字给出时, 并且对数基底为2。在物理学和戴尔指数的计算中,选择自然对数作为对数基底。当 替换成人均收入 时,需要除以总收入达到归一化 。那可以导出,观察到的信息熵为:
-  
设 为戴尔指数, 为夏农熵,则有
 
其中,ln(N)是理论最大熵。香浓根据事件发生概率导出的其熵测度。它可以用戴尔系数解释为自某个特定个人处随机取得一块钱的概率。并与其第一项,即总收入中个人所占份额相同。
| 符号 | 信息论 | 戴尔指数 TT | 
|---|
|  | 字符数 | 人口数 | 
|  | 某个特定字符 | 某个特定人 | 
|  | 第i个字符 character | 第i个人的收入 | 
|  | 总字符数 | 总收入 | 
|  | 未被使用的资讯空间 | 未使用潜在价格机制 | 
可分解性
戴尔指数的一个优点是它是某个子群体中不平等的加权和[1]。例如,美国国内的不平等就是每个州的不平等的加权和,由该州收入相对于国家总收入的比值来加权。
如果人口被划分为 个子群体,  为群体  的收入比例, 为该子群体的戴尔指数,而   为子群体  的平均收入,则戴尔指数为
-  
因此,我们可以说某个特定群体给总体“贡献了”一定数量的不平等。
另外一个被广泛使用的不平等度量为基尼系数,该系数对于很多人来说由于基于劳伦茨曲线而非常直观。但是它却没有戴尔指数容易分解。
参考文献
外部链接
- 德克萨斯大学戴尔指数简介 (页面存档备份,存于互联网档案馆)(英文)
- 试算表: Income inequality metrics#Spreadsheet computations
- 免费在线计算器 计算基尼系数,绘制洛伦兹曲线,并为任何数据集计算许多其他浓度测量值
- Free Calculator: Online (页面存档备份,存于互联网档案馆) and downloadable scripts (Python and Lua) for Atkinson, Gini, and Hoover inequalities
- Users of the R (页面存档备份,存于互联网档案馆) data analysis software can install the "ineq" package which allows for computation of a variety of inequality indices including Gini, Atkinson, Theil.
- MATLAB 不平等包 (页面存档备份,存于互联网档案馆)。MATLAB不平等包,其中包括用于计算基尼,阿特金森,泰尔指数和标绘洛伦茨曲线的代码