收入差距的衡量指标有哪些,如何用excel计算协方差矩阵值

收入差距的衡量指标有什么?
居民收入差距测量的方式和指标林 宏 陈广汉在现代发展经济学中,经济学家提出了不少分析规模收入分配差别的方式和指标.在这些方式和指标中,有的是由收入分配理论推导出来的例如说洛伦茨曲线,基尼系数,库兹涅茨比率,沃尔夫森"极化指数"等;有的则是从统计学中发展出来的,例如人口(或家户)众数组的分布频率,测度很多人(或家户)所覆盖的绝对收入范围,还有测度低或高收入对平均收入偏离度的离散系数等;有的是从其他有关或相近学科中引入的,例如来自物理学的泰尔指数等.这里讲解几种经常会用到的.一,洛伦茨(Lorenz)曲线洛伦茨曲线早是美国经济统计学家M Lorenz为研究财富,土地和工资收入的分配是不是公平而提出的.在一个平面直角坐标系中,纵轴为收入百分比,横轴为人口(或家户)百分比,45度线为平均分配线,右下角的90度线为绝对非平均分配线.洛伦茨曲线处于45到90度当中.按照某国某年的收入分配分组资料,将一定人口(或家户)比重所对应的收入比重在图上描出,就可得到该国这一年的收入分配洛伦茨曲线.从洛伦茨曲线上可以直观地看出每个阶层的收入比重,从曲线的弯曲度可以观察到各个阶层的收入差别情况,通过对比不一样的曲线了解不一样国度总收入分配差别程度或同一国家不一样时期的收入差别变化情况.离45度线越远,离90度线越近的曲线表示的收入差别程度越大.但是,洛伦茨曲线没办法以一个确切的数值来表示收入差别,非常是当几条曲线相交时. 其积分的数学表达为:设收入变量u的分布函数为ρ(u),即收入为u的人员数量占总人员数量的百分比为ρ(u),总人口数为N,则收入小于t的人口数为 Nρ(u)du,占总人员数量百分比为:P(t)= ρ(u)du/N= ρ(u)du收入小于t的全部人员数量的收入之和(称积累收入)为 Nρ(u)du,它在总收入中的比重为I(t)= uNρ(u)du/ uNρ(u)du= uρ(u)du,这当中μ= uρ(u)du是收入u的希望值或社会总的平均收入.由以下两个参数方程决定的曲线即为洛伦茨曲线:P=P(t)= ρ(u)du 和 I=I(t)= uρ(u)du ,(t≥0)二,基尼(Gini)系数,或称基尼集中率基尼系数及计算基尼系数的方式是意大利经济学家(C.Gini1912)在洛伦茨曲线的基础上提出的,随后,瑞赛(Ricci,1916),道尔顿(Dalton,1920),尹特马(Yntema,1938),阿特金森(atkinson,1970),纽伯瑞(Newdery,1938),赛新斯基(Sheshinski,1972)等人又做了进一步研究.它用于进一步计算收入分配的差异程度.按照国际一般标准,基尼系数在0.3以下为好的平均状态,在0.3~0.4当中为正常状态,超越0.4为警戒状态,而超越0.6以上就属社会动乱随时出现的危险状态.Gini系数G的计算公式为:G= Sa/(Sa+Sb)式中Sa,Sb分别表示洛伦茨曲线与绝对平均线,洛伦茨曲线与绝对不平均线所围成的面积.当G=0,Sa=0,表达洛伦茨曲线与绝对平均线的重合,因而这个时候的收入分配是绝对平均的;当G=1,Sb=0时,表达洛伦茨曲线与绝对不平均线重合,而这个时候的收入分配是绝对不平均的,全部的收入都集中在一个人手中.明显0≤G≤1.在研究收入差距的文献中,基尼系数使用为广泛.终因素,是因为基尼系数有以下优点:(1)基尼系数能以一个数值反映整体收入差距状况. (2)基尼系数是国际经济学界所采取的流行的指标,因而具有比较上的方便.(3)基尼系数的计算方式有点多,方便利用各自不同的资料.(4)利用基尼系数也方便进行分解分析,可以将总收入的基尼系数(G)与其各个分项收入的关系写成:G=∑(Ui×Ci)这当中的Ui和Ci分别是第I项收入在总收入中所占的份额和集中率. 三,人口收入份额度量方式 (the income share of certain number population)用一定人口收入份额反映收入差距,在国际上是经常会用到工具之一.这里着重讲解以下几类方式:1,库兹涅茨比率.基尼系数之外,还有不少衡量收入不均等的方式.西蒙·库兹涅茨就提出过一种被称为"库兹涅茨比率"的方式-把各收入层的收入份额与人口份额当中差额的绝对值加相加起来,然后再去除以人口数.其计算公式为:这当中R为库兹涅茨比率,yi,Pi分别表示各阶层的收入份额和人口比重.库兹涅茨比率越大,则表示收入差距越大;反之则越小.库兹涅茨比率计算简单方便,比较合适用来反映群体内部的收入差距情况,特别合适比较两个群体内部的收入差距情况.这样的方式运用于规模收入分配时,所反映的不均等性要比基尼系数来得大些,因为它给富阶层和贫阶层的权数很大,中间阶层的权数较小.为了消除权数的不良影响,大家考虑用某些收入阶层的收入分配状况,来反映社会收入分配的差距水平.这当中主要是采取一定百分比的家户或者人口所占的收入份额作为指数来表示收入分配差距.这当中以库兹涅茨指数,阿鲁瓦利亚指数,收入不良指数和五分法(十分法)为典型.2,以富有的百分之20人口所占有的收入份额表示一个社会的收入分配状况,这一比率其实就是常说的大家一般所说的库兹涅茨指数.这一指数的低值为0.2,指数越高,则收入差别越大.一个极端的情况是,收入绝对平均的分配,既然如此那,,收入低的百分之20的社会成员将可以取得都收入的百分之20,当然对应地,收入高的百分之20的社会成员也仅仅得到了都收入的百分之20,这是不可能出现的.3,以百分之40低层人口所占有的收入份额来表示,一个社会的收入分配状况,这一比率其实就是常说的大家一般所说阿鲁瓦利亚指数.这一指数的高值为0.4,指数越低,收入差别越大.4,以高收入的百分之20的人所占有的收入份额与低收入的百分之20的人口所占有的收入份额之比表示一个社会的收入分配状况,这一比率其实就是常说的大家一般所说的收入不良指数(或者叫欧希玛指数),这—指数的低值为1,指数越高,收入差别越大.这一指数的性质和特点与前二者是完全一样的,但是,更周全和清晰一部分.这一方式,方便分收入层次考察收入差距,很详细,但是,在反映收入差距变化整体趋势方面略有不够.而以库兹涅茨指数和阿鲁瓦利亚指数之比计算的指数,则与收入不良指数具有同样的性质和意义.5,以收入分配水平(份额)高和低的各百分之20家户或者人口来测度一个社会的收入分配情况,同时那就说明把都家户或者人口分成了低收入,次低收入,中等收入,非常高收入和高收入五个层次,经济学中将此称为五分法.而在人口很多的国家和地区,五分法分层后,每一个层次的人员数量依然偏大,大家就又考虑十分法等更多的等分方式,以便让贫富两极的规模相对小些,比较的力度加大一部分.不过,以上指数都是以某一或某些阶层的收入份额的变化来反映收入差别变化的,其优点是方便分层考察,详细分析,缺点是不可以全面反映各个阶层的收入整别变化整体情况,其实就是常说的可以清楚想要获悉的局部情况,却没办法了解大多数情况下情况.6,沃尔夫森"极化指数"沃尔夫森(Michael C.Wolfson)1994年在《美国经济评论》上发表了一篇文章,针对阐述了他针对收入分配和不平等的问题有什么不一样的看法.1997年有两位学者Martin Ravallion and Shaohua Chen在世界银行的杂志上撰文分析了沃尔夫森研究成果.沃尔夫森觉得的两极分化,不是收入水平在两极当中差距极度拉大,而是总人口中穷人部分和富人部分都在更多.中等收入阶层的人员数量却在减少(他假设这一些人会后完全消失.其实就是常说的说社会后只剩下"有钱人"(haves)和"穷人"(have-nots)这两个有和一无全部的部分.为了测度他所说的两极分化情况,他提出了一个"极化指数".像基尼系数一样,这个指数也是处于0(没有分化)和1(完全分化)当中.当收入完全平等时,为0分化;当收入极度不平等时,其实就是常说的富人占有了都收入时,极化也就出现了,这时,1/2的人拥有的收入为0,另外1/2人则占有了平均收入的2倍.当然,常常的情况是出现这两极当中.用公式表示的沃尔夫森"极化指数":W=2(U*-U1)/M这当中,∪*指修正了的平均收入(平均收入×1—基尼系数);∪1指贫困的1/2人口的平均收入;M为中位收入.四,泰尔熵标准(Theil's entropy measure)或者泰尔指数(Theil index)作为衡量个人当中或者地区间收入差距(或者称不平等度)的指标,这一指数常常被使用.泰尔熵标准是由泰尔(Theil,1967)利用信息理论中的熵概念来计算收入不平等而得名.假设U是某一特定事件A将要出现的可能性,P(A)=U.这个事件出现的信息量为E(U)肯定是U的减函数.用公式表达为:E(U)=log(1/u).当有n个可能的事件1,2,…,n时,对应的可能性假设分别是U1,U2,…,Un,Ui≥0,并且∑Ui=1.熵或希望信息量可被当成每一件的信息量与其对应可能性乘积的总和: E(U)= ∑Uih(Ui)= ∑Ui log(1/Ui)明显,n种事件的可能性Ui越趋近于(1/n),熵也就越大.在物理学中,熵是衡量无序的标准.假设Ui被解释为属于第i单位的收入份额,E(U)就是一种反映收入分配差距不平等的尺度.收入越平均,E(U)就越大.假设绝对平均,其实就是常说的当每个Ui都等于(1/n)时,E(U)就达到其大值logn.泰尔将logn—E(U)定义为不平等指数-其实就是常说的泰尔熵标准:T=logn—E(U)= ∑ui*lognui用泰尔熵指数来衡量不平等的一个大优点是,它可以衡量组内差距和组间差距对总差距的奉献.泰尔熵标准只是普通熵标准(generalized entropy measures)的一种情况特殊.当普通熵标准的指数C=0时,测量结果即为泰尔熵指数.取C=0的优势在于分析组内,组间差距对总差距的解释力时更了解.泰尔熵指数和基尼系数当中具有一定的互补性.基尼系数对中等收入水平的变化非常敏感.泰尔熵T指数对上层收入水平的变化很明显,而泰尔熵L和V指数对底层收入水平的变化敏感.五,变异指标 变异指标又叫变化度,是统计学中描述具有一样性质的标志值数列离散程度的重要指标.假设变量数列中各个相关机构标志值当中的差异越大,即标志值的离散程度越大,各标志值与其平均值距离的总和就越大;反之,假设变量数列中各个相关机构标志值当中的差异越小,即标志值的离散程度越小,各标志值与其平均值距离的总和就越小.按照不一样的度量方式,变异指标可以分为全距,平均差,方差和标准差,变异系数还有加权的变异系数,离均差变异系数,加权离均差系数等.并且运用到收入分配的研究中,测算各区域(或组)间人均收入相对差异的大小.它们的数值越小,则表示各区域(或组)间人均收入相对差异越小.1,全距(R),是标志值数列中大值和小值之差.它表达了数列中各个相关机构标志值变化的范围.R越大(小)则标志值数列中变化大(小).其计算方式为R=大标志值—小值标志值全距(R)计算简单方便,但是,受标志值数列两端数值的影响,不考虑其他标志值的差异程度,因为这个原因不可以够反映标志值真实的差异程度.除开这点,,在分组的情况下,全距更难反映出标志值的变异程度.2,平均差(MD),是分布数列中各个相关机构标志值与其平均数当中绝对离差的平均数,它反映了数列中相互差异的标志值的差距水平.MD越大(小),则说明数列中标志值变化程度大(小).其计算方式为:平均差比较全面,客观的反映数列的标志值平均变化程度.尽管以离差形式产生,但是,计算也比较简单,直观的表示出了各个相关机构标志值与其平均数存在的平均差异,含义明确.但是,,它以平均绝对离差形式产生,妨碍了下一步的代数运算,因为这个原因在应用中受到一定的限制.3,方差和标准差方差(S2)是分布数列中各个相关机构标志值与其平均数当中离差的平方和的平均数,标准差(S)又叫均方差,是方差的平方根,其计量单位与平均数的计量单位一样.二者都可以反映标志值相对平均数的差异程度.上面的方差和标准差计算方式都是对数值离差求算术平均值,因为这个原因可能致使这当中存在的规模差异不可以够充分反映,因为这个原因也有人用加权的标准差表达公式,即:这当中,观测指标 yi=Yi/fi ; 而指标平均值为, 这反映了加权标准差与平均标准差在处理标准平均值上面的不一样.明显,加权标准差不受划分方式的影响,因为这个原因具有更多的稳定性.4,平均差和标准差都是测定数列中标志值差异程度的平均指标,它们的大小,不但主要还是看数列各标志值的差异程度,而且,还受到了其平均值大小的影响.假设两个情况的数列平均水平存在很大差异,平均差和标准差就难于准确反映其变化程度.另外,平均差和标准差都拥有计量单位,是有名数,不可以比较计量单位不一样的数列的变化程度.故此,,大家又引入了变异系数作为测量相对收入差距的工具. 这当中,平均变异系数的计算公式为:V=S/ 或者V=MD/ 或者V=R/ ,这里 =∑yi/n加权后的平均变异系数的计算公式为:V*= S/ * 或者V*=MD/ * 或者V*=R/ *,这里*=∑yi/∑fi六,其他1,贫困指数贫困指数是指收入在某个临界水平(即贫困水平)以下的人口占总人口的比重.应该指出,贫困指数同大多数其他指数一样,隐藏着一个重要特点,即指数包含着绝对的价值判断.贫困指数由1998年诺贝尔经济学奖得主阿马蒂亚·森(AMARTYA SEN )提出.其计算公式为P=H·[I+(1-I)·G],H代表一个社会一定的,预先确定好的贫困线下的人口数,G为基尼系数,I为衡量收入分配的指标,处于0和1当中,G和I均针对处于贫困线以下的贫穷群体计算得出.在发展中国家,大家一般用贫困指数来度量收入的不公平程度.2,偏离值法偏离值法可精确测量收入分配状况,利于进行纵向或横向比较,并且操作简单方便.其计算公式为:R=∑|yi-1/n|,i=1,2,…n;y1+y2+…+yn=1这当中,R为偏离值,n为分组数,马上就要社会上的人口平均分为n个等级;yi表示第i组的收入比重.n可取不一样的值,n取值越大将社会等级分得越细,R的取值范围越大(如当n=5时,0≤R≤1.6,当n=10时,0≤R≤1.8;当n=20时,0≤R≤1.9).国际上通行做法是将人均收入非常高的发达国家社会人口平均分为5个等级(n=5);人均收入中下等的国家社会人口平均分为10个等级(n=10),即n=5,每个等级各占总人口的百分之20或者百分之10.每个等级在国民收入中所占有比例重分别用y1,y2,y3,y4,y5表示.假设,收入分配绝对平均,则每个等级分得0.2(百分之20)或者0.1(百分之10).这里,将0.2或者0.1称作收入分配绝对平均的中心值.在现实生活中,人均收入非常高的发达国家的y1,y2,y3,y4,y5总是以0.2为中心,人均收入中下等的国家的y1,y2,y3,y4,y5总是以0.1为中心,上下变化.在这里基础上,把R=|y1-0.1|+|y2-0.1|+|y3-0.1|+|y4-0.1|+|y5-0.1|所得的结果称作某一时期(一般为1年)现实收入分配均等程度与收入分配绝对平均的偏离值,简称为收入分配均等程度偏离值(偏离值).偏离值R介于[0,1.8]当中,偏离值越趋向1.8,收入分配越不均.3,倒U拐点根据著名的库兹涅茨"倒U"假说,一国收入分配的不平等会随着早期经济发展而恶化,达到高点后,又随着后期经济发展而改善.库兹涅茨还同时得出结论:人均国民收入在300~500美元当中,收入分配不均等程度达到高顶点.其顶点在这一收入分配的"倒U"曲线上,成为"拐点".由此,"拐点"产生时的人均收入水平(300~500美元)就成为大家判断收入差距的又一种尺度.4,辅助性指标中外一部分学者觉得,因为各国的国情不一样,还有一国国内不一样时期的不一样情况,试图以一个精确数值来衡量收入差距具有很大的局限性.因为这个原因,可采取以上很多指标中的一个例如基尼系数,并且辅以若干具有通用性,可比性和可操作性的辅助指标,更全面,深入透彻的衡量收入差距.辅助指标可考虑:(1)各收入分组收入占都收入比重.(2)各收入分组收入水平增长率.(3)贫困出现率和贫困距比率.(4)恩格尔系数.
如何用excel计算协方差矩阵?
工具-〉加载宏-〉分析工具库。
工具-〉数学分析-〉协方差-〉输入你要作协方差的矩阵范围-〉输出。
假设你加载宏里没有分析工具库,那是你安装时没有自定义安装的问题。
操作步骤
1. 打开原始数据表格,制作本实例的原始数据需满足两组或两组以上的数据,结果将给出这当中任意两项的有关系数。
2. 选择“工具”-“数据分析”-“描述统计”后,产生属性设置框,依次选择: 输入区域:选择数据区域,注意需满足至少两组数据。假设有数据标志,注意同时用鼠标勾选下方“标志位于第一行”; 分组方法:指示输入区域中的数据是按行还是按列考虑,请按照原数据格式选择; 输出区域可以选择本表、新工作表组或是新工作簿;
3.点击“确定”就可以看到生成的报表。 可以看到,在对应区域生成了一个3×3的矩阵,数据项目标交叉处就是其有关系数。明显,数据与本身是完全有关的,有关系数在对角线上显示为1;两组数据间在矩阵上有两个位置,它们是一样的,故右上侧重复部分不显示数据。左下侧对应位置分别是温度与压力A、B和两组压力数据间的有关系数。 从数据统计结论可以看得出来,温度与压力A、B的有关性分别达到了0.95和0.94,这说明它们呈现良好的正有关性,而两组压力数据间的有关性达到了0.998,这说明在不一样反应器内的一样条件下反应完全一样性很好,可以忽视因为更改替换反应器导致的系统误差。 协方差的统计与有关系数的活的方式相似,统计结果同样返回一个输出表和一个矩阵,分别表示每对测量值变量当中的有关系数和协方差。不一样之处在于有关系数的取值在 -1 和 +1 当中,而协方差没有限制要求的取值范围。有关系数和协方差都是描述两个变量离散程度的指标。