帕累托分布.doc_第1页
帕累托分布.doc_第2页
帕累托分布.doc_第3页
帕累托分布.doc_第4页
帕累托分布.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小组成员:142090304 李志慧 142090308 杜晶鑫 142090311 葛霞 142090313 宋志娟 142090321 刘芳帕累托分布一、什么是帕累托分布帕累托分布是以意大利经济学家维弗雷多帕雷托命名的。 是从大量真实世界的现象中发现的幂次定律分布。这个分布在经济学以外,也被称为布拉德福分布。 帕累托因对意大利20%的人口拥有80%的财产的观察而著名,后来被约瑟夫朱兰和其他人概括为帕累托法则(80/20法则),后来进一步概括为帕累托分布的概念。帕累托分布的提出背景19世纪末期,意大利经济学家维弗雷多帕累托认为,贫与富的存在,既是经济问题,也有政治原因。 帕累托在研究英国人的收入分配问题时发现,绝大部分社会财富最终总会流向少数人群;他还发现,某一部分人口占总人口的比例,与这一部分人所拥有的财富的份额具有比较确定的计量经济关系;进一步的研究证实,这种不平衡模式可以重复出现,甚至可以预测。经济学把这一社会财富的分布状态,称为“帕累托分布”。 帕累托分布可以归纳为一个非常简洁的表述:通过市场交易,20%的人将占有80%的社会财富,如果交易可以不断进行下去,那么,“在因和果、努力和收获之间,普遍存在着不平衡关系,典型的情况是:80%的收获来自20%的努力;其他 80%的力气只带来20%的结果”。丹尼尔贝尔在帕累托分布与收入最大化中进一步叙述到:“如果待分配的财富总量是100万元,人数为100人,那么我们会有这样一组对应的分配比例:排在前面的20个人,分得80万元;同理,这20人中的4个人,分得64万元;4个人中的1个人,分得50万元。” 如果我们把这些数据用数学公式简单处理一下,就会显示一条收缩中的“财富曲线”以及一条发散中的“贫困曲线”。它的最终走向,是必然会“清零”的,也只有如此,“财富”中所包含的生产力因子才能重新释放出来。 帕累托分布从经济学角度论证出,社会分配的“绝对的失衡”必然导致“绝对的贫困”,甚至导致“宗教末日审判”的来临,除非我们可以通过政治手段,人为地阻止财富向高端不断聚集,否则,贫富双方的利益冲突是不可避免的。二、帕累托参数分布图:帕累托分布 (xmin=1) 在帕累托分布中,如果X是一个随机变量, 则X的概率分布如下面的公式所示: 其中x是任何一个大于xmin的数,xmin是X最小的可能值(正数),k是为正的参数。帕累托分布曲线族是由两个数量参数化的:xmin和k。分布密度则为 帕累托分布属于连续概率分布。 “吉普夫定律”, 也称为“zeta 分布”, 也可以被认为是在离散概率分布中的帕累托分布。 一个遵守帕累托分布的随机变量的期望值为 (如果 , 期望值为无穷大) 且随机变量的标准差为 (如果 , 标准差不存在)。三、帕累托分布参数及背景操作风险损失的尾部分布和参数的确定:设 X 1 , X 2 , X n 是操作风险损失样本数据 , 用u 表示阀值 , 假设超过阀值 u 的样本个数为 n u , 用X 1 , X 2 , X n u 表示超过阀值的样本观测值 , 设样本X 1 , X 2 , X n u 独立同分布 ,分布函数为F(x), 令:Y i =X i -u i =1,2,3 , n ux F =sup x R ;F(x)u) 0 y x F u (1)显然F u (y)= F(u +y)-F(u)/1-F(u)=F(x)-F(u)/1-F(u) (2)由定理(Pickands(1975), Balkema-de Haan(1974)得 , 对充分大的阀值 u, 超额值的分布函数近似地服从广义帕累托分布 F , (x)。其中 :F , , (x)= 1- 1+x / 1/0exp -exp (- x /) =0 (3)由 F(x)= 1-F(u) F u (y)+F(u)得出 : F(x)= 1-F(u) F , , (x -u)+F(u)其中,是重要的形状参数, 是位置参数, 而 是分布的尺度参数 。从理论上讲, 阀值应比较大 。但阀值越大, 用来估计尾部分布函数的样本观察值的数量就越少, 估计的参数变化比较大, 所以需要找到合适的阀值。在此先研究随机变量 X 服从形状参数0 的帕累托分布时的条件期望 e(u)=E(X -u X u)。由于 X 的分布函数为:F , , (x)=1- 1+(x /) 1/, x ,于是有 :e(u)= -+u/1- (4)下面考虑样本平均余值函数 :e(u)= 1 /n un i =1 (X i -u) + (5)其中:n为样本总数 ,(X i -u) + 表示大于值u的样本值与 u 的差 , n i =1 (x i -u) + 表示超过值 u 的样本余值的总和 , n u = n i =1 l(X i u)表示大于值 u的样本值的个数。可知 , 平均余值函数 e(u)是超过阀值损失的真实期望值的经验估计值, 即为 e(u)= E(X -u|X u)的估计值 ,而由式(4)可知 : de(u)/ du=/1 -, 这表明若损失分布的尾部服从形状参数 0u) 和条件二阶矩 E(X -u) 2|X u 。可以证明 : E(X -u|X u)= /(1 ) 1 +(u /) (6)E(X -u) 2|X u =22/(1 -)(1 -2) 1 +(u /) 2 (7)将来自总体 X 的简单随机样本按从小到大排列, 记 为 X 1 , X 2 , X n , u 是 一 个 常 数 , 且E(X -u) k|X u 存在且为 (未知), 记 x i = X i -u,n u = n i =1 l(x i 0), =1 n u n i =1 1(x i 0)x k i ,则由条件矩估计理论可知, 为 的无偏估计。为了估计操作风险损失的尾部分布的参数, 可以建立以下参数估计方程:/1 - 1 + (u -)/ =1 /n un i =1 (x i ) +22 /(1 -)(1 -2) 1 + (u -)/ 2=1 /n u n i =1 (x i ) 2+解得 :=1/ n u n i =1(x i ) 2+ - 2 n 2 u n i =1(x i ) + 2/2 /n u n i =1 (x i ) 2+ - 2 /n 2 u n i =1 (x i ) + 2 (8)+(u -)= (1 /)n un i =1 (x i ) + (9)由于再利用广义帕累托分布的三阶条件矩也只能估计出参数 +(u-)的值,无法有效估计出所要的参数 和 的具体值, 因此 ,在广义帕累托分布的参数估计中, 可以通过结合最小误差拟合方法进行。具体思想以及操作如下:由第二极值定理 , 当临界值 u 相当大时 , (x i ) + 近似服从广义帕累托分布F , (x), 为 使 拟 合 效 果 比 较 好 , 希 望(n x +1/ n) - -(1 -F, (x) -尽可 能地 小。因此,采用最优拟合标准为 :min x i 0 (n (x i +1)/ n) - -(1 -G, (x i ) - 2 (10)记 k = 1 /n un i =1(x i ) + ,将 =k -(u -)代入式(10)可知: min x i 0 (n x i +1/ n) - -(1 +( x i /k -(u -) 2解得:=x i 0 (k +x i -u)(k +x i -u -mk +mu)/ x i 0 m(k +x i -u) (11)其中,m =( n x +1/ n) -, n x =n i =1 1(x i x) 于是:=k +x i 0 (k +x i -u)(k +x i -u -mk +mu)/x i 0 m(k +xi -u)-u (12)这样便得到基于条件样本的广义帕累托分布的参数估计值, 即操作风险损失超出阀值 u 的样本值的极端损失分布函数为 :F(x)= 1 -F(u) F , (x -u)+F(u)= 1 - n u n (1 +(x -u /) - 1 (13)四、参数的分布形态X 服从帕累

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论