固定收益证券应用统计第四章_第1页
固定收益证券应用统计第四章_第2页
固定收益证券应用统计第四章_第3页
固定收益证券应用统计第四章_第4页
固定收益证券应用统计第四章_第5页
已阅读5页,还剩1页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 4 章数据的概括性度量集中趋势(central tendency)分类数据:众数众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用3.不受值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数(不惟一性)无众数原始数据:分类数据的众数(例题分析)顺序数据的众数(例题分析)顺序数据:中位数和分位数中位数(median)1.排序后处于中间位置上的值中位数(位置和数值的确定)顺序数据的中位数 (例题分析)数值型数据的中位数(9 个数据的算例)【例】9 个家庭的人均月收入数据10591268原始数据:排位15007507801080850960

2、10805200012501630序:置:75078085096041250 1500 163020001236789数值型数据的中位数(10 个数据的算例)【例】:10 个家庭的人均月收入数据排位四分位数(quartile)序:置:660 75078085096010801250 1500 16302000912345678101.排序后处于 25%和 75%位置上的值顺序数据的四分位数(例题分析)数值型数据的四分位数(9 个数据的算例)【例】:9 个家庭的人均月收入数据(4 种方法计算)原始数据:排位150075078010807507808508509604960108052000125

3、016301250 1500 16302000序:置:1236789数值型数据:平均数平均数(mean)也称为均值集中趋势的最常用测度值一组数据的均衡点所在3.体现了数据的必然性特征4.易受值的影响5.有简单平均数和平均数之分6.根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为x简单平均数(Simple mean)平均数 (Weighted mean)几何平均数 (geometric mean)n 个变量值乘积的 n 次适用于对比率数据的平均主要用于计算平均增长率计算公式为几何平均数(例题分析)【例】一位投资者购持有一种,在 2000、2001、2002 和 20

4、03 年收益率分别为 4.5%、%、25.5%、1.9%。计算该投资者在这四年内的平均收益率众数、中位数和平均数的比较众数、中位数和平均数的关系众数、中位数、平均数的特点和应用众数不受值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用1.中位数不受值影响数据分布偏斜程度较大时应用1.平均数易受值影响数学性质优良数据对称分布或接近对称分布时应用离中趋势分类数据:异众比率异众比率(variation ratio)对分类数据离散程度的测度非众数组的频数占总频数的比例计算公式为异众比率(例题分析)顺序数据:四分位差四分位差(quartile deviation)对顺序数据离散程度的测度也称为内距

5、或四分间距上四分位数与下四分位数之差Qd = QU QL反映了中间 50%数据的离散程度5.不受值的影响6.用于衡量中位数的代表性四分位差(例题分析)数值型数据:方差和标准差极差(range)一组数据的最大值与最小值之差离散程度的最简单测度值3.易受值影响4.未考虑数据的分布平均差(mean deviation)各变量值与其平均数离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少平均差(例题分析)平均差(例题分析)方差和标准差(variance and standard deviation)数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为

6、总体方差(标准差),记为2();根据样本数据计算的,称为样本方差(标准差),记为 s2(s)样本方差和标准差(sle variance and standard deviation)未分组数据度(degree of freedom)度是指数据个数与附加给独立的观测值的约束或限制的个数之差1.2.从字面涵义来看,度是指一组数据中可以取值的个数3.当样本数据的个数为 n 时,若样本平均数确定后,则附加给 n 个观测值的约束个数就是 1 个,因此只有 n-1 个数据可以取值,其中必有一个数据不能取值4.按着这一逻辑,如果对 n 个观测值附加的约束个数为 k 个,度则为 n-k度(degree of

7、freedom)x = 5。当 x = 5样本有 3 个数值,即 x1=2,x2=4,x3=9,则确定后,x1,x2 和 x31.有两个数据可以取值,另一个则不能取值,比如 x1=6,x2=7,那么 x3 则必然取 2,而不能取其他值2.为什么样本方差的度为n-1 呢?因为在计算离差平方和时,必须先求出样本均值x ,而x 则是附件给离差平方和的一个约束,因此,计算离差平方和时只有 n-1 个独立的观测值,而不是 n 个3.样本方差用度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差 s2 去估计总体方差 2 时,它是 2 的无偏估计量样本标准差(例题分析)样本标准差 (

8、例题分析)总体方差和标准差(Population variance and Standard deviation)未分组数据相对位置的度量:标准分数标准分数(standard score)也称标准化值对某一个值在一组数据中相对位置的度量可用于判断一组数据是否有离群点(outr)用于对变量的标准化处理计算公式为标准分数(性质)z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为 0,标准差为 1标准分数(例题分析)经验法则经验法则表明:当一组数据对称分布时约有 68%的数据在平均数加减 1 个标准差的范围之内约有 95%

9、的数据在平均数加减 2 个标准差的范围之内约有 99%的数据在平均数加减 3 个标准差的范围之内不等式切(Chebyshevs inequality )1.如果一组数据不是对称分布,经验法则就不再适用,这时可使用切它对任何分布形状的数据都适用不等式,2.切不等式提供的是“下界”,也就是“所占比例至少是多少”3.对于任意分布形态的数据,根据切不等式,至少有 1-1/k2 的数据落在平均数加减 k 个标准差之内。其中 k 是大于 1 的任意值,但不一定是整数不等式切(Chebyshevs inequality )对于 k=2,3,4,该不等式的含义是至少有 75%的数据落在平均数加减 2 个标准差

10、的范围之内至少有 89%的数据落在平均数加减 3 个标准差的范围之内至少有 94%的数据落在平均数加减 4 个标准差的范围之内相对离散程度:离散系数离散系数(coefficient of variation)标准差与其相应的均值之比对数据相对离散程度的测度3.消除了数据水平高低和计量的影响用于对不同组别数据离散程度的比较计算公式为离散系数(例题分析)离散系数(例题分析)偏态偏态(skewness)统计学家 Pearson 于 1895 年首次提出数据分布偏斜程度的测度偏态系数=0 为对称分布偏态系数 0 为右偏分布4.偏态系数 0 为分布5.偏态系数大于 1 或小于-1,被称为高度偏态分布;偏态系数在 0.51 或-1-0.5 之间,被认为是中等偏态分布;偏态系数越接近 0,偏斜程度就越低偏态系数(coefficient of skewness)根据原始数据计算根据分组数据计算偏态系数(例题分析)偏态系数(例题分析)峰态峰态(kurtosis)统计学家 Pearson 于 1905 年首次提出数据分布扁平程度的测度峰态系数=0 扁平峰度适中峰态系数0 为尖峰分布峰态系数(coefficient of kurtosis)根据原始数据计算根据分组数据计算峰态系数(例题分析)用 Excel 计算描述统计量用 Excel 计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论