金融统计02-统计描述.ppt_第1页
金融统计02-统计描述.ppt_第2页
金融统计02-统计描述.ppt_第3页
金融统计02-统计描述.ppt_第4页
金融统计02-统计描述.ppt_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章 统计描述,第1节 统计描述的图形法 第2节 统计描述的数值法,统计描述方法,统计描述方法 是描述数据特征的表、图和数值等各种方法的总称 实用中主要是图形法和数值法两种 目的 研究如何对客观现象的数量特征进行描述、概括,并通过图表等形式对所收集的数据进行加工处理和显示,进而得出反映客观现象的规律性数量特征,第1节 统计描述的图形法,主要内容 原始数据图 构成图 频率分布图 散点图,常用的图形法,原始数据图 按一定顺序显示各个体的数值 常用的有线形图、柱状图等 频率分布图(Frequency distribution or Histogram) 将样本分组,显示各组的个数 构成图(饼图) 将样本分组,显示各组的个数占样本总数的比率 散点图(Scatter plot) 个体的一个变量值在横轴,另一个变量值在纵轴,用来揭示两个变量间的关系,是回归分析中变量取舍的重要参考,图形法例:影响房价的因素,对美国321个商品房进行调查,获得如下数据(数据来源:Wooldridge, “Introductory Econometrics”) 价格(price) 、 房间数(rooms) 、 面积(area)、 建筑年代(age) 等 用图形法分析:价格、房间数、面积,房屋价格的原始数据图(线形图),按一定顺序显示各个体的数值 信息量大 规律性小 原始数据图用于时间序列数据时可显示趋势,样本序号,价格(万美元),房屋价格的频率分布( Histogram ),频率分布图将样本分组,显示各组的个数 信息量小 规律性强 本图显示: 低价房偏多, 暗示研究结论更适合解释低价房的价格,各价格组 (万美元),各价格组包含的房屋个数,房间数的频率分布图,频率分布图将样本分组,显示各组的个数 信息量小 规律性强 大部分房屋的房间数为6、7,各组包含的房屋个数,各房间组 (房间个数),房间数的构成图(饼图),饼图将样本分组,显示各组的个数占样本总数的比率 7个房间的商品房最多,占总房屋数的一半以上,其次是6个房间,约占1/3,占比最少的是10个房间的商品房,价格和房间数的散点图,散点图显示两变量间的关系 价格随房间数增加而上升,但趋势很散乱,表明房间数对房价的影响力比较有限,例:此房屋有10个房间,价格为5.4万美元,价格(万美元),房间数 (个数),红线: 相关性,价格和面积的散点图,散点图显示两变量间的关系 价格随面积增加而上升,趋势较强,表明面积是影响房价的重要因素,此房屋面积约500平米,价格为10万美元,红线: 相关性,价格(万美元),房屋面积 (m2),第2节 统计描述的数值法,主要内容 平均指标:算术平均数、几何平均数 变异指标:标准差、离散系数 相关指标:相关系数,平均指标,平均指标 说明样本某一变量取值的一般水平或取值的集中趋势 平均指标分为数值平均数和位置平均数 数值平均数:对统计数列的所有各项数据来计算的平均数,有算术平均数、几何平均数等 位置平均数:根据样本中处于特殊位置上的个别单位或部分单位的数值确定的代表值,有中位数、众数 数值平均数分为总体平均数和样本平均数,样本平均数,样本平均数使用简单算术平均数公式计算,式中: 为算术平均数 为样本个体总数 为第 个个体的值,算术平均数的主要数学性质,变量值与其算术平均数的离差之和等于0 变量值与其算术平均数的离差平方和最小,表明样本平均值是不偏的(unbiased)统计量,表明样本方差是衡量离散程度最准确的指标,总体平均数(加权平均数) (此内容涉及概率论基础知识),总体平均数即随机变量的期望值() 离散型随机变量的期望值 连续型随机变量的期望值 总体平均数例 投一枚硬币,设 X 为结果的随机变量,正面取值1,反面取值0,则期望值,总体平均数例:指数分布(1) (此内容涉及概率论基础知识),某旧机器平均1年发生损毁故障次数= 12次,则平均故障间隔时间多长? 因为故障后即损毁,所以故障间隔时间就是该机器的使用寿命,故障可随时发生,故使用寿命是随机变量 虽然已知平均使用寿命为1个月,但是技术人员更关心的是:具体使用寿命为1个月、2个月、3个月等的概率 描述这些不同具体使用寿命的概率的函数称为密度函数,总体平均数例:指数分布(2) (此内容涉及概率论基础知识),指数分布的概率密度函数 前述旧机器的概率密度函数 问题 如果另一个旧机器的= 4次/年,两者使用寿命的概率分布有什么区别?,总体平均数例:指数分布(3) (此内容涉及概率论基础知识),使用寿命(年) x,概率 f(x),不同的年平均故障次数下,使用寿命的概率分布的区别: 低(即故障率低)的机器,寿命短的概率较低,寿命长的概率较高,几何平均数,几何平均数是算术平均数的变化方式,计算方法为 几何平均数的使用 对于随时间变化的变量,计算其各期的平均值,必须使用几何平均数 例:GDP平均增长率、平均利率等,几何平均数例:复利,单利与复利的本质区别 单利:利息不计入下期增长基数 复利:利息计入下期增长基数 单利与复利的积累公式 单利: 复利:,几何平均数与复利,复利以几何平均数的形式反映了货币增值的规律,复利的利率等于几何平均数减去1,复利例,一笔3年期贷款第1、2年的年利率为5%,第3年的年利率为10%,求该贷款的年平均利率。 解:,变异指标,变异指标 样本中各个体数值背离分布中心的程度 也可以衡量平均数代表性的大小 变异指标的种类 极差、平均差、标准差 其中最常用的是标准差 平均指标和变异指标统称为基本统计量,样本标准差,样本标准差 样本各个体数值与样本平均数的离差平方的平均数的开平方根,标准差的平方称为方差 样本标准差的特点 不易受极端数值的影响,能综合反映差异程度 用平方的方法消除各标志值与平均数离差的正负值问题,可方便地用于数学处理和统计分析运算,样本标准差例: 12名商学院毕业生的起始月薪数据样本,离散系数,离散系数 指消除平均数影响后的变异指标,其形式为相对数。常用的离散系数为平均差系数和标准差系数 标准差系数公式 离散系数的作用 用来对比不同水平的同类现象,特别是平均数代表性的大小 标准差系数小的总体,其平均数的代表性大;反之,代表性小,离散系数例,某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小 解,一班成绩的标准差系数为:,二班成绩的标准差系数为:,因为 ,所以一班平均成绩的代表性比二班大,相关关系,相关关系(Correlation)的定义 指现象之间客观存在的、在数量上的变化受随机因素的影响,非确定性的依存关系。相关关系以相关系数度量 相关关系的主要特点 相关关系表现为数量上的依存关系,即一个现象在数量上发发生变化,另一个现象也会相应发生数量上的变化 现象之间数量依存关系的具体关系值是不固定的 相关关系既有线性相关、也有非线性相关,协方差(1),协方差(Covariance) 衡量两随机变量间线性相关关系的数值。正值表示正相关,负值表示负相关 样本协方差(Sample covariance) 思考 互相独立的两随机变量间的协方差为什么为0?,协方差(2),总体协方差 如果X、Y 互相独立,则,协方差(3):总体协方差例,投两次硬币 X 表示第1次结果,正面取值1,反面取值0 Y 表示第2次结果,正面取值1,反面取值0 求协方差,并指出协方差为0的条件 解,协方差(4):总体协方差例,相关系数,样本相关系数(correlation coefficient) 衡量两随机变量间线性相关关系的标准化数值,取值是正负1(含)之间的一个实数 统计描述中一般使用相关系数表示两变量间的相关关系,作为标准化数值,可在不同变量间作比较,相关关系的种类与相关系数,相关关系按相关的方向分为: 正相关:现象的数量同方向变动;相关系数0 负相关:现象的数量反方向变动;相关系数0 相关关系按相关的程度分为: 完全相关:一种现象的数量变化完全由另一个现象的数量变化所确定;|相关系数|=1 不相关:现象之间彼此互不影响,其数量变化各自独立;相关系数=0 不完全相关:界于前两者之间;,相关关系分析中应注意的问题 例1:Anscombes 四组图,统计学家Anscombe于1973年设计的四组数据 揭示的问题:单纯的基本统计量及相关关系不一定真实反映数据的主要特征 解决途径:在统计量分析的基础上,还要对数据作图示描述,例1(续1) 四组图的数据,数据特点如下表: (其中 Mean:均值 Variance:方差 Correlation:相关系数),数据表(每组由x、y随机变量构成),例1(续2) 四组图的图示,4组数据中,X、Y的均值、方差及X-Y相关系数都相同,但图示的相关性截然不同。只有Y1呈现通常认为的相关性,相关关系分析中应注意的问题(续) 例2:虚假相关,虚假相关(pseudo correlation) 两随机变量间源于偶然的相关关系 解决途径:针对社会经济现象的统计分析一定要以一定的理论为基础,注:横轴-年份;纵轴(左)-美国GDP;纵轴(右)-太阳黑子;均为对11年平均值的偏离程度(百分比) Source: Modis, T., 2007, Sunspots, GDP and the stock market, Technological Forecasting & Social Change 74, 1508-1514,例2(续)虚假相关例: 太阳黑子与GDP的正相关,本章总结,应用统计研究中,对数据进行描述的步骤 (1)作图形法统计描述 (2)作数值法统计描述 作统计描述时应注意以下问题 (1)使用这两种方法时,应结合所描述出的特点作相关背景介绍,比如房价例中采样以低价房为主等 (2)作出的图、表应规范,可参照后面内容,规范的图形法统计描述(1),相关背景介绍如: 本图显示,低价房偏多,因此本研究结论主要合解释低价房的价格,各价格组 (万美元),各价格组包含的房屋个数,图1 房屋价格的分布图,图下方必须有编号和标题,坐标轴必须有文字说明,规范的图形法统计描述(2),相关描

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论