




已阅读5页,还剩86页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,第四章统计数据的描述,第一节统计分布的集中趋势第二节统计分布的离散趋势第三节统计分布的形态,.,2,1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法6.用Excel计算描述统计量并进行分析,.,3,第一节统计分布的集中趋势,集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。理解集中趋势的三个特点:同质性代表性抽象性,.,4,.,5,一、算术平均数,基本公式:计算方法:简单算术平均和加权算术平均,.,6,平均数(mean),集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据,.,7,1.简单算术平均(Simplemean),.,8,2.加权算术平均(Weightedmean),根据单项变量数列计算根据组距变量数列计算,首先计算组中值以代表该组的平均水平。在计算组距资料的平均数时,x用组中值代替。,.,9,权数的作用:,可见,加权算术平均数不但受各组标志值x的影响,而且也受各组次数f的影响。次数越多对标志总量的影响越大,次数越少对标志总量的影响越小。各组标志次数的多少在平均数的计算中具有权衡轻重的作用,因此,在统计上又称为权数。,.,10,比重权数是权数的实质,权数有两种形式:一种是以绝对数表示,称次数或频数;另一种是以比重表示,称频率。同一总体资料,用这两种权数所计算的加权算术平均数完全相同。当各个标志值的权数都完全相等时,权数就失去了权衡轻重的作用,这时候,加权算术平均数就成为简单算术平均数。,.,11,用比重权数计算算术平均数,.,12,算术平均数的计算案例P6365,算术平均数的数学性质1.各单位标志值与算术平均数离差之和等于零。2.各单位标志值与算术平均数离差平方之和为最小。,.,13,二、交替标志平均数,交替标志的概念:交替标志又称是非标志,针对品质标志来说,一种现象具有两种属性,总体中某些单位具有某种属性,另外一些单位不具有某种属性,这种将总体单位划分为“是”或“否”、“有”或“无”两类的标志叫交替标志。用1表示具有某种属性的单位标志值,其单位数用N1表示;用0表示不具有某种属性的单位标志值,其单位数用N0;全部总体单位数为N,.,14,则:具有某种属性的单位数所占比重(成数)不具有某种属性的单位数所占比重,.,15,交替标志平均数公式:,.,16,公式粘贴板,.,17,三、调和平均数,概念:指各个变量值倒数的算术平均数的倒数。用H表示计算方法:1.简单调和平均数2.加权调和平均数,.,18,在例1中,用简单算术平均数,例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1斤,求平均价格。,.,19,例2是用简单调和平均数的公式。,例2:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买1元,求平均价格。,.,20,例3用加权调和平均数公式,例3:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。现早、中、晚各买2元、3元、4元,求平均价格。,.,21,注意问题,调和平均数是各个算术平均数倒数的算术平均数的倒数,是在资料受到限制的条件下算术平均数的一种变形。那么,如何判断在什么情况下可以采用算术平均数或调和平均数呢?关键在于以算术平均数的基本公式为依据,如果缺分子资料,可用简单或加权算术平均数形式计算,如缺分母资料,可用简单或加权调和平均数计算。总之,根据所掌握产资料条件来决定。,.,22,四、几何平均数(geometricmean),概念:几何平均数是n项变量值连乘积的n次方根。适用于变量值之间存在环比连乘关系的事物。用G表示计算方法1.简单几何平均数,.,23,2.加权几何平均数,.,24,几何平均数案例,例1:1994-1998年我国工业品的产量分别是上年的107.6%、102.5%、100.6%、102.7%、102.2%,计算这5年的平均发展速度。(即103.1%)例2:某投资银行25年的年利率分别是:1年3%,4年5%,8年8%,10年10%,2年15%,求平均年利率。(即1.0861,8.6),.,25,五、众数(mode),一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据,.,26,众数(不惟一性),无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242,.,27,由众数的定义可看出众数存在的条件:就是总体的单位数较多,各标志值的次数分配又有明显的集中趋势时才存在众数;如果总体单位数很少,尽管次数分配较集中,那么计算出来的众数意义就不大;如果总体单位数较多,但次数分配不集中,即各单位的标志值在总体分布中出现的比重较均匀,那么也无所谓众数。众数是由标志值出现次数多少决定的,不受资料中极端数值的影响,这样增强了众数对总体一般水平的代表性。,.,28,根据变量数列的不同种类,确定众数可采用不同的方法。,单项数列确定众数观察次数,出现次数最多的标志值就是众数。这种方法比较简单。组距数列确定众数观察次数,首先由最多次数来确定众数所在组,然后再用比例插值法推算众数的近似值。其计算公式为:,.,29,.,30,某班学生统计学考试成绩情况表众数74.706,.,31,.,32,分类数据的众数(例题分析),.,33,解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo可口可乐,.,34,顺序数据的众数(例题分析),.,35,解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即Mo不满意,.,36,众数的特点,从众数的计算可看到众数的特点:众数是一个位置平均数,它只考虑总体分布中最频繁出现的变量值,而不受极端值和开口组数列的影响,从而增强了对变量数列一般水平的代表性。众数是一个不容易确定的平均指标,当分布没有明显的集中趋势而趋于均匀分布时,则无众数可言;当变量数列是不等距分组时,众数的位置也不好确定。U、J型分布有没有众数?(无),.,37,JimSimons,RenaissanceTechnologies,RenaissanceTechnologiesisaglobalhedgefundmanagementfirmwithalongrecordofproducingsuperiorreturnsforourclientsbyadheringtomathematicalandstatisticalmethodsinthedesignandexecutionofourinvestmentprograms.Wecurrentlyhavemorethan300employees,andmanageapproximately$20billion.,.,38,发现Chern-Simons的几何定律:数学大师Simons在华尔街大显神通原始出处:华尔街日报西蒙斯既是世界级的数学大师,又是RenaissanceTechnologiesCorp.的老板。眼下,他准备设立一只规模可能高达1,000亿美元的基金的消息在业内闹得沸沸扬扬,要知道,这可是整个对冲基金行业资产管理总额的十分之一左右。从早期的推广资料来看,这只基金的最低投资额为2,000万美元,面向机构投资者发售。据估计,西蒙斯目前的资产净值约为25亿美元。Renaissance旗下的核心业务规模为50亿美元的Medallion对冲基金自1988年成立以来,年均回报率高达34%,堪称在此期间表现最佳的对冲基金,.,39,六、中位数(median),中位数是将各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。中位数也是一种代表值,当标志变异程度较大,而次数f很多的情况下,用中位数代替现象的一般水平。中位数不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据,.,40,排序后处于中间位置上的值中位数将全部数据分成相等的两部分,一半数据比中位数大,一半数据比中位数小,居于中间位置的值就是中位数。,.,41,中位数的计算:未分组资料:,数值型数据的中位数奇数项:先将数据按从小到大顺序排列,如项数为奇数,居于中间的哪个单位标志值。(9个数据的算例),.,42,【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080,.,43,先将数据按从小到大顺序排列,如项数为偶数,中位数为居于中间的那2个单位标志值的平均值。,.,44,(10个数据的算例),【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910,.,45,未分组数值型数据的中位数中点位置,当N为奇数,当N为偶数,.,46,顺序数据的中位数(例题分析),解:中位数的位置为300/2150从累计频数看,中位数在“一般”这一组别中中位数:Me=一般,甲城市家庭对住房状况评价的频数分布,.,47,2.分组数据计算中位数,单项式分组资料要将次数进行累计,中位数为居于中间位置所对应的标志值。中位数的位次:由分组资料确定中位数与由未分组确定不同,这是因为由分组资料确定中位数,一般要通过累计次数计算,而累计次数有两种表示方法:向上累计和向下累计。看哪一个累计次数最先涵盖中点位次,该组的变量值就是中位数,.,48,例:某厂工人日产零件中位数计算表,.,49,解:,中位数位置=80/2=40按向上累计次数,到34所在组为54,到32所在组为27,故中位数应在34所在组,即中位数=34。,.,50,组距资料计算中位数,1.计算中点位置:2.计算累计次数,确定中位数所在的组3.计算中位数的近似值,.,51,下限公式要看向上累计的次数上限公式要看向下累计的次数,下限公式:上限公式:,.,52,式中:、分别表示中位数所在组的下限、上限;中位数所在组的次数;中位数所在组以前各组的累计次数;中位数所在组以后各组的累计次数;总次数;d中位数所在组的组距。,例题P72表47,.,53,四分位数(quartile),1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,.,54,四分位数(位置的确定),原始数据:顺序数据:,.,55,顺序数据的四分位数(例题分析),表:甲城市家庭对住房状况评价的频数分布QL位置=(300)/4=75QU位置=(3300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为:QL=不满意QU=一般,.,56,数值型数据的四分位数(9个数据的算例)10个家庭的人均月收入数据P73-4.11,.,57,数值型数据的四分位数(10个数据的算例)p73.-4.12,.,58,算术平均数()、众数(M0)中位数(Me)三者的关系,总体次数分配为对称的钟形分布时,三个平均数相等当总体分布呈右偏时,则:当总体分布呈左偏时,则:,.,59,英国统计学家卡尔皮尔逊认为,当分布只是适当偏态时,三者之间的数量关系是:中位数Me与算术平均数的距离是众数M0与算术平均数距离的三分之一,即关系式为:。,.,60,由此,可以推算出:在轻微偏态的次数分布中,一旦三者之中两者为已知时,就可以近似估计出第三者。以左偏为例:,.,61,第二节统计分布的离散趋势离中趋势,数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值,.,62,标志变动度,标志变动度是描述总体各单位标志值差别大小程度的指标,又称离散程度或离中程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。而离中趋势的各测度值就是对数据离散程度所作的描述。,.,63,标志变动度的作用,标志变动度是评价平均数代表性的依据。标志变动度反映社会经济活动过程的均衡性或协调性,以及产品质量的稳定性,优良品种的推广性。3标志变异指标是计算抽样误差的根据。,.,64,描述数据离散程度的测度值主要有:,方差、标准差四分位差离散系数,.,65,一、方差和标准差(varianceandstandarddeviation),数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。,.,66,方差、标准差的计算公式(针对总体的),未分组数据:,分组数据:,.,67,.,68,.,69,理解记忆:,标准差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。又称:均方根差举例:P75表48,.,70,某企业工人日产量的标准差计算表,.,71,交替标志的标准差PPT15,.,72,案例:,P77例4.15交替标志的方差PQ=P(1-P)交替标志方差的最大值是?当P=0.9,P=0.8,P=0.7,P=0.6,P=0.5时,计算交替标志的方差.0.50.5=0.25时方差最大,.,73,离散系数(coefficientofvariation),1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较,.,74,离散系数的计算公式为,标志变动度的数值大小,不仅受离散程度影响,而且还受平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差大小来比较离散程度。当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。,.,75,即乙组的离散程度大于甲组。,例:有两组工人日产量甲组:60、65、70、75、80乙组:2、5、7、9、12不能简单断言甲组离散程度大于乙组离散程度可以计算离散系数,.,76,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 62552-3:2015+AMD1:2020+AMD2:2025 CSV EN Household refrigerating appliances - Characteristics and test methods - Part 3: Energy consumption and volume
- 重庆股票知识培训课件
- 人教版八年级物理上册 第四章《光的色散》分层作业练习题
- 重庆小面培训课件
- 图文转换分析(知识清单)-2026年高考语文一轮复习解析版
- 中建三局安装公司(智慧事业部)工艺标准库-电气篇试行版
- 重庆二造培训课件
- 重庆一日游课件
- 《学位论文写作》课程介绍与教学大纲
- 《翻译理论与实践2》课程介绍与教学大纲
- 疗养协议合同
- 人工智能在财务预测中的应用-全面剖析
- 药品临床综合评价解读
- 输液反应应急预案及流程
- 计算机基础知识完整课件
- 针灸理疗院感风险评估与应对措施
- 水库巡查基本知识
- 动火作业安全培训题库
- 物业管理中的服务质量监控与改进机制
- 基于人工智能的班级管理创新研究
- 画法几何及工程制图教案
评论
0/150
提交评论