




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,本资料来源,2,第2章描述统计学,案例导入在一家财产保险公司的董事会上,董事们就公司的发展战略问题展开了激烈讨论,其中一个引人关注的问题就是如何借鉴国外保险公司的先进管理经验,提高自身的管理水平。有的董事提出,2005年公司的各项业务与去年相比没有太大增长,除经济环境和市场竞争等因素外,对家庭财产保险的业务开展得不够,公司在管理方式上也存在问题。他认为,中国的家庭财产保险市场潜力巨大,应加大扩展这一业务的力度,同时,应对公司家庭财产推销员实行目标管理,并根据目标完成情况建立相应的奖惩制度。董事长认为该董事的建议有一定道理,准备采纳。会后,他责成计划部经理尽快拿出具体的实施方案。,3,第2章描述统计学,计划部经理接到任务后感到有些头痛。如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果定得过低,将不利于充分挖掘员工的工作潜力,提高公司的业绩水平。于是,计划部经理将公司160个推销员的月销售额分别作了统计,统计数据如表2-1所示。如果你是计划部经理,观察这160个原始数据后,准备如何来制定具体的销售目标呢?,4,第2章描述统计学,本章重点1、描述统计数据分布特征的图表法;2、数据中心位置测度的种类与方法;(1)计算平均数:算术平均数、调和平均数、几何平均数;(2)位置平均数:中位数、众数、分位数。3、变异性的测度:全距、平均差、方差、标准差、变异系数;4、相对位置的测度:z分数、切贝雪夫定理、经验法则。本章难点1、算术平均数;2、方差与标准差。,5,第2章描述统计学,STAT,1.图表法2.1次数分布一、次数分布的概念及类型次数:分布在各组的单位数(f)频率:各组次数与总次数的比重用f/f表示;次数分布:将总体的所有单位按组归类排列,形成总体单位在各组间的分布称为次数分布或频数分布。根据分组标志的性质不同分为:1、属性分布数列:按品质标志分组所形成的分布数列。体现现象质上的差别且较稳定。,6,第2章描述统计学,STAT,2、变量分布数列:按数量标志分组所形成的分布数列。体现现象量上的差别且有多种编制方法。作用:显示现象的分布规律和分布特征。变量数列的构成(1)变量及变量值;(2)次数或频率。变量数列的各类(1)单项数列;(2)组距数列,7,第2章描述统计学,STAT,单项式数列概念、适合离散变量、变量值不多的情况。组距数列概念、适合连续变量(离散变量)、变量值多时。等距数列每组组距均相等的组距数列。异距数列每组组距不均相等的组距数列。概念:全距、组限(开口、闭口)(重叠、不重叠)组距(等距、异距)组中值概念、计算(开口组)、含义,8,第2章描述统计学,STAT,组距(i)=本组上限本组下限组限:一组的数量界限。组数(n)全距组距R/i组中值=(上限十下限)/2=下限十组距/2=上限一组距/2组中值用来代表各组变量值的平均水平具有一定的假定性。开口组:缺上限或缺下限的组。开口组组距以邻组组距代替。开口组首组组中值=上限一邻组组距/2开口组末组组中值=下限+邻组组距/2,9,第2章描述统计学,STAT,次数密度=本组次数/本组组距次数密度反映次数在各组分布的密集程度。适用于异距数列。连续型变量:只可编制组距数列,且相邻的组限必须重叠。记住:“上组限不在内”离散型变量:可编制单项数列和组距数列。编制组距数列时采用不重叠组限依据:遵循不重复、不遗漏的原则。,10,第2章描述统计学,STAT,单项变量数列,某企业日产量分组表,日产量工人数107011100123801315014100,合计,800,11,(等组距、上下组限重叠、连续性变量),某班学生考试成绩次数表,累计次数向上累计、向下累计的计算和意义。,第2章描述统计学,12,第2章描述统计学,13,不等组距数列,第2章描述统计学,14,开口组、不等组距的变量数列,开口组组中值的计算按相邻组的组距作为开口组的组距计算。,第2章描述统计学,15,第2章描述统计学,STAT,二、变量数列的编制。,1、步骤确定全距(排序)确定组数确定组限:离散变量组限不重叠连续变量组限重叠将总体单位归入各组组距分组(步骤)(1)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K:,16,第2章描述统计学,STAT,二、变量数列的编制。(2)确定各组的组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距(最大值-最小值)组数(3)根据分组整理成频数分布表,17,某裨酒公司某月60个销售点的销量统计,487152533641695847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750单位:桶excel,18,啤酒销售量的分布数列,销售桶数销售点数频率(%)101911.7202935.0303958.340491626.750592033.36069915.0707946.7808923.3合计60100.0,19,2、次数累计,20,三、统计表表现经过整理的统计数据的表格。1、统计表的构成按形式:标题总标题、横栏标题、纵列标题横行、纵列数字按内容:主词(主栏)宾词(宾栏),2、统计表的种类(1)按主词分组情况不同分为简单表、分组表、复合表。(2)按用途不同分为调查表、整理表、分析表。(3)按时间不同分为静态表、动态(时间)表。,21,四统计图直观地表现统计整(一)常用的统计图,1、条形图,某班学生星座統計图,22,2、轮廓图,23,第二章描述统计学,3、饼图1912年4月15日泰坦尼克号人员与死亡构成图,各等级舱人员及船员死亡构成,人员构成图,24,4、面积图,25,政府发放工资总额(上升),6789101112月,6789101112月,30,20,10,工资总额(百万元),政府发放工资总额(稳定),2000万美元,1950万美元,折线图的误用,慎重的人在看折线图时,会仔细地看横轴和纵轴上标示的刻度。,26,4.TheapplicanceofCumulativeFrequencyDistribution,将全社会从业人员按收入水平分组,从低收入到高收入组汇总计算向上累计频率,得洛伦茨曲线(LorenzCure)。20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配平等程度的指标即基尼系数(GiniCoefficient),设实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。,Chapter2Descriptivestatistics,27,并以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。系数可在零和1之间取任何值。收入分配越是趋向平等,洛伦茨曲线的弧度越小,基尼系数也越小,反之,收入分配越是趋向不平等,洛伦茨曲线的弧度越大,那么尼系数也越大。联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距大;0.6以上表示收入差距悬殊。,Chapter2Descriptivestatistics,中国基尼系数变动情况,年不同国家最高人口与最低人口收入比,28,第2章描述统计学,STAT,(二)次数分布的主要类型1、钟形分布分布特征:中间大、两头小。钟形分布进一步区分为:(1)对称分布(2)偏态分布正偏:又称右偏,有极大值;负偏:又称左偏,有极小值。,29,第2章描述统计学,STAT,3、J形分布分布特征:一边大、一边小。(1)正J分布:右大左小;次数随变量值的增大而增多(2)反J分布:左大右小;次数随变量值的增大而减少,死亡率,年龄,2、U形分布分布特征:两头大、中间小。,30,第2章描述统计学,STAT,2.2均值测度次数分配数列的两个重要特征:集中趋势与离中趋势。集中趋势:反映一组数据向分布的中心集中的趋势。离中趋势:反映一组数据远离中心的趋势。测定集中趋势的指标主要有均值。,31,STAT,一、算术平均数基本公式=总体标志总量/总体单位总量(一)简单算术平均数,适用未分组或各变量值出现次数相同资料,适用已分组资料,注意:加权算术平均数不仅受各组变量值大小的影响,还受各组次数多少的影响。次数因其对平均的结果有权衡轻重的作用,因此,也叫权数。,(二)加权算术平均数,第2章描述统计学,32,STAT,权数的种类:A、绝对权数(次数)fB、相对权数(频率或比重)f/f只有当各组的次数不相等时,次数才具有权数的作用。,由此可见,简单算术平均数是加权算术平均数的一个特例。,第2章描述统计学,33,第2章描述统计学,STAT,组距数列算术平均数的计算例11人年龄:15,17,19,20,22,22,23,23,25,26,30。求平均年龄。,组距数列算术平均数的计算:以组中值代替组平均数后计算。,(近似值),34,第2章描述统计学,STAT,(三)是非标志平均数A:是非标志将总体全部单位划分为“是”或“否”两类的标志,B、哑变量(01变量),35,STAT,二、调和平均数调和平均数:变量值倒数的算术平均数的倒数,用“H”表示。调和平均数可分为简单调和平均数和加权调和平均数。(一)简单调和平均数(各变量值均为一个单位时使用)例某种蔬菜早上0.4元/斤,中午0.25元/斤,晚上0.20元/斤,某人各买1斤,求平均价格。(算术平均法)例类似地某人早、中、晚各买1元,求平均价格。,第2章描述统计学,36,STAT,式中:x代表各个变量值,n代表变量值项数,第2章描述统计学,37,STAT,(二)加权调和平均数(各变量值为不等单位时使用),第2章描述统计学,38,STAT,例某局所属四个企业有关资料如下,试计算该工业局的产值平均计划完成百分比。,第2章描述统计学,39,STAT,算术平均数与调和平均数的适用前提:A、已知基本公式母项资料用算术平均数计算(子项资料未知)B、已知基本公式子项资料用调和平均数计算(母项资料未知),调和平均数是算术平均数的变形,第2章描述统计学,40,STAT,三、几何平均数几何平均数是n个变量值连乘积的n次方根,用“G”表示。适用前提:凡是变量值的连乘积,等于总比率或总速度的现象都可以采用几何平均数计算平均比率或平均速度。(一)简单几何平均数,第2章描述统计学,注意:当观察值有一项为零或负值时,不宜用几何平均数计算。如用同一数据分别计算算术平均数、调和平均数和几何平均数时,则有如下关系:,(二)加权几何平均数,41,STAT,第2章描述统计学,例:生产某种产品需要依次经过三个工序进行加工,有关资料如下:,1,2,3,成品,投产只数,合格数,合格率%,200,190,95,190,182,95.8,182,178,97.8,200,178,89,89%=95%95.8%97.8%,故:合格率=,42,STAT,四、中位数把总体各变量值按大小顺序排列起来,处于中点位置的变量值就是中位数,用“Me”表示。(一)根据未分组资料确定中位数中点位置=(n+1)/2;当n为奇数时,Me=中间位置的那个变量值;例某科室9人的年龄分别是:24,25,25,26,26,27,28,29,55。当n为偶数时,Me=中间位置两侧的两个变量值的简单平均。如24,25,25,26,26,27,28,29(二)根据分组资料确定中位数1、由单项数列确定中位数,第2章描述统计学,43,STAT,第2章描述统计学,中点位置=(181+1)/2=第91个人Me应是第91个人的年龄Me=18岁,44,STAT,(二)根据组距数列确定中位数,第2章描述统计学,式中:L为中位数所在组的下限,U为上限;i为中位数所在组的组距;Sm-1为小于中位数的各组次数之和;Sm+1为大于中位数的各组次数之和;fm为中位数所在组的次数。,45,STAT,例下限公式:上限公式:并且:,第2章描述统计学,46,STAT,推导:假定中位数组的变量值呈均匀分布,则采用比例插值法得,506070(L)80(U)90100,x,y,103060110150180,Me=L+x=U-y,(Sm-1),第90个人,第2章描述统计学,47,STAT,注意的问题:(1)中位数不受极端值的影响,比较稳健。(2)中位数的取值只与中间位置的一或两个数值有关,利用信息不充分,忽略了其它数据的大小,并且不适合于代数运算。,第2章描述统计学,48,STAT,五、众数众数是指总体中出现次数最多的变量值,用Mo表示。A、20,15,18,20,20,22,20,23;n=8Mo=20B、20,20,15,19,19,20,19,25;n=8Mo=20Mo=19C、10,11,13,16,15,25,8,12;n=8,但没有众数(一)由单项数列确定众数在单项数列中,出现次数最多的变量值就是众数。确定众数组确定众数:Mo=18,第2章描述统计学,49,STAT,(二)由组距数列确定众数确定众数组再用下述公式计算:,第2章描述统计学,式中:L为众数组的下限,U为上限;i为众数组的组距;1=fmfm-1,即众数组的次数与前一组次数之差;2=fmfm+1,即众数组的次数与后一组次数之差。,50,STAT,405060708090100,5040302010,AGF,BC,ED,人数,产值,xy,(L)(U),Mo=L+x=U-y,O,第2章描述统计学,51,STAT,405060708090100,5040302010,AGF,BC,ED,人数,产值,xy,(L)(U),Mo=L+x=U-y,O,第2章描述统计学,52,STAT,众数取值的特点:众数的数值始终偏向相邻组中次数较大的组,当相邻两组的次数相等时,众数则是众数组的组中值。注意的问题:(1)优点:不受极端值的影响。(2)缺点:未利用所有信息,缺乏敏感性和不适合代数运算。(3)可用于反映质量变量的集中趋势。,第2章描述统计学,53,STAT,六、集中趋势测度指标的比较(一)各种数值平均数的比较适用场合不同。若总体标志总量等于总体各单位变量值之和,可采用算术平均数计算;若总体标志总量等于总体各单位变量值之积,则应采用几何平均数计算。某些数值平均数对于被平均变量的取值有着特殊的限制。(二)数值平均数与位置平均数的比较数值平均数对于数据的概括能力比位置平均数更强。数值平均数对于数据变化的“灵敏度”很高。对极端值的“耐抗性”较低;位置平均数的“灵敏度”较低,但“耐抗性”却很强。数值平均数只适用于定距尺度和定比尺度的数据:位置平均数还适用于各种定序尺度的数据,众数甚至还适用于各种定类尺度的数据。,第2章描述统计学,54,STAT,(三)中位数、众数和算术平均数的关系1、对称分布,第2章描述统计学,三者均等于35。,55,STAT,2、偏态分布右(正)偏:,第2章描述统计学,56,STAT,左(负)偏:,第2章描述统计学,57,STAT,卡尔皮尔逊经验公式:适度偏斜情况下,众数与中位数之间的距离,大约为中位数到算术平均数之间距离的两倍。,第2章描述统计学,58,第2章描述统计学,2.3偏度与峰度的测度,偏度(skewness)是用于衡量分布的不对称程度和偏斜程度的指标,用表示。,一、偏度,偏度的计算,算术平均数与众数的比较,59,第2章描述统计学,动差法,60,第2章描述统计学,61,第2章描述统计学,62,第2章描述统计学,二、峰度,63,STAT,2.4变异测定(MeasuresofVariability)平均指标只能反映现象的集中趋势而不能反映总体各单位标志值的差异程度。例,集中趋势和离散程度是总体分布的两个重要特征。离散趋势指标是反映总体各单位标志值差异(离散)程度的指标。又称标志变动指标、离散程度指标等。平均指标与离散趋势指标的区别:平均指标考虑的是如何消除离差,显示集中趋势。而离散趋势指标考虑的是如何计算离差,反映离散的程度及离差的大小。,第2章描述统计学,64,STAT,离散趋势指标作用:1、衡量平均数代表性的大小,2、反映变量值分布的离中趋势和离散程度,第2章描述统计学,例,甲:2020202020,乙:1919202021,丙:1818192124,=20,=20,=20,65,STAT,3、反映社会经济现象的均衡性和稳定性如甲、乙两工厂某年四个季度的产量资料如下(单位:万件):甲:65、68、72、75,平均每季产量为70万件;乙:34,51,95,100,平均每季产量为70万件。描述数据离散趋势的指标主要有全距、平均差、标准差、方差及变异系数等。一、全距(Range)全距是总体各单位某一数量标志的最大值与最小值之差。全距(R)=最大值最小值,特点1、优点:意义明确,简单方便。2、缺点:比较粗略,未考虑中间变量值的离散情况。,第2章描述统计学,66,第2章描述统计学,二、四分位数,四分位差:也称内距或者四分位间距,是极差(全距)的一种改进,通常用“Q.D”表示。,四分位差计算:,是1/4位次的标志值,即第一四分位数,也称下四分位数;是3/4位次的标志值,即第三四分位数,也称上四分位数;它反映了有四分之一的数据小于,有四分之一的数据大于;而有一半数据介于与之间。为第二四分位数即中位数。,特点:四分位差越小说明中间的数据越集中,反之越分散。,与极差比较优点:排除部分极值对变异指标的影响。,67,STAT,三、平均差(AverageDeviation)平均差是各变量值对其算术平均数离差绝对值的算术平均数。常用“AD”表示。(一)根据未分组资料计算,第2章描述统计学,(二)根据分组资料计算,68,STAT,简单平均差计算举例:,第2章描述统计学,69,STAT,加权平均差计算举例:,第2章描述统计学,70,STAT,判定准则:,平均差的特点:(1)充分考虑了每一数值的离中情况,在反映离中趋势方面比较灵敏,计算方法亦比较简单。(2)绝对值运算给数学处理带来很多不便。,第2章描述统计学,71,第2章描述统计学,四、异众比率,异众比率(variationratio)又称作离异比率或变异差比,是指众数组的频数占总频数的比率。,异众比率计算:,特点:异众比率是衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总频数的比重越大,众数代表性就越差;异众比越小,说明众数组的频数占总频数的比重越大,众数代表性越好。,72,STAT,五、标准差和方差(StandardDeviation&Variance)方差():总体各单位标志值与其算术平均数离差平方的算术平均数;标准差():总体各单位标志值与其算术平均数离差平方的算术平均数的平方根。(一)标准差和方差的基本计算,(简单标准差),(加权标准差),第2章描述统计学,73,STAT,简单方差与简单标准差计算举例:,第2章描述统计学,74,STAT,加权式方差与加权标准差计算举例:,第2章描述统计学,75,STAT,(二)标准差和方差的简捷计算,第2章描述统计学,76,STAT,例,第2章描述统计学,77,STAT,(三)是非标志标准差的计算,第2章描述统计学,例如,某班50名学生英语考试成绩及格人数39人,不及格人数11人。则:,78,STAT,第2章描述统计学,根据同一资料计算:,方差和标准差的特点:充分考虑了每一数值的离中情况,且避免了取绝对值不方便数学处理的缺点,故运用广泛。,79,STAT,(四)方差的加法定理,第2章描述统计学,资料分组后:,80,STAT,例11人日产量(件)如下:15,17,19,20,22,22,23,23,25,26,30。试求其总方差。,第2章描述统计学,平均组内方差:各组内方差的平均数。,81,STAT,例11人日产量(件):15,17,19,20,22,22,23,23,25,26,30。,第2章描述统计学,82,第2章描述统计学,83,STAT,例11人日产量(件)如下15,17,19,20,22,22,23,23,25,26,30。,结论:原始资料计算总方差;分组资料情况下,组内方差无法计算。因此,根据分组资料计算的方差实际上是组间方差。,第2章描述统计学,84,STAT,六、变异系数(CoefficientofVariation)前述离散趋势指标的特点:A、均带有与原
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职代会员工管理办法
- 上海高危产妇管理办法
- 行业系统消防管理办法
- 2025年HF-FB防弹玻璃项目发展计划
- 蚌埠艺术培训管理办法
- 营销费用兑付管理办法
- 行政平台维护管理办法
- 专利实施许可管理办法
- 磁器口古镇管理办法
- 精装房验收管理办法
- 药学综合知识与技能11讲解
- “匠心杯”班组长管理创新技能竞赛(决赛)考试题库500题(含答案)
- 森林防火林区道路建设基本要求
- 临床思维方法与医患沟通
- 幼儿居家饮食安全
- 《钢铁行业智能制造标准体系建设指南(2023版)》
- 设计材料与工艺课程 课件 第1章 产品设计材料与工艺概述
- 《SDH学习知识总结》课件
- GB/T 44841-2024非合金及低合金铸铁焊接工艺评定试验
- 2024年20kV及以下配电网工程劳务定额计价清单
- DB11T 1620-2019 建筑消防设施维修保养规程
评论
0/150
提交评论