版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二十四章 描述统计本章考情本章重点:测度数据集中趋势的统计量:均值、中位数和众数。测度数据离散程度的统计量:方差、标准差和离散系数。测度数据分布偏态的统计量:偏态系数、标准分数。测度变量相关关系的统计量:散点图、相关系数。知识点一:集中趋势的测度1.均值。平均数,就是数据组中所有数值的总和除以该组数值的个数。均值是集中趋势最主要的测度值,它是一组数据的重心所在,解释了一组数据的平均水平。【示例】某售货小组 5 名营业员,元旦一天的销售额分别为 520 元、600 元、480 元、750 元和 500元,求该日平均销售额。平均销售额(520600480750500)5570(元)【注意 1】均
2、值主要适用于数值型数据,但不适用于分类和顺序数据。【注意 2】均值容易受到值的影响,对数据组的代表性减弱。值会使得均值向极大值或极小值方向倾斜,使得均值需要全部信息避不开值!2.中位数。把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me 表示:【注意 1】中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。【注意 2】中位数的优点:不受值的影响,性强,尤其适用于偏斜分布的数值型数据。不需要全部信息能避开值!3.众数:指一组数据中出现次数(频数)最多的变量值。不适用于定量数据。【注意】适用于描述分类数据和顺序数据的集中趋势。在定量数据中,可能出现
3、多众数和无众数的情况,因此众数不适于描述定量数据的集中位置。不需要全部信息能避开总结:值!指标适用特点均值定量变量利用全部信息,受值影响明显值,则代表性差中位数顺序变量定量变量不受值影响适用于分布不对称的数据年份单选题多选题合计2018 年3 题 3 分1 题 2 分5 分2017 年3 题 3 分1 题 2 分5 分2016 年2 题 2 分2 题 4 分6 分【例题单选题】(2018 年)下列统计量中,适用于描述分类数据和顺序数据集中趋势的是( )A.众数 B.均值C.标准分数D.中位数正确A本题考查众数。众数适用于描述分类数据和顺序数据的集中趋势。【例题单选题】(2017 年)2016
4、年某企业下辖 8 个的销售额分别为 10000 万元、3600万元、800 万元、1000 万元、600 万元、3000 万元、2800 万元、2200 万元,这组数据中的中位数是(万元。A.2200 B.2800 C.2500D.3000正确C本题考查中位数的计算。(28002200)/22500。【例题单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是( )。A.中位数 B.均值 C.标准差 D.方差正确A本题考查中位数。中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受值的影响,性强,尤其适用于收入这类偏斜分布的数值型数据。知识点二:离散程度的测度
5、(一)方差和标准差离散程度:反映的是数据之间的差异程度。集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。1.方差方差:数据组中各数值与其均值离差平方的平均数。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。总体方差公式:没有充分利用全部信息,稳定性优于众数,差于均值众数分类变量顺序变量没有充分利用全部信息,不受值影响适用于分布明显呈偏态的数据可能不唯一【示例】某售货小组 5 名营业员,元旦一天的销售额分别为 520 元、600 元、480 元、750 元和 500元,平均销售
6、额为 570 元,计算日销售额的样本方差。(520570)2(600570)2(480570)2(750570)2(500570)2(51)12200(元 2)2.标准差(1)标准差:方差的平方根。【示例】5 名营业员元旦当天的销售额的标准差(2)标准差与方差只适用于数值型数据,它们对值很敏感。(二)离散系数1.离散系数:变异系数或标准差系数。标准差与均值的比值:适用:不同类别数据离散程度的比较。【注意】标准差的大小不仅与数据的测度有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度。离散系数消除了测度和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。【示例】某学校
7、学生的平均为 20 岁,标准差为 3 岁;该校教师的平均的离散程度。为 38 岁,标准差为3 岁。比较该校学生和教师正确教师学生学生的离散程度更大。的离散系数3/200.15的离散系数3/380.0789【例题多选题】(2017 年)下列统计量中,适用于测度数据离散程度的有( )。A.众数 B.方差 C.中位数 D.标准差E.均值正确BD本题考查测度数据离散程度的指标。选项 ACE 属于测度集中趋势的指标。【例题多选题】(2015 年)下列统计量中,容易受A.均值 B.方差 C.众数 D.中位数E.标准差值影响的有( )。正确ABE本题考查集中趋势和离散程度的测度指标。均值、方差、标准差容易受
8、值的影响【例题单选题】(2015 年)根据 2014 年某城市金融业和制造业各 1000 人的年薪样本数据来比较这两个行业从业 A.标准分数 B.相关系数 C.变异系数D.偏态系数年薪的离散程度,应采用的统计量是( )。正确C本题考查离散系数。离散系数也称为变异系数或标准差系数,即标准差与均值的比值,主要用于不同类别数据离散程度的比较。知识点三:分布形态的测度(一)偏态系数(SK):偏度:指数据分布的偏斜方向和程度,描述的是数据分布对称程度。(单选)偏态系数:测度数据分布偏度的指标。取决于离差三次方的平均数与标准差三次方的比值。3.应用:偏态系数的绝对值越大,数据分布偏斜程度越大。SK0:数据
9、分布是对称的;SK0:数据分布右偏;00.5(轻度)0.51(中度)大于 1(严重)(3)SK0:数据分布;00.5(轻度)0.51(中度)大于1(严重)【例题多选题】(2018 年)在描述统计中,测度的数据分布特征主要包括( )。A.对称程度 B.离散程度 C.相关性 D.集中趋势E.偏斜方向正确ABDE本题考查描述统计。在描述统计中,可以通过统计量描述数据的分布特征。对于数据分布特征的测度主要分为三个方面:一是分布的集中趋势,反映各数据向其中心值靠拢或的程度;二是分布的离散程度,反映各数据之间的差异程度,也能反映中心值对数据的代表程度;三是分布的偏态,反映数据分布的不对称性。对于两个定量变
10、量之间的相关分析,经常采用的描述方法是散点图和相关系数统计量。【例题多选题】(2015 年)某企业员工年收入数据分布的偏态系数为 3.0,则该组数据的分布形态为( )。A.右偏 B.C.严重偏斜 D.轻度偏斜E.中度偏斜正确AC本题考查偏态系数。偏态系数为 0,说明数据的分布是对称的。为正,说明分布是右偏的:取值在 00.5 之间说明轻度右偏;取值在 0.51 之间,说明中度右偏;取值大于 1 说明严重右偏。为负,说明分布为:取值在 00.5 之间,说明轻度;取值在0.51 之间说明中度;取值小于1,说明严重。本题中,偏态系数为 3,说明严重右偏。【例题多选题】(2016 年)在某上,商品甲得
11、到 6 个评价得分,分别是 1、4、4、5、55;商品乙得到 5 个评分,分别是 3、3、3、4、4。关于这两组数据的说法,正确的有( )。A.商品甲的评分中位数高于商品乙 B.商品甲的评分均值低于商品乙 C.商品甲的评分众数高于商品乙D.商品甲的评分分布离散程度大于商品乙E.商品甲的评分分布是的正确ACDE本题考查集中趋势、离散程度的测度。商品甲:评分中位数(45)/24.5,众数5,均值(144555)/64,方差(14)2(44)2(44)2(54)2(54)2(54)2/52.4,标准差1.55,离散系数1.55/40.3875。商品乙:评分中位数3,众数3,均值3.4,标准差0.55
12、,离散系数0.55/3.40.16由于商品甲离差三次方,即(14)3(44)3(44)3(54)3(54)3(54)324,根据公式可知偏态系数为负,说明数据分布。(二)标准分数标准分数(Z 分数):统计学上常用的一种标准化方法。标准分数可以给出数值距离均值的相对 位置,用于比较不同分布的变量值。公式:标准分数 Z(数值均值)标准差结果:标准分数 Z 越大越好。【注意】转变后的标准分数并没有改变数值在原分布中的位置,也没有改变数据原分布的偏态,但是标准分数的平均数为 0,标准差为 1。【示例 1】考核 A 中员工得分 80 分,均值 80 分,标准差为 20 分,在考核 B 中员工得分 70
13、分,均值 60 分,标准差为 5 分。80 分的Z 分数(8080)20070 分的Z 分数(7060)52【说明】70 分在考核 B 中的相对高于 80 分在考核 A 中的相对。【示例 2】某班期末。语文全班平均成绩 73 分,标准差 7 分,甲得了 78 分;数学全班平均成绩 80 分,标准差 6.5 分,甲得了 83 分。甲哪一门成绩更优秀?因为两科分布(均值、标准差)不同,不能用原始数据直接比较,需要转换成标准分数,然后比较。Z(语文)(7873)70.71 Z(数学)(8380)6.50.64【说明】甲的语文成绩更优秀。4.实际应用:当数据服从对称的准差之内的数据项所占比例。分布时,
14、可以运用经验法则来判断与均值的距离在特定倍数标约有 68%的数据与平均数的距离在 1 个标准差之内,标准分数在1,1范围内;约有 95%的数据与平均数的距离在 2 个标准差之内,标准分数在2,2范围内;约有 99%的数据与平均数的距离在 3 个标准差之内,标准分数在3,3范围内。【示例】语文全班平均成绩 73 分,标准差 7 分:则 68%的同学得分在 66 和 80 之间;则 95%的同学得分在 59 和 87 之间;则 99%的同学得分在 52 和94 之间。【例题单选题】(2018 年)某公司员工年度业绩考核中,全体员工考核成绩的均值为 80,方差为 25。某员工在这次业绩考核中成绩为
15、85,则该员工考核成绩的标准分数为( )。A.3.4B.0.2C.1.0D.17.0正确C本题考查分布形态的测度。标准分数可以给出数值距离均值的相对位置,计算方法是用数值减去均值所得的差除以标准差,标准分数(8580)/51。【例题单选题】(2017 年)根据经验法则,当数据服从对称的个标准差之内的数据项所占比例约为( )。A.99% B.68% C.95%D.100%分布时,与平均数的距离在 3正确A本题考查分布形态的测度。约有 99%的数据与平均数的距离在 3 个标准差之内,标准分数在3,3范围内。【例题多选题】(2016 年)某企业客户满意度数据服从对称的5。根据经验法则,关于该企业客户
16、满意度的说法,正确的有( )。约有 68%的客户满意度在70,80范围内约有 68%的客户满意度在75,85范围内约有 95%的客户满意度在75,95范围内约有 95%的客户满意度在65,85范围内约有 99%的客户满意度在60,90范围内分布,均值为 75,标准差为正确ADE本题考查标准分数。经验法则表明:约有 68%的数据与平均数的距离在 1 个标准差之内,约有 95%的数据与平均数的距离在 2 个标准差之内,约有 99%的数据与平均数的距离在 3 个标准差之内。知识点四:变量间的相关分析(一)相关关系分类按相关的程度:完全相关、不完全相关和不相关。按相关的方向:正相关和负相关。按相关的形
17、式:线性相关和非线性相关。【注意】相关关系并不等同于因果关系。(二)两变量的散点图:两个变量间的关系可以用散点图来展示。观测点分布无规律:不相关。观测点分布密集在一条线周围:线性相关。(1)正相关:直线向右上倾斜(2)负相关:直线向右下倾斜3.观测点呈现曲线模式:两个变量非线性相关。(三)相关系数的定义和计算Pearson 相关系数:度量的是两个变量之间的线性相关关系。Pearson 相关系数的取值范围:1r1。(1)0r1:变量 X 和 Y 之间存在正线性相关关系;1r0:变量 X 和 Y 之间存在负线性相关关系;r1:变量 X 和 Y 之间为完全正线性相关,即变量 Y 的取值完全依赖于变量
18、 X;r1:变量 X 和 Y 之间为完全负线性相关,即变量Y 的取值完全依赖于变量 X。【注意】Pearson 相关系数只适用于线性相关关系的判断。因此r0 只表示两个变量之间不存在 线性相关关系,并不说明变量之间没有任何关系,比如它们之间可能存在非线性相关关系。3.相关程度:【例题单选题】(2018 年)两个变量之间完全相关是指( )。两个变量之间的数值变化大致呈现为线性关系一个变量的取值完全由另一个变量的取值变化来确定 C.两个变量之间存在因果关系D.两个变量的取值变化互不影响正确B本题考查变量间的相关关系。当一个变量的取值变化完全由另一个变量的取值变化所确定时,称这两个变量间的关系为完全相关。【例题单选题】(2017 年)下列图形中,适用于描述两大定量变量间相关关系的是( )。A.散点图 B.圆形图 C.条形图D.直方图正确A本题考查散点图。两个变量间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家政员私单飞单处罚流程制度
- 装配车间精密数控机床维护规范
- 检验线产前协调调度计划制度
- 金太阳甘肃省2026届高三下学期4月联考语文+答案
- 测试工段样件验证流程制度
- 2026财务人员思想报告(2篇)
- 检验科年度院感培训计划2篇
- 房屋装修标准合同范本合同三篇
- 2016版EPC项目总包合同样本合同三篇
- 2026四川九洲投资控股集团有限公司招聘宣传文化岗1人笔试参考题库及答案解析
- 血细胞分析课件
- 手术麻醉安全管理及护理配合课件
- 全航速减摇鳍
- 劳动纠纷应急预案
- 外科学第二十三章 颅内和椎管内血管性疾病
- YY 0777-2023射频热疗设备
- 沈阳地铁6号线一期工程环评报告
- 河南建设工程项目安全生产综合评定表
- 2020中国大学慕课超星尔雅工程伦理2020章节测验答案
- -NSF-PROD-NF-V5.6-产品规格说明书-V1.1
- 测绘生产困难类别细则及工日定额
评论
0/150
提交评论