版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章数据的概括测量,第四章数据分布特征的测度,第一节集中倾向的测量第二节离散度的测量第三节偏态和峰度的测量,第一节集中倾向的测量、集中倾向(Central tendency ),一组数据接近其中心值的程度,反映了一组数据中心点的位置。 测度集中倾向是指,搜索数据的一般等级的代表值或者中心值的低等级的数据的集中倾向测度值适用于高等级的测定数据,相反,高等级的数据的集中倾向测度值不适用于低等级的测定数据。 因此,使用哪个测度值来反映数据的集中倾向,取决于所掌握的数据的类型。 分类数据:最频值(Mode )、一组数据中出现次数最多的变量值(用M0表示)、等级数据的最频值(修正算例)、【例】从表3调
2、查的200人中,关注商品广告的人最多,为112人,占总被实验者数的56% 甲城市中对住宅表示不满的家庭数以108户为最多,因此众数以“不满”为分类,即Mo不满、众数(概念点)、众数是一个位置代表值,不受极端值的影响,数据分布的最高峰对应的数值是众数可能有多个众数的1个最频值源数据33606595、多个最频值源数据:25283642、最频值(概念点)、与数据分布的最高峰对应的数值可能没有最频值或者有一些最频值,3 .抑制极端值的影响也可用于已排序数据和数值类型数据的通常情况中的排序数据:中值和分,中值,在对一组数据进行排序之后,当从中间位置的变量值、未分组数据中校正中值时,首先对数据进行排序,然
3、后确定中值的位置, 基于此确定中央值的具体数值的数值型未分组化数据的中央值(5个数据的修正算例),原始数据3360、20、21、22、26位置3360、124、中央值22、数值型未分组化数据的中央值(6个数据原始数据3360105126 8排名3360581012位置336012345 6、中值、1 .不受极端值的影响2 .主要用于序列数据,也可以使用数值型数据, 分类数据3 .各变量值和中央值的分散绝对值中不能使用的四分位(quartile概念点),1 .位于排序后的25%和75%的位置的值,2 .不受极端值的影响3 .主要用于顺序数据和数值型数据,但分类数据和四分位(位置的确定)都如果是还
4、不能使用的2.0.5的位置,则在取该位置的两侧的值的平均数的0.25或者0.75的位置上,四分位数等于在该位置的下侧的值上加上比例分配位置的两侧的值的差。、数值型未分组化数据的四分位(7个数据的校正算例)、原始数据3360232130282526排名336021252632位置336012456, n、ql=21(23-21 )、4、=1.75、QU位置=、3N、4、21、4、=5.25、QU=28 (30-28)*0.25=28.5原始数据:10591368、简单平均简单均值、加权平均与X1、X2、 XK对应的度数为F1、F2、 作为FK加权平均的校正运算的加权平均(例题分析),将各组的实际
5、数据放入各组中进行代表,假设各组的数据在组内均匀分布,否则误差较大,平均值(概念点),1 .最常用的测度值2 .一组数据的均衡利用所有信息的3 .容易受极端值影响的4 .数值型1 .各变量值和平均值的方差之和等于零,2 .各变量值和平均值的方差平方和最小,几何平均(geometric mean概念点),1 .作为集中倾向的测度值之一的2. N个变量值的乘积的n次方根3 5 .可以看作平均值变化的【例4.10】一个投资者持有股票,1996年、1997年、1998年和1999年的收益率分别为4.5%、2.0%、3.5%、5.4%。 我要修订这四年间投资者的平均收益率。 平均收益率103.84%-1
6、=3.84%、最频值、中央值与平均值的比较、最频值、中央值与平均值的关系、分布的观点来看,最频值始终是一组数据分布的最高峰,中央值是位于一组数据的中间位置的值,平均值是全部,具有单峰分布的大多数数据适用于作为分类数据的集中倾向测度值中央值不受极端值的影响的数据分布的偏差程度大的情况,适用于顺序数据的集中倾向测度。 平均值容易受到极端值的影响,偏差分布具有代表性差的数学性质优异,利用了所有的数据信息。应用于数据对称分布或接近对称分布时,数据类型和集中倾向测度值、第二节离散度的测度、离散度、数据分布的另一个重要特征离散度的各测度值,是数据离散度的记述反映各变量值离开其中心值的程度的分类数据:不同比
7、率, 异众比率(variation ratio概念点),1 .离散度的测度值之一2 .非众数排列的度数占总度数的比率3 .修正算式,4 .用于测量众数的代表性的异众比越大,非众数排列的度数占总度数的比重越小,众数的代表性的东西【例4.11】根据第3章表3-1的数据,不同比率、顺序数据:四位数差、四位数差(quu ) 1 .离散度的测度值之一。3 .上四分位和下四分位之间的差QD=QU - QL 4.反映出中间50%的数据的离散度代表性地测量中值而不受极端值的影响,也被称为内距离或四分位之间的距离。数值类型数据:的离散度和标准偏差极其全距离2 .离散度最简单的测度值3 .容易受极端值的影响的4
8、.不考虑数据的分布,R=max(Xi) - min(Xi ),5 .修正公式只利用了6 .数据两端的一组信息, 没有反映中间数据的信息的1 .离散度的测度值之一2 .各变量值及其平均离散绝对值的平均数3 .不能全面反映一组数据的离散度的4 .数学性质差,实际上应用少,5 .修正算式为平均差(例题分析)、平均差(例题分析), 意思:与每天的销售平均数比较的方差和标准偏差(variance和standard deviation的概念点),1 .离散度的测量值之一2 .最常用的测量值3 .反映数据的分布各变量值和平均值的方差平方的平均值从整体数据中被修正, 根据称为总体方差或标准偏差的样本数据来校正
9、的样本方差或标准偏差、总体方差和标准偏差(校正公式)、未分组数据:组距离组数据:组距离组数据:方差校正公式、标准偏差校正公式、样本方差和标准偏差(校正公式) 当样本方差自由度(degree of freedom )、一组数据中可以自由取值的数据的个数样本数据的个数为n时,只要样本平均x确定,就可以自由取值n-1个数据, 其中之一是不能自由取值的样本方差的理由可以从多方面说明,从实用上用总体方差推定总体方差2的话,那就是2的无偏差的推定量,总体标准偏差(例题分析),总体标准偏差(例题分析),意思:每天的销售量与平均相比,平均为21.58 方差(简化校正公式),总方差,方差D2是X0的方差,则相对
10、位置的测量:标准分数,标准分数,2 .一个值可以用于测量一组数据中的相对位置3 .一组数据中是否有异点4 .对于变量的也称为标准化值,要校正的标准分数仅是对原始数据进行线性转换,而不是改变数据集中的数据位置或改变集数分布的形状,只是将数据集改变为平均值0、标准偏差1。标准化值(例题分析)、经验规则、经验规则是一组数据对称,钟形分布的情况下(对称)约68%的数据在平均减去1个标准偏差的范围内约95%的数据在平均减去2个标准偏差的范围内约99%的数据在平均减去3个标准偏差的范围内k=2、3、4 至少75%的数据在平均值减去2个标准偏差的范围内,至少89%的数据在平均值减去3个标准偏差的范围内,至少94%的数据在平均值减去4个标准偏差的范围内,切比雪夫不等式(chebyshevsing ) 此时,可以使用切比雪夫不等式。 它对任何分布形状的数据都应用切比雪夫不等式来提供“下界”,即“所占比例至少和是多少”。 k是大于1的任意值,但不一定是整数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中石油昆仑好客有限公司校园招聘笔试备考题库及答案解析
- 2026年云南机场集团有限责任公司校园招聘笔试模拟试题及答案解析
- 2026年中国石油冀东油田分公司校园招聘笔试备考题库及答案解析
- 2026“市委书记进校园”引才活动穆棱市事业单位招聘10人考试备考试题及答案解析
- 2024年春七年级历史下册 第三单元 明清时期 统一多民族国家的巩固与发展 第16课 明朝的科技、建筑与文学教学设计 新人教版
- 2026年锦州北镇市第二人民医院公开招聘外科医生1人考试参考试题及答案解析
- 2026江苏事业单位统考南通市海安市招聘81人考试参考题库及答案解析
- 2026年中国华油集团有限公司校园招聘笔试备考试题及答案解析
- 2026年3月重庆市永川区统计局公益性岗位招聘1人考试备考试题及答案解析
- 2025-2026学年分科教学设计感上衣
- 直播间投流合同范本
- 人身损害与疾病因果关系判定指南
- 2025年英才计划物理学科题库及答案
- 2026年抚州职业技术学院单招职业适应性考试必刷测试卷附答案解析
- 2025军事理论考前题库及答案
- 罐车租赁合同模版全文版2025年
- 低频电疗法授课
- 市场营销方面的毕业论文5000字
- 老年人结肠缺血诊治中国专家指导意见解读课件
- 检测实验室质量手册及程序文件合订本-符合2023版《评审准则》
- 股权架构搭建合同范本
评论
0/150
提交评论