版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、平平均均指指标标数值平均数数值平均数位置平均位置平均数数调和平均数调和平均数几何平均数几何平均数算术平均数算术平均数中位数中位数众数众数数据的特征和测度数据的特征和测度分布的形状分布的形状离散程度离散程度集中趋势集中趋势l例:有5名工人生产的零件数分别为:15、16、17、18、19,平均零件数为多少?l解: (件) NXXi1751918171615Xl解:工资(x)工人数(f)工资总额(xf)50021000530421207408592086054300102011020合计20143607182014360fxfX(元)66402640fxfX按零件数分组(个)组中值(x)人数(f)x
2、f506055844060706520130070807512900合计402640l解:(件)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下l 甲组:甲组: 考试成绩(考试成绩(x ): 0 20 100l 人数分布(人数分布(f ):):1 1 8l 乙组:乙组: 考试成绩(考试成绩(x): 0 20 100l 人数分布(人数分布(f ):):8 1 1l简单算术平均数两组成绩一样,加权后l简单调和平均数l加权调和平均数XMMHXnH1+某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格(元元) x成交额成交额(元元) M成交量成交量(公斤公斤)f
3、甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000l设l则 (已知m、f) (已知x、f) (已知x、m)fmx xmmxfxfxfmxffNNNXXXXXG21l例1:一位投资者持有一种股票,1997,1998,1999,2000收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。l例2:某企业四个车间流水作业生产某产品。一车间产品合格率为99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率。%84.103%4 .105%5 .103%0 .102%5 .1
4、044%94.93%90%92%95%994%8.6%6 .108%)151 (%)101 (%)81 (%)41 (%)31 (2521084平均年利率为ffXG 投资银行某笔投资是的年利率是按复利计算的,25年利率分配时(按时间数序):有一年是3%,有4年为4%,有8年为8%,有10年为10%,有2年为15%。求平均年利率。0 众数是一组数据中出现次数最多的变量值 主要用于分类数据,顺序数据和数值型数据l对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数。l对于组距数列,若众数组相邻两组次数相等,则众数组的组中值就是众数;若众数组上一组的次数较多,则众数在众数组内靠近上限;若众数
5、组下一组的次数较多,则众数在众数组内靠近下限。 计算公式:iLMo211l数字代码:如:男生 0 ;女生 1(0、1只是代码,没有具体含义)l平行分类:仅分类,不分级,每一类没有大小、优劣之分l只看是或不是某类,不能交叉l分类且分级,有好坏、优劣之分,如:产品等级,一级二级三级l虽然分类,但不能测出类与类之间的精确差异l因为有序,所以可比,如一等优于二等;优、良、中、及格、差l这里的数值不是代码而是有具体的意义l绝对零点:表示不存在或没有,如空集,不存在元素,没有元素l0在定距尺度中作为比较标准,不表示没有l如某学生0分,或气温0摄氏度,l并不表示没有成绩或没有温度,0是有具体含义的,就不属于
6、绝对零点l分类,分级,可计算,所以更精确l可分类,可排序,可计算差值,可相比l0在定比尺度中,可以表示没有,不存在,或理论上的极限l可以加减,也可以乘除,确定倍数比率关系不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%) 非常不满意非常不满
7、意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0l重叠:下限在内,上线不包括l例如:学生成绩50-60不及格,60-70及格11112121111212111121211 . ,212 .,213 .,2ffffff , 众 数 等 于 组 中 值, 众 数 小 于 组 中 值, 众 数 大 于 组 中 值n找出众数所在的组:哪一组频数最大,出现次数最多n相邻两组的频数不相等,众数组的组中值不为众数,利用公式求解l根据组距资料确定众数首先确定众数组,然后根据相邻组的次数,用内插法确定众数l中位数是一组数据按一定顺序排列后,处
8、于中间位置上的变量值。l对于未分组数据,奇数:中位数位置=(n+1) / 2偶数;中位数位置 n / 2,(n / 2)+1数据很多时,不要求那么精确,直接用中位数位置=(n+1)/2即可l不是所分组中间的那组,而是向下(向上)累计频数大于等于2 / N第三第四之间第三第四之间l对于单项式分组数据,相当于定序分组中位数位置=l对于组距数列,确定中位数所在组之后,可根据插值法按以下公式计算中位数(假定中位数组的频数在该组内均匀分布)2/f 12memfSMUfiimmefSfLM12112emmmMLUdffff: 中 位 数 ;: 下 限 ;: 上 限 ;: 中 位 数 所 在 组 的 组 距
9、中 位 数 的 位 置 ;: 中 位 数 所 在 组 的 次 数: 中 位 数 所 在 组 以 前 各 组 的 累 计 次 数 ( 向 上 累 计 ): 中 位 数 所 在 组 以 后 各 组 的 累 计 次 数 ( 向 下 累 计 )比例比例年收入(元)农户数农户数累计向上累计向下累计5006006007007008008009009001000100011001100120012001300240480105060027021012030240720177023702640285029703000300027602280123063036015030合计3000l解:因第3组次数最多,故其
10、为众数组。 l中位数位置= = 1500,根据向上累计,所以第三组为中位数组。 iLMo2111050-480=7001001050-4801050-600570=700100=755.9570450() ()(元)12memfSMLfd3000=22f1500720700100774.3()1050元l标志变异指标的作用 衡量平均数代表性的大小 反映社会经活动过程的均衡性和节奏性例: 1、有两个小组工人工资资料如下: 甲:50 60 70 80 90 乙:60 65 70 75 80l 极差(R)=最大标志值-最小标志值 如前例中,l 对于组距数列极差也可以近似表示为: R=最高组上限值-最
11、低组下限值(元)(元)乙甲206086405090RRff二、二、总数是偶数的,四等分后,不会落在某个数值上,而是两数之间,所以下四等分点比225大,应该出现在“满意”这一组例如8个数,七个间距,四等分后,等分点不会落在某数上,而是两数之间l满意 - 不满意=?四分位差体现分布范围,差值越大说明表明中间50%变量值分布越远离他们的中点,即远离中位数,说明中位数的代表性越差l用赋值的办法解决,本题目中所得数值2,不代表“不满意”这一组,而是指满意度之间的差距是两个等级,中位数是“一般”这一组,说明中间50%的住户的满意度是在“不满意”到“满意”之间的两个等级=0iiiXXXXXX:离差:每一项数
12、值:算数平均值NXXMd12570907080707070607050甲dM6570807075707070657060乙dM例:有两个小组工人工资资料如下: 甲:50 60 70 80 90 乙:60 65 70 75 80简单平均式(未分组)简单平均式(未分组)如两组工人工资平均差12506070 80 90/5706065 7075 80/570XX月工资额X工人数f工资总额Xf离差离差绝对值5060708090305070302015003000490024001800-18-82122218821222540400140360440合计200136001880XX XX fXX 例:
13、4.92001880(6820013600ffXXMfXfXd元)平均值如何计算?l组距式数据计算加权均值:l计算每组组中值(组内均匀分布)l各组组中值加权平均、n方差是标准差的平方标准差方差的算术平方根,如何区别?n方差把原来数据的计量单位(量纲)升级了,如:原来单位是厘米,平方后成了平方厘米,零件个数成了“个”的平方,没有意义,为了避免量纲前后不一致,再开方。简单平均式简单平均式222()()XXNXXN方 差)(标准差)14.1457090708070707060705022222)()()()()(甲07. 757080707570707065706022222)()()()()(乙上
14、例: 222()=()iiiXXffXXff加权平均式(个)(87. 7505 .3100)2ffXXl未分组数据:1=nniiiXnXXnXX ,五、离散系数越小代表性越好甲商店乙商店组中值x人数fxf组中值x人数fxf253545556531296754204053307684321441176253545556528647036033026051228896784合计3012302520合计2010201680试问两个商店营业员平均销售额的代表性哪个大?为什么?fXX2)(fXX2)(165. 9201680)(165. 9302520)-(512010204130123022ffXXf
15、fXXfXfXfXfX乙商店标准差甲商店的标准差乙商店的销售额甲商店的销售额%18%10051165.9%100%3 .22%10041165.9%100XX例例:对成年和幼儿身高进行调查资料如下:成年组(厘米):161 163 165 167 169幼儿组(厘米):73 74 75 76 77哪一组平均身高的代表性更大?1652.4751.2(ddXX成成幼( 厘 米 )( 厘 米 )( 厘 米 )厘 米 )100%ddX平均差系数%6 . 1%100752 . 1%45. 1%1001654 . 2幼成dd用“是”、“否”或“有”、“无”来表示的标志是是非标志非标志。总体单位数用N来表示。
16、 表示具有所研究标志值的单位数, 表示不具有所研究标志的单位数。1N0NQPQPNNQNNP1101或)1 (PPPQPX是非标志的标准差是非标志的平均数NNN01l标准化数值是一个数据在数据集中相对位置的测度。 l计算公式为 l标准化数值就是数据值偏离平均数标准差的个数。正的z值表示观察值位于平均数右侧,负的z值表示观察值位于平均数左侧。 l根据经验法则,对于钟形分布,几乎所有的数据都在偏离平均数3个标准差范围之内。因此,标准化数值低于-3或高于3的数据值就是异常值异常值,也称为离群点离群点。sxxz1、假设下面数据是A公司和B公司的供货天数:A:11 10 9 10 11 11 10 11
17、 10 10B: 8 10 13 7 10 11 10 7 15 12 利用全距和标准差来证明A公司供货时间上更具有一致性和可一致性和可靠性。靠性。2、下面数据是某大学田径队的队员跑400米和1500米的时间(分钟)400米: 0.92 0.98 1.04 0.90 0.991500米:4.52 4.35 4.60 4.70 4.50一名教练看了以上样本后断言,400米耗时更具有一致性。一致性。对不对?为什么? l1.对分类数据离散程度的测度l2.非众数组的频数占总频数的比率l3.计算公式为不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%) 可口可
18、乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100数据类型和所适用的离散程度测度数据类型和所适用的离散程度测度值值数据类型数据类型分类数据分类数据 顺序数据顺序数据数值型数据数值型数据适适用用的的测测度度值值异众比率异众比率四分位差四分位差 方差或标准差方差或标准差 异众比率异众比率 离散系数(比较时用)离散系数(比较时用) 平均差平均差 极差极差 四分位差四分位差 异众比率异众比率集中趋势和离散程度是数据分布的两个重要特征,但要全面了解数据分布的特点,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。偏态偏态和峰度峰度就是对这些分布特征的近一步描述。 ffXXffXX33333)()( 如果次数分布是完全对称的,叫对称分布对称分布;如果次数分布不是完全对称的,就称为偏态分布偏态分布。所谓偏度,就是指次数分布的非对称程度,以偏态系数偏态系数来表示。333,0说明是对称分布。高。越大,说明偏态程度越30,说明是右偏ffXXffXX44444)()(l峰度是分布集中趋势高峰的形状。它通常是与正态分 布相比而言的。l若分布形状比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 慢性心衰急性加重期复苏平衡策略
- 年度业绩考核激励方案
- 感染性心内膜炎脑出血的二级预防策略
- 患者自主权与医疗安全沟通策略
- 患者焦虑评估的医患沟通干预策略
- 职业技能培训学校教学设备采购合同模板
- 新能源项目合同的核心要点
- 企业外部合作合同审批及存档管理模板
- 2024年陕西省西安市保安员理论考试题库及答案(全面)
- 艺术品与古董拍卖交易合同
- 2025年湖南铁道职业技术学院单招职业技能测试题库带答案
- 2023冷库地面工程技术规程
- 小学一年级加减法口算100道A4直接打印
- 教育学开题报告模板
- 化学品(氩气+二氧化碳混合气)安全技术使用说明书
- 工程管理前沿技术研究
- 2024版七年级下册美术模拟试卷
- 大学生创业设计指导 课件 项目一 路演敲开创业之门
- 羊寄生虫综合防控技术规范
- 诊所中药饮片清单
- 2023-2024学年人教部编版统编版九年级上学期历史期末模拟试卷(含答案解析)
评论
0/150
提交评论