




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲 集中趋势和离散趋势 (计量资料的统计描述),王晓莉 ,2,基本内容,3,计量资料的统计描述,描述什么? 描述的对象:计量资料,群体,4,5,群体特征的描述:一般先有一个变量,然后会有一系列的变量值,这些变量值就是一个群体。 针对这样一个群体,你想知道什么?(共性与特性,有群体就有变异) 同样是计量资料,但其特点又各不相同(分布问题:正态与非正态,计算均数时也不同),主要内容,频数表 集中趋势 离散趋势 正态分布 正常值范围估计,7,原始资料(变量与变量值,资料性质),一. 频 数 表,频数:当汇总大量的原始数据时,把数据按类型分组,其中每个组的数据个数,称为该组的频数。 频数表(频数分布):表示各组及它们对应的组频数的表格称为频数表或频数分布。,1998年100名18岁健康女大学生身高的频数分布,10,11,频数分布的特征: 集中趋势与离散趋势,12,二、集中趋势(集中位置的描述),一般用平均值来描述。 平均值是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心。,13,1.算术均数 2.几何均数 3.中位数,几种常用的平均值:,14,1.算术均数(均数),意义:一组性质相同的观察值在数量上的平均水平。 表示 (总体) X(样本) 特征: (X- X)=0 估计误差之和为0。 应用:正态分布或近似正态分布 注意:合理分组,才能求均数,否则没有意义。,例题: 100名18岁女大学生身高均数的计算 直接法、间接法、计算机 结果:163.48cm,16,有8份抗体血清的抗体效价分别为1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640, 求平均抗体效价。,17,2.几何均数,意义:N个数值的乘积开N次方即为这N 个数的几何均数。 表示:G = = -1 X n 计算: 应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。,18,3.中位数、百份位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。 表示:M 、PX 计算: 应用:偏态资料,开口资料,19,三、离散趋势(离散程度的描述),描述一组数据参差不齐的程度,20,21,常用指标,全距 四分位数间距 方差 标准差 变异系数,22,1.全距、四分位数间距 R :最大最小值之差。 Q:上四分位数(P75)Qu与下四分位数Ql (P25)之差,中间包含了全部观察值的一半。,23,2.标准差,相关概念(公式表示):离均差、离均差平方和 方差(2 S2 ) 标准差的符号: S 标准差的意义:全面反映了一组观察值的变异程度。(越大说明围绕均数越离散,反之说明较集中在均数周围,均数代表性越好),24,标准差的计算(公式): 例题: 100名18岁女大学生身高标准差的计算 结果:3.79 cm 标准差的应用:描述变异程度、计算标准误、计算变异 系数、描述正态分布、估计正常值范围,25,3.变异系数,意义:标准差与均数之比用百分数表示。 符号: CV 计算: CV=(S/X)100% 无单位 应用:单位不同的多组数据比较 均数相差悬殊的多组资料,26,四、正态分布,什么是分布? 1、图形 2、特征 3、面积,27,1998年100名18岁健康女大学生身高的频数分布,28,1、正态分布的图形,29,正态分布,30,2、正态分布的特征,均数处最高; 均数为中心对称; 2个参数 N( ,):决定图形的形状和位置 曲线下的面积有一定规律。,31,32,正态分布的特殊形式:,标准正态分布N(0 ,1); 标准正态变换(变换公式); 例题:一次统计测验的平均分是72,标准差是15,求60分、93分、72分的标准分数。 上例中,身高为160cm女大学生的标准分是多少?,33,34,3、曲线下面积,横轴上曲线下的面积为1 曲线下,横轴上对称于u的面积相等,从-到; 1个标准差位置的面积,95%面积下的标准差, 99%面积下的标准差 95%,99%的面积公式: z 与所对应的面积P成反比。,特点:,35,定义:又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。 习惯上是确定包括95%的人的界值。(正态分布的应用),五、(医学)正常值范围,37,单双侧: 根据指标的实际用途,有的指标有上下界值,过高过低均属异常;某些指标过高为异常,只需确定上限;某些指标过低为异常,只需确定下限。 估计的方法: 1、正态分布法 2、百分位数法,1.正态分布法 应用条件:正态分布或近似正态分布资料 计算 (双侧) 95% 正常值(医学参考值)范围公式: (x1.96S,x1.96S ),例如:某校女大学生身高的95%正常值范围 (163.841.963.79,163.841.963.79 ) 即(156.41 cm , 171.27 cm ),39,已知:x = 119.95cm, s = 4.72cm. 试问: (1) 估计该地7岁男童身高在110cm以下者 占该地7岁男童的百分比。 (2) 估计该地7岁男童身高在身高在130cm 以上者占该地7岁男童的百分比。 (3) 估计该地7岁男童身高在107.77cm到 132.13cm之间的占该地7岁男童的百分 比。,例题:某市1982年100名7岁男童的身高,40,2.百分位数法,P19例题 应用条件 : 偏态分布资料 计算公式: 双侧界值:P 2.5 P 97.5 单侧 上界: P 95 单侧 下界: P 5,41,小结 习题: 1.各观察值加同“1”后: A.均数不变,标准差改变 B.均数改变,标准差不变 C.二者均不变 D.均改变 2.用均数和标准差可全面描述: A.正偏态资料 B.负偏态资料 C.正态分布和近似正态分布 D.任何分布 3.正态分布曲线下,从均数u 到u +1.96的面积为; A.9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 猪八戒营销店铺方案
- 采煤支护工理念考核试卷及答案
- 食醋制作工效率提升考核试卷及答案
- 微信小程序教育营销方案
- 厦门预制化粪池施工方案
- 壶关网络营销策划方案
- 施工质量验收标准分析报告
- 建筑方案设计说明欧式
- 气体分离材料化学稳定性评价分析
- 欧式旧建筑改造方案设计
- T/CECS 10187-2022无机复合聚苯不燃保温板
- 人教版高中物理必修三同步练习全套(含答案)
- 动物疫情监测与预警的数据分析与利用
- 2025变压器振动监测与故障诊断装置
- 工程对赌协议合同模板
- 格拉斯哥昏迷评分法详解(GCS)
- GB/T 45403-2025数字化供应链成熟度模型
- 盒饭采购合同协议
- QGDW11337-2023输变电工程工程量清单计价规范
- 小学昆虫知识科普单选题100道及答案
- 防性侵教师培训
评论
0/150
提交评论