




已阅读5页,还剩98页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第十六章数值变量资料的统计分析,江海东,.,学习目的和要求,掌握:1.集中趋势指标的计算与应用意义2.离散趋势指标的计算与应用意义3.数值变量资料的t检验熟悉:1.总体均数的区间估计2.假设检验的意义和步骤了解:数值变量资料的统计描述中频数表的制作,.,第一节数值变量资料的统计描述,一、编制频数表(了解)120名12岁男孩身高(cm)资料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9,.,1.计算全距(极差)R=最大值-最小值2.确定组距确定组段数:815组确定组距:组距i=全距/组段数3.划分组段4.统计频数,.,120名12岁男孩身高(cm)资料的频数分布,.,二、集中趋势指标(掌握),数值变量资料的集中趋势指标用平均数来描述。常用的平均数有算数均数、几何均数、中位数,.,(一)算数均数,样本均数用表示,.,2.应用条件适用于呈对称分布或近似对称分布的资料。,.,3.计算方法,直接法:变量值个数不多公式为,.,加权法:n100,公式为,.,例,某年某市120名12岁健康男孩身高(cm)资料如下表,求其平均数。,.,142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9,120名12岁男孩身高(cm)资料,.,120名12岁男孩身高(cm)资料的频数分布,.,120名12岁健康男孩身高(cm)均数的加权法计算,.,.,(二)几何均数,1定义将n个变量值的乘积开n次方所得的根即为几何均数。符号用G表示,.,2.适用条件:,数值变量呈倍数关系或呈对数正态分布,如抗体效价、抗体滴定度、疾病潜伏期,.,3.计算,.,例,5人的血清滴度分别为1:2、1:4、1:8、1:16、1:32,求平均滴度。,.,.,加权法:变量值个数较多或变量值为频数表资料,二、几何均数(几何平均数),.,例2-4,某年某市100名儿童接种某种疫苗后,测定抗体滴度的资料如第(1)、(2)列所示,求该疫苗的抗体平均滴度。,.,.,.,(三)中位数和百分位数,中位数1.定义将一组变量值按大小顺序排列,位次居中的变量值即为中位数。符号用M表示,.,2.适用条件,变量值中出现特小或特大的数值资料的分布呈明显偏态变量值分布一端或两端无确定数值,只有小于或大于某个数值资料的分布类型不清,.,3.计算方法,直接法当变量值个数为奇数时计算公式为M=,.,当变量值个数为偶数时计算公式为,.,例,某地11例某传染病患者,其潜伏期(天)分别为2,2,4,3,5,6,3,8,9,11,15,求其平均潜伏期。,.,.,例,如上例资料在第21天又发生1例该传染病患者,其平均潜伏期又为多少?先将变量值按从小到大的顺序排列:2,2,3,3,4,5,6,8,9,11,15,21。,.,.,频数表法,编制中位数计算表,确定中位数所在的组段,计算中位数,.,计算公式,.,例,现有145例食物中毒病人,其潜伏期分布如下表的第(1)(2)栏,求中位数。,.,145例食物中毒病人潜伏期分布表,.,可确定中位数所在组段是12,故L12,i6,fm38,n145,63。代入公式,得M=12+(6/38)(14550%63)=13.5(小时),.,百分位数,1定义指将n个观察值从小到大依次排列,再把它分成100等份,对应于x%位的数值即为第x百分位数。中位数是第50百分位数,用P50表示。第25,第75,第95百分位数记为P25,P75P95是统计学上常用的指标。,.,PX,X%(100-X)%,.,2计算方法,L:Px所在组段下限i:组距n:总例数f:Px所在组段频数fL:小于L的各组段累计频数,.,145例食物中毒病人潜伏期分布表,求P25和P75,.,P25=6+(6/46)(14525%17)=8.51(小时)P75=18+(6/32)(14575%101)=19.45(小时),.,练习题,1.适用于对称分布或近似对称分布的资料的平均数为A.算数均数B.几何均数C.中位数D.百分位数答案:A,.,描述正态分布资料集中趋势的指标是()A.中位数B.几何均数C.算术平均数D.标准差答案:C(全国2011年4月高等教育自学考试预防医学(二)试题),.,2.描述一组偏态分布资料的平均水平,下列哪个指标较好A算术均数B几何均数C百分位数D中位数答案:D,.,3.计算某抗体滴度的平均水平,一般宜选择A算术均数B几何均数C中位数D百分位数答案:B,.,描述呈倍数关系的数值变量的指标是A算术均数B几何均数C中位数D百分位数答案:B,.,三、离散趋势指标(掌握),.,.,.,离散趋势指标(掌握),三组同龄男孩体重(kg)如下:,甲组9095100105110均数=100(cm)乙组9698100102104均数=100(cm)丙组9699100101104均数=100(kg),平均水平指标仅描述一组数据的集中趋势,可作为总体均数的一个估计值。由于变异的客观存在,需要一类指标描述资料的离散趋势。,常用指标:全距,四分位数间距,方差,标准差,变异系数,.,科学出版社卫生职业教育出版分社,极差(又称全距),.,R甲=11090=20(cm)R乙=10496=8(cm)R丙=10496=8(cm),甲组9095100105110均数=100(cm)乙组9698100102104均数=100(cm)丙组9699100101104均数=100(kg),.,缺点:只用到最大、最小值,样本信息没能充分利用,不能反映所有数据的变异程度。受样本含量影响较大,样本例数越多,R可能越大,2组观察值例数悬殊时不用R比较。样本含量不变时,每次抽样得到的极差值相差较大,R稳定性较差。,优点:表示变异范围,简单明了;各种分布类型的资料均可用。,.,练习题,关于极差的描述错误的是A.极差值大,离散度就大B.极差可以反映所有数据的变异大小C.极差受样本含量的影响较大D.极差只能粗略的说明变量值的变动范围答案:B,.,四分位数间距,四分位数间距,用Q表示:Q=,四分位数间距越大,说明变异度越大;反之,说明变异度越小。,.,方差,方差也称均方差,反映一组数据的平均离散水平。,方差愈小,说明变量值的变异程度愈小;方差愈大,说明变异程度愈大。,.,样本方差用表示,.,标准差,.,公式:样本标准差用表示公式:,.,.,标准差的公式还可以写成:利用频数表计算标准差的公式为,.,测定了5名健康人第一小时末红细胞沉降率,分别是6、3、2、9、10mm,求标准差。,.,例,某年某市120名12岁健康男孩身高(cm)资料如下表,求其标准差。,.,142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9,.,.,.,练习题,描述离散趋势的指标是A.标准差B.中位数C.几何均数D.算术均数答案:A(全国2014年4月高等教育自学考试预防医学(二)试题),.,关于样本标准差的描述正确的是A.样本标准差就是总体标准差B.样本方差是样本标准差的正平方根C.标准差有量纲,其量纲与原变量值相同D.标准差可能为负值答案:C,.,均数和标准差的关系是A均数愈大,s愈大B均数愈大,s愈小Cs愈大,均数对各变量值的代表性愈好Ds愈小,均数对各变量值的代表性愈好答案:D,.,各观察值均加(或减)同一个不等于零的数后A均数不变,标准差改变B均数改变,标准差不变C两者均不变D均数不变,标准差不一定改变答案:B,.,变异系数,变异系数(,coefficientofvariation,)记为,CV,,,多用于观察指标单位不,同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿,童,身高与成人身高变异程度的比较。,.,例,某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。试比较身高与体重的变异程度。,.,.,例,某地130名10岁女生体重均数为26.96kg,标准差为3.9kg;150名17岁女生体重均数为49.18kg,标准差为5.3kg,试比较两个年龄别女生体重的离散程度。,.,.,练习题,关于变异系数下列描述错误的是A.变异系数可以反映变量值的绝对值离散程度B.变异系数是无量纲单位C.变异系数可以用来比较不同单位指标间的变异度D.变异系数消除了均数的大小对标准差的影响答案:A,.,比较血压和脉搏两组数据变异度大小宜采用A变异系数B方差C极差D标准差答案:A,.,设同一组7岁男童身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准差是3kg,则比较二者变异程度的结论为A身高的变异程度小于体重的变异程度B身高的变异程度等于体重的变异程度C身高的变异程度大于体重的变异程度D单位不同,无法比较答案:A,.,正态分布,正态分布(normaldistribution)又称高斯分布(Gaussiandistribution),是一种重要的连续型分布,应用甚广,是许多统计方法的理论基础。,.,正态分布曲线,.,正态分布的特征,.,.,(4)正态曲线下的面积分布有一定的规律。,1范围内的面积占68.27。,1.96范围内的面积占95.00。,2.58范围内的面积占99.00。,.,标准正态分布,.,练习题,正态曲线的位置参数是指A.均数B.标准正态变量uC.标准差D.样本标准差s答案:A,.,正态分布N(,2),当恒定时,越大,则A曲线沿横轴越向右移动B曲线沿横轴越向左移动C曲线形状和位置都不变D观察值变异程度越大,曲线越“胖”答案:D,.,对于均数为标准差为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年环保产业园循环经济模式下的绿色建筑与城市可持续发展策略报告
- 2025年水性涂料生产项目环保型产品环保法规遵守策略研究报告
- 2025届山东省泰安宁阳县联考英语七年级第二学期期中达标检测试题含答案
- 2025年制造业智能化转型:工业物联网平台在智能工厂中的集成与优化
- 家庭教育指导行业2025年市场前景与竞争格局分析报告001
- 2025年医药企业研发外包(CRO)模式药物研发药物研发知识产权保护与运营报告
- 跨境电商零售进口市场规模增长与跨境电商平台用户行为分析报告
- 保险客服培训题目及答案
- 宝宝安抚哄睡题库及答案
- 安全质量试题及答案
- 2025年新疆维吾尔自治区中考历史真题(解析版)
- 空压机考试题及答案
- 荆州中学2024-2025学年高二下学期6月月考历史试卷
- 2025-2030年中国婚庆产业行业市场现状供需分析及投资评估规划分析研究报告
- 2024-2025学年苏教版四年级下学期期末测试数学试卷(含答案)
- 2025年新高考2卷(新课标Ⅱ卷)英语试卷
- 2025年中考化学必考要点知识归纳
- 三年级语文下册全册重点知识点归纳
- 公路养护材料管理制度
- 2024年湖北省初中学业水平考试地理试卷含答案
- 2024年认证行业法律法规及认证基础知识 CCAA年度确认 试题与答案
评论
0/150
提交评论