数值变量资料的统计分析之统计描述专家讲座_第1页
数值变量资料的统计分析之统计描述专家讲座_第2页
数值变量资料的统计分析之统计描述专家讲座_第3页
数值变量资料的统计分析之统计描述专家讲座_第4页
数值变量资料的统计分析之统计描述专家讲座_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习目标和要求掌握:1.集中趋势指标计算与应用意义2.离散趋势指标计算与应用意义3.数值变量资料t检验★熟悉:1.总体均数区间预计2.假设检验意义和步骤了解:数值变量资料统计描述中频数表制作数值变量资料的统计分析之统计描述专家讲座第1页第一节数值变量资料统计描述一、编制频数表(了解)120名12岁男孩身高(cm)资料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9①132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9②154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9数值变量资料的统计分析之统计描述专家讲座第2页1.计算全距(极差)R=最大值-最小值2.确定组距①确定组段数:8~15组②确定组距:组距i

=全距/组段数

3.划分组段4.统计频数数值变量资料的统计分析之统计描述专家讲座第3页组段划记频数f(1)(2)(3)125~一1129~止4133~正止9137~正正正正正下28141~正正正正正正正35145~正正正正正丁27149~正正一11153~止4157~161—1累计=120120名12岁男孩身高(cm)资料频数分布数值变量资料的统计分析之统计描述专家讲座第4页二、集中趋势指标(掌握)数值变量资料集中趋势指标用平均数来描述。惯用平均数有算数均数、几何均数、中位数数值变量资料的统计分析之统计描述专家讲座第5页(一)算数均数将各观察值相加后除以观察值个数所得商即为算术均数。1、定义总体均数用希腊字母表示样本均数用表示数值变量资料的统计分析之统计描述专家讲座第6页2.应用条件适合用于呈对称分布或近似对称分布资料。数值变量资料的统计分析之统计描述专家讲座第7页3.计算方法

⑴直接法:变量值个数不多

公式为数值变量资料的统计分析之统计描述专家讲座第8页⑵加权法:n≥100

公式为数值变量资料的统计分析之统计描述专家讲座第9页例

某年某市120名12岁健康男孩身高(cm)资料以下表,求其平均数。数值变量资料的统计分析之统计描述专家讲座第10页142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9①132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9②154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9120名12岁男孩身高(cm)资料数值变量资料的统计分析之统计描述专家讲座第11页组段划记频数f(1)(2)(3)125~一1129~止4133~正止9137~正正正正正下28141~正正正正正正正35145~正正正正正丁27149~正正一11153~止4157~161—1累计=120120名12岁男孩身高(cm)资料频数分布数值变量资料的统计分析之统计描述专家讲座第12页

组段组中值x频数ffx(1)(2)(3)(4)=(2)×(3)125~1271127129~1314524133139283892141~143355005145~147273969149~151111661153~1554620157~1611591159累计---=120=17172

120名12岁健康男孩身高(cm)均数加权法计算数值变量资料的统计分析之统计描述专家讲座第13页数值变量资料的统计分析之统计描述专家讲座第14页(二)几何均数1.定义将n个变量值乘积开n次方所得根即为几何均数。

符号用G表示数值变量资料的统计分析之统计描述专家讲座第15页2.适用条件:

数值变量呈倍数关系或呈对数正态分布,如抗体效价、抗体滴定度、疾病潜伏期数值变量资料的统计分析之统计描述专家讲座第16页3.计算数值变量资料的统计分析之统计描述专家讲座第17页例5人血清滴度分别为1:2、1:4、1:8、1:16、1:32,求平均滴度。数值变量资料的统计分析之统计描述专家讲座第18页数值变量资料的统计分析之统计描述专家讲座第19页⑵加权法:变量值个数较多或变量值为频数表资料

二、几何均数(几何平均数)数值变量资料的统计分析之统计描述专家讲座第20页例2-4某年某市100名儿童接种某种疫苗后,测定抗体滴度资料如第(1)、(2)列所表示,求该疫苗抗体平均滴度。数值变量资料的统计分析之统计描述专家讲座第21页数值变量资料的统计分析之统计描述专家讲座第22页数值变量资料的统计分析之统计描述专家讲座第23页(三)中位数和百分位数中位数1.定义将一组变量值按大小次序排列,位次居中变量值即为中位数。符号用M表示数值变量资料的统计分析之统计描述专家讲座第24页2.适用条件变量值中出现特小或特大数值资料分布呈显著偏态变量值分布一端或两端无确定数值,只有小于或大于某个数值资料分布类型不清数值变量资料的统计分析之统计描述专家讲座第25页3.计算方法⑴直接法当变量值个数为奇数时计算公式为M=

数值变量资料的统计分析之统计描述专家讲座第26页当变量值个数为偶数时计算公式为

数值变量资料的统计分析之统计描述专家讲座第27页例某地11例某传染病患者,其潜伏期(天)分别为2,2,4,3,5,6,3,8,9,11,15,求其平均潜伏期。数值变量资料的统计分析之统计描述专家讲座第28页数值变量资料的统计分析之统计描述专家讲座第29页例如上例资料在第21天又发生1例该传染病患者,其平均潜伏期又为多少?先将变量值按从小到大次序排列:2,2,3,3,4,5,6,8,9,11,15,21。数值变量资料的统计分析之统计描述专家讲座第30页数值变量资料的统计分析之统计描述专家讲座第31页

编制频数表计算步骤4计算步骤3计算步骤2计算步骤1⑵频数表法编制中位数计算表确定中位数所在组段计算中位数数值变量资料的统计分析之统计描述专家讲座第32页计算公式

数值变量资料的统计分析之统计描述专家讲座第33页例现有145例食物中毒病人,其潜伏期分布以下表第(1)(2)栏,求中位数。数值变量资料的统计分析之统计描述专家讲座第34页潜伏期(小时)频数f累计频数累计频率(%)(1)(2)(3)(4)0~171711.76~466343.412~3810169.618~3213391.724~613995.930~013995.936~414398.642~2145100.0累计145————145例食物中毒病人潜伏期分布表

数值变量资料的统计分析之统计描述专家讲座第35页可确定中位数所在组段是12~,故L=12,i=6,fm=38,n=145,=63。代入公式,得

M=12+(6/38)×(145×50%-63)=13.5(小时)数值变量资料的统计分析之统计描述专家讲座第36页百分位数1.定义指将n个观察值从小到大依次排列,再把它分成100等份,对应于x%位数值即为第x百分位数。中位数是第50百分位数,用P50表示。第25,第75,第95百分位数记为P25,P75P95是统计学上惯用指标。数值变量资料的统计分析之统计描述专家讲座第37页PX

X%(100-X)%数值变量资料的统计分析之统计描述专家讲座第38页2.计算方法L:Px所在组段下限i:组距n:总例数f:Px所在组段频数fL:小于L各组段累计频数数值变量资料的统计分析之统计描述专家讲座第39页潜伏期(小时)频数f累计频数累计频率(%)(1)(2)(3)(4)0~171711.76~466343.412~3810169.618~3213391.724~613995.930~013995.936~414398.642~2145100.0累计145————145例食物中毒病人潜伏期分布表

求P25和P75数值变量资料的统计分析之统计描述专家讲座第40页P25=6+(6/46)(145×25%-17)=8.51(小时)P75=18+(6/32)(145×75%-101)=19.45(小时)数值变量资料的统计分析之统计描述专家讲座第41页练习题1.适合用于对称分布或近似对称分布资料平均数为A.算数均数B.几何均数C.中位数D.百分位数答案:A数值变量资料的统计分析之统计描述专家讲座第42页描述正态分布资料集中趋势指标是()A.中位数B.几何均数C.算术平均数D.标准差答案:C(全国年4月高等教育自学考试预防医学(二)试题)数值变量资料的统计分析之统计描述专家讲座第43页2.描述一组偏态分布资料平均水平,以下哪个指标很好A.算术均数B.几何均数C.百分位数D.中位数答案:D数值变量资料的统计分析之统计描述专家讲座第44页3.计算某抗体滴度平均水平,普通宜选择A.算术均数B.几何均数C.中位数D.百分位数答案:B数值变量资料的统计分析之统计描述专家讲座第45页描述呈倍数关系数值变量指标是A.算术均数B.几何均数C.中位数D.百分位数

答案:B数值变量资料的统计分析之统计描述专家讲座第46页三、离散趋势指标(掌握)数值变量资料的统计分析之统计描述专家讲座第47页数值变量资料的统计分析之统计描述专家讲座第48页数值变量资料的统计分析之统计描述专家讲座第49页离散趋势指标(掌握)三组同龄男孩体重(kg)以下:

甲组9095100105110均数=100(cm)乙组9698100102104均数=100(cm)丙组9699100101104均数=100(kg)平均水平指标仅描述一组数据集中趋势,可作为总体均数一个预计值。因为变异客观存在,需要一类指标描述资料离散趋势。惯用指标:全距,四分位数间距,方差,标准差,变异系数数值变量资料的统计分析之统计描述专家讲座第50页科学出版社卫生职业教育出版分社概念是一组变量值中最大值与最小值之差,反应一组变量值变异范围。

符号以符号R表示

公式R=最大值-最小值极差(又称全距)

数值变量资料的统计分析之统计描述专家讲座第51页R甲=110-90=20(cm

)R乙=104-96=8(cm)R丙=104-96=8(cm)

甲组9095100105110均数=100(cm)乙组9698100102104均数=100(cm)丙组9699100101104均数=100(kg)数值变量资料的统计分析之统计描述专家讲座第52页缺点:①只用到最大、最小值,样本信息没能充分利用,不能反应全部数据变异程度。②受样本含量影响较大,样本例数越多,R可能越大,2组观察值例数悬殊时不用R比较。③样本含量不变时,每次抽样得到极差值相差较大,R稳定性较差。优点:①表示变异范围,简单明了;②各种分布类型资料均可用。数值变量资料的统计分析之统计描述专家讲座第53页练习题关于极差描述错误是A.极差值大,离散度就大B.极差能够反应全部数据变异大小C.极差受样本含量影响较大D.极差只能粗略说明变量值变动范围答案:B数值变量资料的统计分析之统计描述专家讲座第54页四分位数间距

四分位数间距,用Q表示:Q=四分位数间距越大,说明变异度越大;反之,说明变异度越小。数值变量资料的统计分析之统计描述专家讲座第55页方差方差也称均方差,反应一组数据平均离散水平。

方差愈小,说明变量值变异程度愈小;方差愈大,说明变异程度愈大。数值变量资料的统计分析之统计描述专家讲座第56页样本方差用表示数值变量资料的统计分析之统计描述专家讲座第57页概念把方差开平方,恢复了原来单位,这就是标准差。优点因为克服了方差不足因而最惯用。符号s表示样本标准差,σ表示总体标准差。标准差

数值变量资料的统计分析之统计描述专家讲座第58页

公式:样本标准差用表示

公式:数值变量资料的统计分析之统计描述专家讲座第59页说明变量值变异程度。2.标准差意义标准差愈小,说明变量值变异程度愈小;标准差愈大,说明变异程度愈大。数值变量资料的统计分析之统计描述专家讲座第60页

标准差公式还能够写成:利用频数表计算标准差公式为数值变量资料的统计分析之统计描述专家讲座第61页测定了5名健康人第一小时末红细胞沉降率,分别是6、3、2、9、10mm,求标准差。数值变量资料的统计分析之统计描述专家讲座第62页例

某年某市120名12岁健康男孩身高(cm)资料以下表,求其标准差。数值变量资料的统计分析之统计描述专家讲座第63页142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9①132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9②154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9数值变量资料的统计分析之统计描述专家讲座第64页数值变量资料的统计分析之统计描述专家讲座第65页数值变量资料的统计分析之统计描述专家讲座第66页练习题描述离散趋势指标是

A.标准差

B.中位数

C.几何均数

D.算术均数答案:A(全国年4月高等教育自学考试预防医学(二)试题)数值变量资料的统计分析之统计描述专家讲座第67页关于样本标准差描述正确是A.样本标准差就是总体标准差B.样本方差是样本标准差正平方根C.标准差有量纲,其量纲与原变量值相同D.标准差可能为负值答案:C数值变量资料的统计分析之统计描述专家讲座第68页均数和标准差关系是A.均数愈大,s愈大B.均数愈大,s愈小C.s愈大,均数对各变量值代表性愈好D.s愈小,均数对各变量值代表性愈好答案:D数值变量资料的统计分析之统计描述专家讲座第69页各观察值均加(或减)同一个不等于零数后A.均数不变,标准差改变B.均数改变,标准差不变C.二者均不变D.均数不变,标准差不一定改变答案:B数值变量资料的统计分析之统计描述专家讲座第70页

变异系数变异系数(coefficientofvariation)记为CV,多用于观察指标单位不同时,如身高与体重变异程度比较;或均数相差较大时,如儿童身高与成人身高变异程度比较。

数值变量资料的统计分析之统计描述专家讲座第71页例某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重均数为53.72kg,标准差为4.96kg。试比较身高与体重变异程度。

数值变量资料的统计分析之统计描述专家讲座第72页数值变量资料的统计分析之统计描述专家讲座第73页例某地130名10岁女生体重均数为26.96kg,标准差为3.9kg;150名17岁女生体重均数为49.18kg,标准差为5.3kg,试比较两个年纪别女生体重离散程度。

数值变量资料的统计分析之统计描述专家讲座第74页数值变量资料的统计分析之统计描述专家讲座第75页练习题关于变异系数以下描述错误是A.变异系数能够反应变量值绝对值离散程度B.变异系数是无量纲单位C.变异系数能够用来比较不一样单位指标间变异度D.变异系数消除了均数大小对标准差影响答案:A数值变量资料的统计分析之统计描述专家讲座第76页比较血压和脉搏两组数据变异度大小宜采取A.变异系数B.方差C.极差D.标准差答案:A数值变量资料的统计分析之统计描述专家讲座第77页设同一组7岁男童身高均数是110cm,标准差是5cm,体重均数是25kg,标准差是3kg,则比较二者变异程度结论为A.身高变异程度小于体重变异程度B.身高变异程度等于体重变异程度C.身高变异程度大于体重变异程度D.单位不一样,无法比较答案:A数值变量资料的统计分析之统计描述专家讲座第78页正态分布正态分布(normaldistribution)又称高斯分布(Gaussiandistribution),是一个主要连续型分布,应用甚广,是许多统计方法理论基础。数值变量资料的统计分析之统计描述专家讲座第79页

正态分布曲线数值变量资料的统计分析之统计描述专家讲座第80页正态分布特征

数值变量资料的统计分析之统计描述专家讲座第81页数值变量资料的统计分析之统计描述专家讲座第82页(4)正态曲线下面积分布有一定规律。①μ±1σ范围内面积占68.27%。②μ±1.96σ范围内面积占95.00%。③μ±2.58σ范围内面积占99.00%。数值变量资料的统计分析之统计描述专家讲座第83页标准正态分布数值变量资料的统计分析之统计描述专家讲座第84页练习题正态曲线位置参数是指A.均数μB.标准正态变量uC.标准差σD.样本标准差s答案:A数值变量资

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论