已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章定量资料的统计描述,1,本章的内容和重点,第一节频数分布第二节集中趋势的描述第三节离散趋势的描述第四节描述分布形态的统计指标,重点:掌握概念、方法的用途和适用条件熟悉统计符号和公式,2,教学目的与要求,掌握:描述定量资料的集中趋势的指标算术均数、几何均数、中位数的计算方法和适用条件,描述定量资料的离散趋势的指标极差、四分位数间距、方差、标准差和变异系数的计算方法和适用条件。熟悉:连续型变量频数表的编制,频数分布类型,百分位数法的概念及计算。了解:离散型定量变量的频数分布,3,单变量计量资料的统计分析,4,定量资料的统计描述,统计表频数分布表统计图频数分布图统计指标集中趋势:均数、几何均数、中位数离散趋势:极差、四分位间距、方差、标准差、变异系数,5,表1100例高血压患者治疗后临床记录,编号年龄性别治疗组舒张压体温疗效X1X2X3X4X5X6137男A11.2737.5显效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8无效10054男B16.8037.6无效,6,频数与频数分布,频数与频数分布频数:某个测量值的个(例)数。频数分布表(frequencydistributiontable):又称频数表,是将原始数据值适当分组后得到各组的频数,如表2-1频数分布表。适用于样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件(如SAS、SPSS等)方便制作频数表。,7,频数与频数分布,离散型定量变量的频数分布例2-11998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7等共96个数值,8,频数与频数分布,表2-1:96名妇女产前检查次数分布的频数分布表,9,频数与频数分布,图2-1,10,频数与频数分布,连续型定量变量的频数分布频数分布表的编制步骤1.求极差2.确定组段数、组距3.从小到大列出组段4.清点各组段包含的观察单位数(频数)5.整理成频数分布表,11,频数与频数分布,连续型定量变量的频数分布例2-2抽样调查某市1997年12岁男童120人的身高(cm)资料如下。将数据适当分组,计数每组的频数,根据这些数据编制成的频数分布表(表2-2)则能显示出这组数据分布的特点。,12,频数与频数分布,某市1997年12岁男童120人的身高(cm)资料如下。142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9,13,频数与频数分布,手工编制表2-2步骤:(1)计算全距(range,R),也称为极差R=最大值最小值=160.9125.935(cm)(2)确定组段数与组距:组距=上限下限=R/(预计的组段数)i=R/K(极差/组数)本例如果预计取10个组段,则组距长度约为35/10=3.5,取整数4。两端的组段应分别包含最小值或最大值;(3)列表做出如表2-2的表格,将选好的组段顺序地列在(1)列。按照“下限x上限”的原则确定每一例数据x应归属的组段。,14,组段频数频率12410.008312820.0167132100.0833136220.1834140370.3083144260.2167148150.125015240.033315620.016716010.0083合计1201.0000,15,频数与频数分布,图某市120名12岁男童身高的频数分布,16,频数分布的类型typesoffrequencydistribution,对称分布symmetricdistribution偏态分布skewnessdistribution,频数表与频数分布,17,对称分布,频数表与频数分布,18,偏态分布,正偏态(positiveskew),负偏态(negativeskew),频数表与频数分布,19,非对称分布称为skewness;俗称偏态分布,有人称偏峰分布。“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;,频数表与频数分布,20,分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。”,频数表与频数分布,21,人数,大多数居民发汞含量在115mol/kg之间,少数人的发汞大于15mol/kg,分布呈正偏态。,发汞含量(mol/kg),(a)239人发汞含量的频数分布,22,23,(b)102名黑色素瘤患者的生存时间频数分布,人数,生存时间(月),患者生存时间大部份在30个月内,少数达45个月,分布呈极度偏态,又称L型分布。,24,图某地19901992年男性死亡年龄分布,25,频数分布表和频数分布图的用途,描述分布类型描述分布的特征集中趋势反映资料的平均水平离散趋势反映资料的变异程度便于发现特大、特小的可疑值便于计算有关指标、统计分析与处理,26,编制频数表的步骤,编制频数表步骤流程图,27,频数分布特征,图某市120名12岁男童身高的频数分布,28,第二节集中趋势统计指标平均数:描述一组变量值集中位置的特征值,用来说明某种现象或事物数量的平均水平,算术均数几何均数中位数众数调和均数,29,适用条件:适用于正态分布或近似正态分布的资料(对称分布)1)直接计算法:计算公式为式中X1,X2和Xn为所有观察值,n为样本含量,(希腊字母,读作sigma)为求和的符号。,一、算术均数:简称均数,用表示(样本均数),30,定量变量的特征数,2)加权频数表法:计算公式为,31,120例17岁男生的身高频数分布,32,均数的应用:,最适于对称分布资料,特别是正态分布资料;对于偏态资料,均数不能较好地反映其集中趋势。,我也知道了!,33,定量变量的特征数,二、几何均数(geometricmean,G)适用条件:适用于对数正态分布或近似正态分布,以及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。在医学研究中常适用于免疫学的指标。其计算公式为,34,定量变量的特征数,例2-57名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,35,定量变量的特征数,加权法计算几何均数例2-652例慢性肝炎患者的HBsAg滴度数据如表2-4。试计算滴度的几何均数。,36,定量变量的特征数,37,定量变量的特征数,52例慢性肝炎患者的HBsAg滴度的几何均数为1119.74705。,38,39,几何均数的应用:,1.等比资料,如抗体平均滴度,2.对数正态分布资料,Remember!,40,使用几何均数时的注意点:,1)观察值不能有0。,2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。,Becareful!,41,定量变量的特征数,三、中位数(median,M)适用条件:可用于各种分布的定量资料。尤其用于偏态分布资料、一端或两端无确定数据资料和分布不明的资料。M:将全部观察值从小到大排序,位于中间位置的观察值,42,如今有6名工人接触某有害物质后,引起中毒的潜伏期分别是:1天,3天,5天,4天,8天,7天。该6位工人的平均潜伏期是多少天?,43,中位数例,9例正常人的发汞值:1.11.83.54.24.85.65.97.110.5M=4.8,9例正常人的发汞值:1.1,1.83.54.24.85.65.97.116M=4.8,10例正常人的发汞值:1.11.83.54.24.85.65.97.110.516M=(4.8+5.6)/2=5.2,44,百分位数示意图,(二)百分位数(percentile),45,百分位数法计算中位数:频数表资料(大样本)百分位数的计算公式为式中LX、iX和fX分别为第百分位数所在组段的下限、组距和频数,fL为小于各组段的累计频数,LX为总例数。中位数的计算公式,46,47,48,定量变量的特征数,120例17岁男生的身高频数分布,49,百分位数的应用:,百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考值范围,亦称正常值范围。,50,平均数应用的注意事项,同质的资料计算平均数才有意义根据资料分布的特征选用适当的平均数算术均数:单峰对称分布的资料几何均数:等比资料、滴度资料、正偏态资料中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数(偏态分布、分布不明资料、有不确定值的资料),51,1有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是A.1:40B.1:80C.1:160D.1:3202.一组变量值,其大小分别为10,12,9,7,11,其中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商铺转让2025年合同协议条款
- 人力资源服务合同协议2025规范版
- 临时保安2025年聘用合同协议
- 酒店管理服务协议2025年细则
- 商铺正式网签合同范本
- 地下维修保养合同范本
- 在原合同上续签协议书
- 多人开店合作合同范本
- 国企粮库购销合同范本
- 场地合租协议合同范本
- 孤独症儿童发展评估表使用手册
- DZ∕T 0342-2020 矿坑涌水量预测计算规程(正式版)
- 福建省既有建筑地基基础检测技术规程
- FlowmasterV7中文技术手册
- 变电站电气安全工作规程
- (完整版)冠词练习题及答案
- 《治安管理处罚法》课件
- 法院执行培训课件
- 康复医学科评定量表全集
- 主播试用期合同模板正规范本(通用版)
- 质量控制点的工序质量控制培训课件
评论
0/150
提交评论