




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计描述,作为医学统计学的重要组成部分之一,是进行统计推断的基础。它是在收集、整理数据的基础上,通过相应的统计量以及统计图和统计表来描述资料某些牲的统计方法。一般说来,进行统计描述应遵循这样的原则:根据分析目的和资料类型选择恰当的统计量以及统计图和统计表来描述资料的统计特征。,统计描述,1,一、计量资料的统计描述1.频数分布表为了解数据的分布范围、集中位置、分布形态等特征,需要编制频数表。,1)频数分布表的编制例1:某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表。,2,81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果,3,步骤:,求全距R=max-min=278.8-97.5=181.3,定组数K通常取815组为宜。本例取K10.,求组距IR/K(注意取整)。本例I181.3/10=18.1320,制表确定各组段的下限、统计各组段内的频数、算出各组段的频率、累计频数、累计频率,将所得数据填入表中。,4,81例健康男子血清总胆固醇值(mg/dl)的频数分布表,5,利用频数分布表,还可绘制出相应的频数分布直方图.频数分布图以横轴表示被观察现象,纵轴表示频数或频率,以各矩形(宽度为组距)的面积代表各组段的频数或频率。,81名健康男子血清总胆固醇值的频数分布图,由图可见,该资料的频数分布呈基本对称分布。,6,2)频数分布表的作用描述数据分布特征:数据的分布范围集中位置分布形态等计算有关指标发现奇异值。,7,2.集中趋势反映集中趋势和集中位置的指标,亦称平均数。1)算术均数适用于分布比较对称的资料。定义式:,加权式:,例:由例1的数据:,8,9,2)几何均数适用于变量值呈倍数关系的资料。,10,例27名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。,或,即7名慢性迁延性肝炎患者HBsAg滴度的几何均数为164。,11,例352例慢性肝炎患者的HBsAg滴度数据如下表。试计算滴度的几何均数。,故知,52例慢性肝炎患者的HBsAg滴度的几何均数约为1119.75。,12,3)中位数先介绍分位数的概念。分位数:分位数是一个界值或者分割值,一种位置指标。将一组数据按从小到大的顺序排列为:x1(最小值),x2,xn(最大值)分位数X*是介于x1(最小值)与xn(最大值)之间的一个数值,它使得n个数据中的一部分观察值小于或等于它,另一部分观察值大于或等于它。,X*,x1,xn,13,如果将顺序排列的一组数据分为q个相等频数的区间(即每个区间中有相同的数据个数),这时共有q-1个分位点,则称这些分位点为q分位数。,常用的分位数有中位数(二分位数)、四分位数、百分位数等。,中位数(二分位数):上述分位数的定义中,令q=2,即取一个分位点X*,使得n个数据中有二分之一的数据小于或等于X*,则称X*为中位数,记为X*=M。显然,这样定义的中位数可由下式算得:,14,此时M为位置居中的那个数,此时M为位置居中的两个数的平均值,中位数有以下特点:对离群值不敏感。故当有离群值或数据分布不对称时,可采用中位数来描述集中趋势。当数据分布对称时,均数和中位数很接近。,15,例4某厂发生食物中毒,9名患者潜伏期(小时)分别为:16、2、6、3、30、2、l0、2、24,试求其中位数。先将数据由小到大排列为:2、2、2、3、6、10、16、24、30由于n=9为奇数,故有,16,四分位数:在分位数的定义中,令q=4,即q-1=3,即取三个分位点Q1、Q2、Q3,使得n个数据中有四分之一的数据小于或等于Q1,则称Q1为下四分位数,Q3为上四分位数,而Q2即为中位数M。,下四分位数Q1,上四分位数Q3,中位数Q2M,百分位数:在分位数的定义中,令q=100,即q-1=99,即取99个分位点P1,P2,.,P99,使得n个数据中有1%的数据小于或等于P1,则称P1为1%位数,.。一般地,称Px为x%位数,17,对于频数表资料,百分位数的计算公式如下:,式中:L是Xp%所在组段的下限,i是该组段的组距,fp是该组段的频数,n是总频数,fL是该组段以前的累计频数。,显然,中位数即为50%位数,下四分位数即为25%位数,上四分位数即为75%位数。,18,例5某地130名健康成年男性血清肌红蛋白数据列于下表,试求其P25、P75以及中位数。,19,先寻找欲求的百分位数分别落在哪些组,由累计频率列可见,P25位于“20”这个组段,P75位于“30”组段,而中位数,即位于“25”组段。将相应数据分别代入百分位数计算公式,20,2.离散趋势:反映数据分布的离散程度先看一个例子:现有甲乙两名射击运动员,其训练成绩如下:甲:589104乙:77877现需派出一人去参加比赛。已知总成绩达到36环即可确保第二名。作为教练,你应该选谁去参赛?,21,为了比较全面地把握资料的分布特征,不仅需要了解数据的集中位置,而且需要了解数据的离散程度。常用的描述离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。1)全距:RMAXMIN2)四分位数间距:上下四分位数之差QQ3Q1称为四分位数间距。,22,3).方差,4).标准差,5).变异系数,23,例6测得8名大一女生的身高(cm)分别为162、158、157、149、155、170、167、162。试求其算术均数、标准差。,24,身高,体重,例7抽样调查某地大二女生的身高和体重,得知其身高均数为165cm,标准差为3cm;体重均数为45kg,标准差为3kg。试比较该地大二女生身高与体重的变异程度。虽然已知身高和体重的标准差数值均为3,但其单位不一致,导致直接不可比。故选择变异系数。身高和体重的变异系数分别为,25,几个离散指标的比较全距简单易求,但所用的信息较少,对离群值较敏感,与样本含量n有关,n越大,全距可能越大。,四分位数间距简单易求,对离群值的敏感度小于全距,受样本含量影响较小。但使用的信息量仍然较少。,方差使用了全部信息量,特别是利用了数据集中位置的信息,优于全距和分位数间距。但方差作了一个平方处理,夸大了各数据点与集中位置的离散程度。,26,标准差是方差的平方根,它将方差夸大了的离散程度作了还原,且具有方差的全部优点,因此标准差在实际应用中最为常用。,变异系数用来度量相对变异程度,是一个无量纲的指标,可以用来比较不同量纲变量之间的变异程度,也可以用来比较量纲相同但均数相差较大的变量之间的变异程度。,27,3.定量资料统计描述常用指标的意义及适用场合,28,注意:数据变化对集中趋势和离散程度度量指标的影响,29,比较X1和X2两个变量的度量指标可看出:1).一个变量加上一个常数后,新变量的均数等于原变量的均数加上这个常数,方差和标准差均不变,变异系数变小。2).一个变量乘以一个常数后,新变量的均数等于原变量的均数乘以这个常数,方差等于原变量的方差乘以这个常数的平方,标准差等于原变量的标准差乘以这个常数,变异系数不变。,30,案例某市1974年留驻该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞值(mol/kg)检测结果如下表的第1和3列所示。试对该市居民发汞水平进行统计描述。,31,某市1974年238人的发汞检测结果,32,为描述该市居民发汞水平的集中趋势和离散趋势,某研究者采用算术均数和标准差两个统计指标。算术均数为(mol/kg)标准差为(mol/kg)你认为这样统计描述合理吗?为什么?,33,4.描述分布形态的统计指标本例资料的频数分布直方图,34,显然,该地居民发汞含量的频率分布是不对称的。这类分布称为偏峰分布。从图中可以看到,频率最大的组段处于左侧第二的位置,而不是居中。绝大多数变量值集中在左侧四个组段。越往右侧的组段,频率越小。一般称这种峰向左侧偏移的分布为正偏峰分布。而峰向右侧偏移的分布称为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 33208-2025设备结构健康监测基于叶尖定时原理的透平叶片振动在线监测方法
- 软件技术专业教学标准(高等职业教育专科)2025修订
- 2025年中国紧急救援和其他救助服务行业市场全景分析及前景机遇研判报告
- 2025年中国建筑护板行业市场全景分析及前景机遇研判报告
- 2025年中国咖啡器具行业市场发展监测及投资前景展望报告
- 癌症患者情绪疏导
- 防爆培训课件
- 中国维生素B12行业市场调查研究及投资规划建议报告
- 2020-2025年中国摩托车铝轮行业市场调研分析及投资前景预测报告
- 2024年中国四氯吡啶行业市场调查报告
- 电子政务内网机房运维管理制度
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案
- 福利院财务管理制度
- 学习通《科研诚信与学术规范》课后及考试答案
- 2023-2024学年内蒙古自治区锡林浩特市小学语文五年级期末自我评估试题
- GB/T 24025-2009环境标志和声明Ⅲ型环境声明原则和程序
- 《半导体及二极管》教学课件
- 病房床头卡模板
- 2022年西双版纳傣族自治州景洪教师进城考试笔试题库及答案解析
- 公路改建工程边施工边通车安全专项施工方案
- 道路交通安全法律法规知识测试题
评论
0/150
提交评论