


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题四 定量资料的统计描述一、频数表与频数图频数表:表达变量取值及其不同取值频数分布情况的统计表。频数表的编制连续型定量资料的频数表求极差(全距):r=xmax-xmin确定组数和组距:根据样本含量的大小及研究目的确定组数,一般设为815组。用r除以组数得到的商,取与此接近较为整齐的数值作为组距,组距即为各组的上、下限之差。注:各组的组距可以相等,可以不等,一般多采用等距分组。确定组段:即确定每一组的起点和终点(下限与上限)注:第一组段包括全部观察值中的最小值,最末组段包含全部观察值中的最大值;各组段包含的数值范围是大于等于下限,小于上限;频数表中除最末组同时写出下限和上限外,其余各组均只写出下限;归组计数整理成表;离散型定量资料的频数表的编制:将变量值及其对应的频数列出即可。频数表的用途揭示资料的频数分布特征和频数分布类型:分布特征:集中趋势、离散趋势,对于定量资料可从两个方面去描述其分布特征。分布类型:对称分布,即高峰位中,两侧对称。偏态分布,高峰偏于一侧,偏向数值小的一侧,称为正偏态分布;偏向数值大的一侧,为负偏态分布。便于发现某些特大或特小的可疑值;便于进一步计算指标和统计处理。频数图:更直观、形象。以变量值为横坐标,以频数为纵坐标(等距分组时可以频率为纵坐标,不等距分组时以频率/组距=频率密度作为纵坐标),即每个等宽长方形面积表示每组频数(或频率)。注:连续型定量资料,其频数图中各长方形是相连的,又称为直方图;离散型定量资料,其频数图中各长方形是间隔的,又称为直条图。二、集中趋势的描述对于定量资料集中趋势的描述常用平均数,平均数表达了一组同质定量数据的平均水平或集中位置。算术平均数(均数)几何均数(倍数均数)符号(样本),(总体)g计算方法(直接法)(加权法)k为组段数,xk为各组段相应频数。(直接法,用于样本含量较少时)g=lg-1=lg-1(加权法,用于观察值较多,或资料已编成频数表时)g=lg-1=lg-1应用应用于对称分布,特别是正态分布资料集中趋势的描述。对数对称(含对数正态分布),即数据经对数变换后呈对称分布或正态分布的资料。等比级数资料,即观察值之间呈倍数或近似倍数变化的资料,如抗体滴度、抗体效价。说明计算几何均数时,观察值中不能有0,因为0不能取对数,此时可以加上1个很小的数,算后再减去该数值即可。观察值不能同时有正有负。续表中位数百分位数符号mpx计算方法观察个数为奇时,m=x观察个数为偶时,(直接法)m=(频数表法)m=l+l为频数表中m所在组段的下限,i为m所在组段的组距,fm为m所在组段的频数,fl为小于l的各组段累积频数。px=l+其中l为px所在组段下限,i为组距,fx为px所在组段频数,fl为小于l的各组段的累积频数。应用适用于描述偏态分布资料、一端或两端无确切值的资料及总体分布不确定资料的集中趋势用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;用于确定非正态分布资料的医学参考值范围。说明将观察值由小到大排序后,居于中间位置的数值。在全部观察中,小于和大宇中位数的观察值个数相等。px是指将观察值由小到大排序后,将其平均分为100份,对于每一分割位置上的数值即为一个百分数。四分位数:p25(ql)、p50(中位数)、p75(qu);应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数。三、离散趋势的描述离散趋势,反映了观察值之间的变异情况。极差四分位数间距方差符号rq2(总体),s2(样本)计算方法r=q=qu-ql=p75-p252=离均差平方和/n= (x-n)2n s2= (x-)2 (n-1为自由度) n-1应用仅用于初步了解资料的变异程度,概括地描述全部数据所在范围。描述偏态分布以及分布的一端或两端无确切数值资料的离散程度。描述对称分布,特别是正态分布或近似正态分布资料的离散程度。说明r大,反映了全部观察值所在范围的变异程度大,数据较为分散;r小,反映了全部观察值所在范围的变异程度小,数据较为集中;不能反映组内其他观察值的变异程度。不受两端极大值或极小值影响,较全距稳定,但仍不能概括所有观察值的变异情况。相同指标,方差越大,说明数据围绕均属分布越分散,变异程度越大;反之,方差越小,说明数据围绕均属分布越集中,变异程度越小;续表标准差变异系数符号(总体),s(样本)cv计算方法=s=(直接法)s=(加权法)cv=100%应用描述对称分布,特别是正态分布或近似正态分布资料的离散程度。常用于比较度量单位不同或单位相同均数相差悬殊的两组或多组资料的变异程度。说明表示每个观察值与均数之间距离(绝对距离)的平均水平。没有单位,是一种相对变异指标四、正态分布及其应用正态分布的概念 如果连续型随机变量x的概率密度函数为f(x)=,-x;则称随机变量x服从参数为和的正态分布,记作xn(,)。式子中为圆周率,e为自然对数的底,为总体均数,为总体标准差,x为正态变量。正态分布的特征正态曲线:横轴上方均数处最高,向两侧下降,并以均数为中心,左右对称,但两端与横轴永不相交,呈钟型曲线。正态分布有两个参数,即均数和标准差。 为位置均数,固定不变时,越大,曲线沿横轴越向右;反之,越小,曲线沿横轴越向左。 为形状均数,固定不变时,越大,曲线越平阔;越小,曲线越尖峭。正态曲线下面积的分布有一定的规律。 正态曲线下一定区间内的面积代表了取值于相应区间内的观察值个数在全部观察值总数中所占的比例(频率),或者是观察值落在该区间内的概率。无论和取何值,正态曲线下面积分布规律有:正态曲线与横轴之间的面积恒等于1或100%正态分布为对称分布,其对称轴两侧面积各为50%区间(-,+)的面积为68.27%;区间(-1.96,+1.96)的面积为95.00%;区间(-2.58,+2.58)的面积为99。00%;标准正态分布(教材图4-4,正态分布于标准正态分布曲线)由总体时z=,由样本估计时z=若x服从正态分布n(,),则z服从n(0,1)。在区间(-z,+z)内,若求一般正态分布曲线下某区间内面积,则需先进行z变换,然后借助标准正态分布表(教材附表3)求得。正态分布的应用估计正态分布或近似正态分布资料的频数分布 举例:求在某值及其以下者所占比例、求在某范围内者所占比例、求大于等于某值者所占比例。制定医学参考值范围(正常值范围)制定医学参考值范围时:确定一批样本含量足够大的“正常人”;根据研究目的和使用要求选定适当的百分界值,常用95%;根据专业知识确定单侧或双侧界值;根据资料分布特点,选用恰当的计算方法。制定医学参考值范围的常用方法有:正态分布法(适用于正态分布或近似正态分布的资料) 双侧界值:z/2s 单侧上界:+ zs或单侧下界:- zsz和z/2为标准正态分布在给定小概率(如=0.05)时相应的单侧界值或双侧界值。z表示zz或z-z的概率为,只考虑单侧尾部的概率分布。z/2表示zz/2和zz/2的概率为,同时考虑两侧尾部的概率分布。常用z值表参考值范围单侧双侧800.8421.282901
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025布草定制生产与酒店连锁集团采购合同
- 2025版城市配送公司司机招聘与管理合同文本
- 2025年度燃料油代理采购与新型燃烧装置合作开发合同
- 2025版水果新品开发与市场推广合作合同下载
- 2025年拆迁安置房买卖合同合同履行及变更管理合同范本
- 2025年特色园区厂房租赁居间服务协议范本
- 2025版食品行业食品安全认证服务合同范本
- 2025年汽车安全信息共享与应急处理服务合同
- 银行零售业务数字化营销转型中的金融科技人才培养报告
- 2025版企业生日蛋糕卡采购及服务协议模板下载
- 广告创意与用户体验-第3篇-洞察阐释
- 幼儿园一日常规安全培训
- 5G基带芯片算法验证平台:从设计到实现的关键技术与实践
- 税务会计与税收筹划课件
- 2025年高考生物辽宁卷真题解读及复习备考指导(黑龙江吉林内蒙古适用)
- 新媒体视听节目制作
- 数字化教学环境下小学语文板书设计优化策略
- JG/T 237-2008混凝土试模
- JG/T 232-2008卫浴型散热器
- 灭火员初级习题库
- T/CAQP 001-2017汽车零部件质量追溯体系规范
评论
0/150
提交评论