




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学复习,上海交通大学医学院预防医学教研室施榕,复习思考题类型,单项选择题名词解释问答题计算题,第一章医学统计学基本概念1、变量2、总体与样本3、参数与统计量4、抽样误差,数值变量资料的统计描述,集中趋势指标离散趋势指标正态分布及其应用,第二章集中趋势,集中趋势:表示数据的中心位置。集中趋势的指标:常用的有算术均数、几何均数及中位数等。,(一)算术均数mean,算术均数简称均数。用于说明一组观测值的趋中位置或平均水平。均数用于对称分布、正态或近似正态分布的资料。x表示变量X的样本均数,(希腊字母)表示总体均数。常用的计算方法是直接法和加权法。,直接法,当样本含量较小时,可选用此法。有n个观察值,分别为X1,X2,Xn,均数的计算公式为:式中,是求和的符号。,(二)几何均数(geometricmean),几何均数适用于对数正态分布的资料,例如抗体的平均滴度和平均效价。几何均数用G表示。,直接法,直接法:样本含量较小时,选用此法。有n个观察值X1,X2,Xn,几何均数的计算公式为:式中lg为取常用对数的符号,lg-1为反对数。,加权法,加权法:当样本含量较大时,可将资料整理成频数表,用下式计算:,(三)中位数(median),将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数。中位数适用于任何一种分布的计量数据,一般多用于描述偏态分布或数据一端无界资料的集中趋势。中位数用M表示。,频数表法,L为本组(中位数所在组)下限,i为本组组距,f为本组频数,fL为上一组的累计频数。本组位置可根据累计频数的数值来判断。当某一组的累计频数首先超过n/2时或累计频率首先超过50%时,即定为本组。,第三章标准差(standarddeviation),方差的单位是原度量单位(如kg)的平方,把总体方差开平方,这就是总体标准差,度量单位与原始观察值一致,即对于样本资料,样本标准差的计算公式为:可改写为:上式n-1称为自由度。,标准差应用,表示观察值的变异程度计算变异系数结合均数描述频数分布的特征和制定医学参考值范围。计算标准误,变异系数(coefficientofvariation),当单位不同时,均数相差较大时,用标准差就不适宜了,此时用变异系数更好。变异系数用CV表示,其计算公式为:,正态分布的特点,正态分布是一种很重要的连续型分布。正态分布以均数为中心,左右两侧对称,靠近均数两侧的频数较多,而距均数两侧较远处,频数逐渐减少,形成钟形分布。正态曲线下的面积分布有一定的规律。,标准正态分布(standardnormaldistribution),标准正态分布:是均数为0、标准差为1的正态分布,即=0、=1亦称u分布。,医学参考值范围的估计,1正态分布法估计参考值范围公式为:式中为均数,s为标准差。如制定95参考值范围,双侧界值u=1.96,单侧界值u=1.645。双侧界值:x1.96s单侧上界:x+1.645s单侧下界:x-1.645s,2、百分位数法,用于描述偏态分布资料。1)白细胞数的95参考值范围,因为白细胞数无论过高或过低均属异常,则计算P2.5-P97.5,双侧95参考值范围;2)又如确定肺活量的95%参考值范围,因为肺活量以过低为异常,应计算P5;3再如确定尿铅的95%参考值范围,因为尿铅以过高为异常,应计算P95。肺活量、尿铅都是单侧参考值范围,第四章数值变量资料的统计推断,标准误可信区间假设检验的基本步骤t检验假设检验注意事项,抽样误差与假设检验一、均数的抽样误差与标准误,由于在实际抽样研究中往往未知,通常用某一样本标准差s来替代,得标准误的估计值(通常也简称为标准误),其计算公式为:,标准误应用,表示均数抽样误差,样本均数估计总体均数的可靠性。估计总体均数可信区间用于假设检验,总体均数95%的可信区间(未知,样本例数n足够大),可表达为:上式中1.96为双侧85%可信区间的系数。,1.96,例计算12岁健康男孩总体均数的95%可信区间,已知=139.6cm,s=6.85cm。本例虽未知,但n较大,例题:随机抽样调查上海市区男婴出生体重如下:n=129x=3.286s=0.438(1)理论上95%的男婴出生体重在什么范围?(2)估计全市男婴出生体重均数在什么范围?(3)某男婴出生体重为4.51KG,如何评价?,A:x1.96s=3.2861.96*0.438=(2.16,4.42)KGB:C:4.51KG超过了95%的医学参考值范围所以该男婴超重,第五章t检验,t检验(ttest):是计量资料中最常用的假设检验方法,它以t分布为基础。理论上,t检验的应用条件是要求样本来自正态分布总体,两样本比较时,还要求两总体方差相等。实际应用中,只要其分布为单峰且近似对称分布,也可应用。当样本含量较大时,可用u检验。,配对样本检验,配对设计:同一受试对象实验(或治疗)前后的比较;同一样品用两种方法检验结果的比较;配对的两种受试对象分别接受两种处理后的数据比较。,例对10名患者分别用湿式热消化-双硫腙法和硝酸-高锰酸钾冷消化法测定尿铅,问两法测得结果有无差别。,表110名患者的尿样分别用两种方法测定尿铅结果(mol/L),续上表,1.建立假设:H0:d=0,H1:d0,0.05。d为治疗前后差值的总体均数。2.计算统计量t值,先计算差值d及d2(如表8-1),得d=0.58,d22.1182计算差值均数,计算差值的标准差,计算差值的标准误,3.确定值,作出统计推论自由度=n-1=10-1=9,t0.05(9)=2.262,t0.01(9)=3.250,,本例t=0.3810.05,按0.05检验水准,接受H0,拒绝H1,不能认为两法测定尿铅结果有差别。,假设检验的注意事项,(一)严密的抽样设计及资料正态性(二)选用正确的检验方法,且要注意方差齐性,成组比较的t检验,要求两组资料具有方差齐性(三)结论不能绝对化,(四)单侧和双侧检验选用单侧检验的条件是在研究开始之前,表明不会出现0的情况(或不会出现0的情况),才能选用单侧检验。若没有这方面的依据,一般选用双侧检验。,(五)差别有无统计意义与有无专业上的实际意义是两个不同的概念。(六)假设检验和可信区间的关系。,型错误和型错误,(1)型错误是指拒绝了实际上成立的H0,即“弃真”的错误。在H0成立的前提下,由于抽样的偶然性,得到了较大的t值,若tt0.05(),则按0.05水准拒绝H0,则犯了型错误。确定以t为临界值时,犯型错误的概率就是。,(2)型错误是指接受了实际上不成立的H0,即“存伪”的错误。在实际上H1成立的前提下,由于抽样的偶然性得到了较小的t值,若t40且1T40且有1T5,故应用校正公式,步骤如下:,两种疗法的效果比较,1建立假设:H0:1=2H1:120.052计算2,3.确定P值,作统计推论2=2.750.05,差异无统计学意义,按=0.05水准,不拒绝H0,认为两种疗效没有差异。,注意:当n40或出现T1时,校正法也不行,要用精确检验法直接计算概率。,第十一章非参数统计,第十二章直线相关与直线回归,直线相关分析直线回归分析第十三章病例随访资料分析生存率估计生存率的比较,直线相关,当所研究的两个事物或现象之间,既存在着密切的数量关系,又不象函数关系那样,能以一个变量的数值精确地求出另一个变量的数值,我们称这类变量之间的关系为相关关系,简称相关,直线相关的概念,相关系数的意义,相关系数(correlationcoefficient)又称积差相关系数(coefficientofproduct-momentcorrelation),以符号r表示。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标,直线回归,直线回归的概念,在描述肺活量与体重的依存关系中,习惯上将体重作为自变量(independentvariable),用X表示,肺活量为因变量(dependentvariable)用Y表示。称为直线回归(1inearregression),为了区别于一般函数方程,我们将它称为直线回归方程。,简单线性回归模型,Yi=+Xi+i用样本数据建立的有关Y依X变化的线性表达式称为回归方程:其参数估计采用最小二乘法,即残差平方和达到最小值:,根据数学上的最小二乘法(leastsquaremethod)原理(即保证各实测点至直线的纵向距离的平方和最小),可导出a、b的算式如下:,第十二章统计表的制表要求,1、标题概括表达中心内容,简练、确切,必要时注明资料来源、时间,位于表的上方。2、标目有标目和标目,文字简明,注明单位3、线条力求简洁,上面顶线、下面底线,纵标目下面、合计上面横线,不需要竖线与斜线。,4、数字表内数字一律用阿拉伯数字表示同一指标的小数位数一致,位次对齐,暂缺、无数据用“”或“”5、备注用“*”标出,写在表外下面,统计图制图的基本要求,1、根据资料性质和分析目的,正确选用图形。2、要有确切的标题,说明资料内容。标题位于图的下方。3、有纵横坐标的图形,一般以第一象限为准则作图,两轴交点为起点。纵横轴尺度应等距,并须有标目、单位,纵横轴长度比例5:7。条图、直方图的纵坐标必须从“0”开始。4、同一图内比较几种不同事物时,用不同的线条或颜色表示,并附图例说明。,(一)线图,linechart,1、用线段的上升、下降来表示统计指标的变化趋势,或某现象随另一现象变迁的情况,适用于连续性资料。2、横轴表示分组标志,为连续变量如时间;纵轴表示统计指标,如均数、率、频率。,(二)直方图,histogram,1、以面积表示数量,适用于表示连续变量的频数(分布)。2、横轴表示被观察对象,尺度可以不从“0”开始,但组距必须相等。3、直条高度等于该组的频数或频率。,(三)条图,barchart,1、用等宽直条的长短来表示相互独立的各指标数值的大小(1)单式条图:一个分组因素,比较一项指标(2)复式条图:多个分组因素,比较一项指标2、作图时,一般以横
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年福建省宁德市周宁县委政法委招聘3人模拟试卷及参考答案详解
- 2025北京市海淀区育鹰小学招聘5人考前自测高频考点模拟试题附答案详解(完整版)
- 2025年河南省职工医院招聘护理人员60人考前自测高频考点模拟试题附答案详解(突破训练)
- 2025年河北唐山滦州市森林草原消防专业队员招聘7人考前自测高频考点模拟试题带答案详解
- 2025年青岛市崂山区“崂选计划”第二批选聘(37名)模拟试卷带答案详解
- 安全培训教学提纲课件
- 河北省【中职专业高考】2025年中职高考对口升学(理论考试)真题卷【生物与化工大类】模拟练习
- 安全培训救火毯课件
- 2025广东“百万英才汇南粤”佛山市高明区选聘公办初中校长9人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025年连云港市赣榆区事业单位公开招聘工作人员31人考前自测高频考点模拟试题及答案详解(全优)
- 法治护航-健康成长课件
- PRO-3M-教材教学课件
- 护理重点专科评审解读
- 体育与健康课程标准2022版考试题目含答案
- 内科消化道出血诊疗规范
- 城市污水处理厂运行承诺及保障措施
- 牛顿课件教学课件
- 2025民乐辅警考试真题
- 2025年吉林省中考数学试卷真题(含答案详解)
- 综治中心培训课件
- 2025-2030中国生物石脑油市场发展现状与未来前景动态研究报告
评论
0/150
提交评论