卫生统计学名词解释_第1页
卫生统计学名词解释_第2页
卫生统计学名词解释_第3页
卫生统计学名词解释_第4页
卫生统计学名词解释_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。2、标准误:将样本统计量的标准差称为标准误。3、 均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。4、 u分布:若某一随机变量X服从总体均数为u、总体标准差为。的正态分布N(u,。2),则通过u变换(X-u/o)可将一般正态分布转化为标准正态分布N(0,12),即u分布。5、 T分布:在实际工作中,由于。-X未知,用S-X代替,贝卜X-u/S-X不再服从标准正态分布,而服从T分布。6、 可信区间:是按照预先给定的概率(1-a)所确定的包含总体均数的区间估计范围。其确切含义为:如果能够进行重复抽样试验,平均有1-a(如95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间。7、 假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面Ho)出发间接判定要解决的问题(H1)是否成立。然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。8、 1型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。II型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。9、 检验效能:1-B,即把握度,指当两总体确有差异,按规定检验水准a所能发现该差异的能力。10、 变量转换:是指原始数据作某种函数转换,如转换为对数值等。1、 方差分析:又称变异数分析或F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。2、 单向方差分析(onewayanalysisofvariance)是指处理因素只有一个。这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(meansquare,MS)4、 LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。5、 SNK(student-Newman-Keuls)法:又称q检验,是根据q值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较。6、 Tukey法:又称为真正显著差(honestlysignificantdifference,HSD)的单一值作为判断标准。7、 Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较。8、 完全随机设计:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。9、 析因设计(factorialdesign)实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorialdesign)实验。10、 随机区组设计(randomizedblockdesign)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。1、二项分布:是指只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中,当每次试验的“阳性”概率n保持不变时,出现阳性次数X=0,1,2,3……的一种概率分布。2、Poisson分布:作为二项分布的一种极限情况,已发展为描述小概率事件发生规律的一种重要分布。1、 2分布:是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。2、 拟合优度检验:是判断样本实际频数分布与拟合的理论频数分布是否符合,或者说判断此样本是否来自某种分布。3、 CochranArmitage趋势检验:当某因素是按自然顺序的等级分层或者在连续性资料等级化后再分层的情况下,可采用CochranArmitage趋势检验(CochanArmitagetrendtest)以分析率是否随分层等级而变化的趋势。4、 四格表的费歇尔精确概率(Fisher'sexactprobabilitiesin2X2table)检验:也称四格表概率的直接计算法,是一种直接计算概率的假设检验。它适用于四格表中有理论频数小于1或n小于40的情况,特别是用其它检验方法所得的概率接近检验水准时。1、 回归(regression)与相关(correlation)是研究两个或多个随机变量之间相互关系的一种重要的统计分析方法,应用较广。回归是研究随机变量之间的数量依存关系,相关是研究随机变量间相互联系的密切程度和方向。2、 回归系数(regressioncoefficient):又称斜率(slope),是当X每改变一个观测单位时所引起的Y的平均改变的估计量,它是回归分析中最重要的统计量。3、 SS总:称为总离均差平方和(totalsumofsquares),说明未考虑X与Y的回归关系时Y的变异。SS回:称为回归离均差平方和。它反映在Y的总变异中由于X与Y的直线关系而使Y变异减小的部分,也就是在Y的总平方和中可以用X解释的部分。SS回越大,说明回归效果越好。SS残:称为残差平方和或剩余平方和,它反映X对Y的线性影响之外的一切因素对Y的变异的作用,也就是在总平方和中无法用X解释的部份。1、logistic回归分类:是研究二分类观察结果与一些影响因素之间关系的一种多变量分析方法。0、完全数据:某个观察对象具有明确的结局时,该观察对象所提供的关于生存时间的信息是完整的。我们把达到了明确结局的观察对象的生存时间数据称为完全数据(CompleteData)。1、 截尾数据:临床试验研究中有一部分病人,或中途失访,或到观察结束时仍存活,对这部分病人无法知道准确的生存时间,只知道其生存时间比观察到的时间要长,它提供不完全的信息,称为不完全数据,亦称截尾数据。2、 生存分析:是将事件发生的结果和随访时间两因素结合在一起进行分析的一种统计分析方法,它能充分利用所得的研究信息,更加准确地评价和比较随访资料。3、 生存时间:是任何两个有联系事件之间的时间间隔。4、 截尾值:指在随访过程中,由于某种原因未能观察到病人的明确结局(即终止事件,)所以不知道该病人的确切生存时间,它提供的生存时间的信息是不完全的。5、 生存函数:又称为累积生存率,简称生存率。表示具有协变量X的观察对象其生存时间T大于时间t的概率,常用S(t,X)=P(T>t,X)表示。6、 风险函数:表示据有协变量X已生存到时间t的观察对象,从生存时间t到t+At这一非常小的区间内死亡的概率极限,即生存时间已达到t的一群观察对象在时刻t的瞬时死亡率。7、 死亡概率:表示一个观察对象从开始观察时间到时间t为止的死亡概率,是一个时间上升函数。8、 Kaplan-Meier法(记为KM法):此法直接用概率乘法原理估计生存率,故又称乘积极限法(Product-limitmethod),它由Kaplan—Meier于1958年提出,故又称Kaplan-Meier法(记为KM法)。这是一种非参数法,主要用于小样本资料的生存率估计。1、 判别分析:根据一批分类明确的样本的若干指标的观察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据回代判别的准确率评估它的实用性。2、 先验概率:如在所研究的总体中任取一个样品,该样本属于Yi的概率为P(Yi),则为类别Yi的先验概率。3、 事后概率:如已知某样品的各指标Xi的观察值为Si,在此条件下,属于Yi的类别概率P(Yi|S1、S2、……Sp)为后验概率。4、 交叉核实:为了判断观测i的判断正确与否,用删除第i个观察的训练数据算出判别函数,然后用此判别函数来判别第i观测,对每一观测都进行这样的判别。1、 聚类分析:是指在不知道应分多少类合适的情况下,试图借助数理统计的方法用已收集到的资料找出研究对象的合适归类方法。2、 R型聚类:又称指标聚类,是指将m个指标归类的方法,其目的是将指标降维从而选择有代表性的指标。3、 Q型聚类:又称样品聚类,是指将n个样品归类的方法,其目的是找出样品间的共性。1、 潜在变量(latentvariable):不能或不易直接观测得到的变量。这种变量往往是根据某种理论假设的。如:交感神经等。2、 公因子:可以解释多个原始变量的抽象变量。3、 特殊因子:只能解释一个原始变量的抽象变量。4、 主成分分析:寻找反映多个变量的独立的综合指标。主成分个数等于变量个数,但是一般去前几个。5、 因子分析:寻找解释多个变量的独立的公因子。公因子个数一定小于原始变量个数。6、 主成分分析principalcomponentanalysis:主成分分析是一种简化数据的统计方法,把同一个观察单位的多个(m个)彼此相关的数量指标(Xi)化为少数几个j个,jm)互不相关的综合指标Zj(称为第1、2・・・j个主成分)以便尽可能简单地说明观察对象,而又不损失原指标提供的有价值的信息,且每个主成分的实际意义又符合专业解释。1.总体:总体(populatio)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。随机抽样:随机抽样(randomsampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurementdata)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(countdata)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinaldata)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0<P(A)<1。频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)=m/n。随机误差:随机误差(randomerror)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差(samplingerror)是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。7.系统误差:系统误差(systematicerror)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。随机变量:随机变量(randomvariable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。频数表(frequencytable)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度日内死亡0,1,20个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。算术均数(arithmeticmean)描述一组数据在数量上的平均水平。总体均数用“表示,样本均数用X表示。几何均数(geometricmean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。中位数(median)Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。5•极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。四分位数间距(inter-quartilerange)是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。8•方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。标准差(standarddeviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。变异系数(coefficientofvariation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示。计算:标准差/均数*100%1.统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statisticalinference))2.抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(samplingerror)。标准误及Xs:通常将样本统计量的标准差称为标准误。许多样本均数的标准差Xs称为均数的标准误(standarderrorofmean,SEM),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidenceinterval,CI)。它的确切含义是:可信区间包含总体参数的可能性是1-a,而不是总体参数落在该范围的可能性为1-a。参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。I型和II型错误:I型错误(typeIerror),指拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用a表示;II型错误(typeIIerror),指接受了实际上不成立的H0,这类“存伪”的误称为II型错误,其概率大小用卩表示。检验效能:1-卩称为检验效能(poweroftest),它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力。检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(levelofatest),记为a。1•率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(%。)等。构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。3•比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几。计算公式为:A/B,表示方式有:倍数或分数等。非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametricstatistics),或称为不拘分布(distribution-freestatistics)的统计分析方法,又称为无分布型式假定(assumptionfreestatistics)的统计分析方法。参数统计:通常要求样本来自总体分布型是已知的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论