统计名词解释.docx_第1页
统计名词解释.docx_第2页
统计名词解释.docx_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

名词解释:1总体(population):是同质的所有观察单位某种变量值的集合,可分为有限总体和无限总体。总体中的所有观察单位都能够标识者为有限总体,反之为无限总体。样本(sample):从总体中抽取部分观察单位,其观测结果的集合称为,具有代表性。2同质:一个总体中有许多个体,他们之所以汇集起来成为人们的研究对象,必定存在共性,即他们具有同质性。个体的同质性是构成研究总体的必备条件。研究内容不同,对同质性要求不同。变异(variation):个体差异是生物医学研究领域普遍存在的现象。即使是同质总体的个体观察值之间也存在差异,这种现象称为。总体内没有差异性就无需统计学。3变量(variable):指取值不能事先确定的观察结果。可分为定性变量【分类变量(多分类变量和二分类变量)和有序变量】和定量变量(离散型定量变量和连续型定量变量)。变量只能由“高级”向“低级”转化:定量有序分类二值。4资料:变量的实际观测结果构成资料。定量资料:也称数值变量,其变量值是定量的,表现为数值大小,有度量衡单位。对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为。定性资料:将观察单位的观察结果按某种属性或类别分组,分别统计各组的观察单位数所得的资料称为,亦称为计数资料或分类资料。其观察值是定性的,表现为两个或多个互不相容的类别或属性。可分为无序分类资料和有序分类资料(等级资料)。等级资料:将观察单位的观察结果按某种属性的程度或等级分组,分别统计各组的观察单位数所得的资料。与定性资料不同:属性分组有程度或等级差别,各组按大小顺序排列。与定量资料不同:每个观察单位的观察结果未确切定量。5参数(parameter):是反映总体特征的统计指标。总体参数是未知的、固有的、不变的。统计量(statistic):与参数对应,通过样本计算的统计指标。样本统计量是已知的、变化的、有误差的。6抽样误差(sampling error):是指由抽样引起的样本统计量之间以及样本统计量与总体参数之间的差别,是不可避免的。产生的根本原因是生物个体间存在的变异性。抽样的目的是由样本统计量推断总体参数。7概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0 P(A)1.频率:在相同的条件下,独立重复做n次实验,事件A出现了m次,则比值m/n称为随机事件A在n次实验中出现的频率。当实验重复很多次时,n越大,m/n越接近概率P(A)。当P(A)0.05时,事件A称为小概率事件。8粗死亡率(crude death rate,CDR):简称死亡率,指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。9动态数列(dynamic series):是按时间顺序将一系列统计指标(可以是绝对数、相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。10发病率(incidence rate,IR):表示一定时期内,在可能发生某病的一定人群中新发生某病得强度,是表示发病危险性的直接指标,分子中只包括新发病例,是一个动态指标。发病率新发病例数/(平均人口数*1年)。患病率(prevalence):又称现患率。指某时点上受检人数中现患某种疾病的频率,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,分子包括新旧病例,是一个静态指标。发病率和患病率同为疾病发生频率的指标。在一定人群和时间内,发病率和患病率密切相关,两者与病程(D)的关系是:PR=IR*D。11医学参考值范围(reference range):是指特定的“正常”人群(排除了对所研究的指标有影响的的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在范习惯用该人群的95的个体某项医学指标的取值范围作为该指标的医学参考值范围。12标准误(standard error,SE或SEM):是样本统计量的标准差,反映其变异程度,用于反映统计量抽样误差的大小。标准误越小,样本统计量作为总体参数估计值的可靠程度越大。13假设检验(hypothesis test):也称显著性检验,是利用小概率反正法思想,先对总体特征做出两种对立的假设(H0与H1),然后在H0成立的条件下计算检验统计量,以至获得概率P值,并与预先规定的概率(检验水准)相比较来间接判断H1是否成立的统计推断过程。目的:判断两个或多个总体参数是否相等。14假设检验的两类错误:型错误(typeerror):指拒绝了实际上成立的H0,这类“弃真”的错误称为,其概率大小用表示。型错误(type error):指接受了实际上不成立的H0,这类“取伪”的错误称为,期概率大小用表示。在样本含量一定时,增大,减小;反之,减小,增大。在实际应用中,通过去控制。15假设检验的功效(power):1-称为假设检验的功效。其意义是:当所研究的总体与H0确有差别时,按检验水平能够发现它(拒绝H0)的概率。一般情况下对于同一检验水准,功效大的检验方法更可取。在医学科研设计中,检验功效1-不宜低于0.75,否则出现非真实阴性值。16检验水准:是假设检验中预先设定的允许犯型错误的概率的最大值,记为。17方差分析(ANOVA):又称F检验,它是一种以F值为统计量的定量资料的假设检验方法,通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。18总变异(total variation):所有观察值之间的变异(不分组),包括了处理因素和随机误差。总变异的大小可以用离均差平方和(SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。总变异SS总反映了所有测量值之间总的变异程度组间变异:指个处理样本均数i各不相同,与总均数也不相同。组间变异产生的原因是处理因素和随机误差(含个体差异和测量误差)的综合作用。组内变异:各个处理组内部观察值或变量值大小不同,这种变异称为。组内变异只包括随机误差(含个体差异和测量误差)。19均方差:将各部分离均差平方和除以相应的自由度,其比值为,简称均方(MS)。F统计量:即组间均方与组内均方的比值20单独效应:是指其他因素水平固定时,同一因素不同水平的效应之差。主效应:是指某一因素单独效应的平均值。交互效应:是指两个或多个因素间的效应互不独立的情形。21重复测量资料(repeated measurement data):是同一受试对象的同一观察指标在不同时间点上进行多次测量的所得的资料,常用来分析观察指标在不同时间点上的变化。22非参数检验:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,进行的是分布之间的检验。一般不直接用样本观察值做分析,统计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数据,只保留了大小次序的信息,凡适合参数检验的资料,应首选参数检验。23直线相关(linear correlation):又称简单相关,用于研究两个连续性随机变量X和Y之间的线性关系,适用于双变量正态分布资料。有正相关、负相关、零相关等关系。直线相关的性质可由散点图直观说明。24线性相关系数(linear correlation coefficient):又称积差相关系数,或 Pearson 积矩相关系数,以符号r表示样本相关系数,表示总体相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。25秩相关:又称等级相关,是用双变量等级数据作直线相关分析,特别适用于下列资料:不服从双变量正态分布而不宜作积差相关分析的资料;总体分布型未知的资料

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论