统计学名词解释_第1页
统计学名词解释_第2页
统计学名词解释_第3页
统计学名词解释_第4页
统计学名词解释_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

名词解释1. 统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整理、分析、表达和解释的一门科学。2. 医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集 整理、分析、表达和解释的一门科学。3. 抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。4. 统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的, 包括参数估计和假设检验。5. 总体:是根据研究目的确定的同质研究对象的全体。6. 概率:是随机事件发生可能性大小的数值度量。7. 同质:是指所研究的观察对象具有某些相同的性质或特征。8. 变异:是同质个体的某项指标之间的差异,即个体差异。9. 正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。10. 医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指标值的波动范围称为该指标的正常值范围。11. 动态数列( dynamic series ):是按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋 势,这些统计指标可以为绝对数、相对数或平均数。12. 人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女, 两个对应的直方图,其形似金字塔。13. 负担系数( dependency ratio ):又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比。14. 标准化死亡比 (smr): 实际死亡人数与期望死亡人数之比称为标准化死亡比。精品资料15. 统计图:是用点的位置、线段的升降、直条的长短和面积的大小等来表达数据的一种形式。16. 半对数线图 (semi-logarithmic linear chart):横轴是算数尺度,纵轴是对数尺度,使线图上的数量关系变为对数关系。适用于描述某项指随某个连续型数值变量变化而变化的速度(相对变化趋势)。17. 直方图( histogram ):一般用横轴表示连续性数值变量,纵轴表示表示频数或频率,每个矩形的宽度等于各组段的组距,高度等于相应组段的频数或频率。常适用于描述连续性数值变量的频数或频率分布了解一组数据的分布类型和分布特征。18. 散点图( scatter plot ):是用直角坐标上点的密集程度或趋势表示两变量间的相关关系。19. 箱式图( box plot ):箱式图用于描述练箱连续型变量的分布特征,它表现连续型变量的 5 个特征值,即最小值、下四分位数、中位数、上四分位数、最大值。20. 统计地图( statistical map ):是运用统计数据反应制图对象数量特征的一种图形,主要用于某种现象的数量在地域空间上的分布。21. 随机抽样( random sampling):是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是 样本具有代表性的保证。22. 抽样误差( sampling error of mean):是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异。23. 统计推断 (statistical inference):通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。24. 四分位数间距 (inter-quartile range, iqr):是由第三(上)四分位数减去第一(下)四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定。25. 变异系数( coefficient of variation):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用cv 表示。24 第类错误(type error ):是指拒绝了实际上成立的h0 ,这类“弃真”的错误称为型错误,其概率大小用表示。25. ii 型错误( type ii error ):是指接受了实际上不成立的h0 ,这类 “存伪 ”的错误称为 ii 型错误,其概率大小用表示,未知。26. 检验效能: 1- 称为检验效能( power of test),也称把握度,它是指当两总体确有差别,按规定的检验水准a 能发现它们有差异的能力。27. 随机区组设计(randomized block design):是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block ),使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。28. 完全随机设计 (completely random design):是采用完全随机化的分组方法,将全部试验对象分配到g 个处理组(水平组),各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。29. 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况,甚至比较同一标本接受两种不同测定方法的检查结果的差别。29 析因设计( factorial design)实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorial design)实验。30. 方差分析( analysis of variance anova)的基本思想:是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,再进行分析。31 . lsd-t检验:即最小显著性差异t 检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。32. snk ( student-newman-keuls)法:又称q 检验,是根据q 值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较。33 dunnett-t检验:适用于g-1 个实验组与一个对照组均数差别的多重比较。34. 二项分布 (binorminal distribution):是指每次试验有且仅有两个可能结果如“阳性或“阴性“之一的n 次独立重复试验中,每次试验的发生”阳性“概率“ 保持不变,出现”阳性“数x=0,1,2,3,n 的一种概率分布。35. 率的抽样误差( standard error of rate):由于个体差异的存在,在抽样研究中表现出来的样本率与总体率或样本率的之间的差异称为率的抽样误差。36. poisson分布:是一种离散型分布,二项分布的一种极限情况,用于描述单位时间、空间、面积等小概率事件发生次数的概率分布。它是由法国人s.d.poisson首先提出来。2237. 分布:是一种以分布为基础的连续型分布,可用于检验资料的实际频数和2按检验假设计算的理论频数是否相符等问题,以值为检验统计量的计数资料的假设检验方法。标准正态分布:对任意一个服从正态分布(u, )的随机变量,可经z 变换后的z 值仍然服从正态分布,且其总体均数为0、总体标准差为1。我们称此正态分布为标准正态分布,用 n(0,1) 表示。38. nonparametric statistics:非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散 型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于 该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法, 又称为无分布形式假定的统计分析方法。39. 参数检验 (parametric text) :通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数检验。40. wilcoxon两样本秩和检验的基本思想:如果ho 成立,则两样本来自分布相同的总体,两样本的平均秩次t1/n1 与 t2/n2 应相等或接近,含量n1 的样本的秩和t1 应在n1(n+1)/2的左右变化。若t 值偏离此值太远,h0 成立的可能性就很小。若偏离出给定 值所确定的范围时,则p, 拒绝 h0 。41. friedman的 m 检验的基本思想:在h0 成立的条件下,各区组内观察值取秩次为1,2,,k 的概率相等,则各处理组的秩和应接近r( 平均 )=n(k+1)/2, 而 m 值反映了实际获得的 k 个处理组的秩和与偏离的程度。m 值越大,越有理由怀疑各处理组的总体2分布不同。随着b 和 k 的增大, m 值近似服从自由度为k-1 的分布。42. 直线相关:是分析服从正态分布的两个随机变量x 与 y 有无线性相关关系的一种统计分析方法。43. 相关系数:是描述两个变量间线性相关关系的密切程度与方向的统计指标。44. 直线回归( linear regression):建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。45. 回归系数( regression coefficient):即回归直线的斜率(slope) ,表示自变量x 每改变一个单位时,应变量y 平均变化 b 个单位。46. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总 体参数的可信区间(confidence interval,ci )。它的确切含义是:可信区间包含总体参数的可能性是1- ,而不是总体参数落在该范围的可能性为1-。47. 四分位数间距 (inter-quartile range, iqr):是由第三(上)四分位数减去第一(下)四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征, 较极差稳定。48. 标准正态分布:均数为0,标准差为1 的正态分布被称为标准正态分布(standard normal distribution),通常记为n(0, 12) 。49. 偏回归系数:多元线性回归中的偏回归系数表示在其他自变量固定不变的情况下, 自变量 xj 每改变一个单位时,单独引起应变量y 的平均改变量。50. 系统抽样 (systematic sampling):又称机械抽样和等矩抽样,现将总体的观察单位 按照某一顺序分成n 个部分,再从第一部分随机抽取第k 号观察单位,依次用相等的间隔,从每一部分抽取一个观察单位组成样本。51. 分层抽样 (stratified sampling):又称分类抽样,先按影响观察值变异较大的某种特征将总体分为若干层,再将从每层内随机抽取一定数量的观察单位组成的样本。52. r*r 称为决定系数 (coefficient of determination), 表示由 x 与 y 的直线关系导致的y 的变异 ss 回在总变异ss 总中所占的比重,即回归效果的好坏,r*r 越接近 1,即回归的效果越好。53. 抽样调查( sampling survey):是从总体中随机抽取一部飞的研究对像组成样本,对样本进行调查,然后根据样本信息来推断总体特征。54. 典型调查 (typical survey):典型调查又称案例调查,是有目的的选着典型的人和单位进行调查。55. 变异系数( coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用cv 表示。56. residual analysis:残差分析,旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等。57. 最小二乘原则 (least squares method):所有的数据点到回归直线的纵线距离的平方和最小。58. 拟合优度检验:是判断样本实际频数分布与拟合的理论频数分布是否符合,或者说判断此样本是否来自某种分布。59. 回归直线的置信带(confidence band):以相应的 x 为横坐标, y 为纵坐标,将置信区间的上下线分别连接起来形成的两条弧形线的区域,称为回归直线的置信带。60. 标准化残差 (standardized residual):将每个残差值减去所有残差值的均数,再除以所有残差值的标准差,便得标准化残差。61. 随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组或对照组。62. 双盲( double blind ) :指受试对象和研究者均不知道受试对象在哪一组,称为双盲。63. 定群寿命表 (cohort life table) :亦称队列寿命表,它是对某特定人群中的每一个人,从进入该特定人群直到最后一个人死亡记录的实际死亡过程。由于人的生命周期很长,如果用现时寿命表方法研究人群的生命或死亡过程不仅随访人数要很多,而且随访时间要上百年。1. 算术均数( arithmetic mean )描述一组数据在数量上的平均水平。总体均数用 表示,样本均数用 x 表示。2. 几何均数( geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为g。3. 中位数( median ) md 将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论