统计学名称解释_第1页
统计学名称解释_第2页
统计学名称解释_第3页
统计学名称解释_第4页
统计学名称解释_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章一、名词解说1、参数(parameter):也叫参变量,是一个变量。假如我们引入一个或一些其他的变量来描绘自变量与因变量的变化,引入的变量本来其实不是目前问题必然研究的变量,我们把这样的变量叫做参变量或参数。描绘总体特色的归纳性数字胸怀,它是研究者想要认识的整体的某种特色值。2、统计量(statistic):描绘样本特色的数,是统计理论中用来对数据进行解析、查验的变量。3、整体(population):依据研究目确实定的研究对象的全体。当研究有详细而明确的指标时,整体是指该项变量值的全体。4、样本(sample):从整体中随机抽取的部分察看单位,整体中有代表性的一部分。5、同质(homogeneity):是指察看单位(研究个体)间被研究指标的影响因素同样。6、变异(variation):同质事物个体间的差别。根源于一些未加控制或无法控制的甚至不明原因的因素。7、概率(probability):胸怀随机事件发生可能性大小的一个数值,是一个在0到1之间的实数。8、抽样误差(samplingerror):由于抽样所造成的样本统计量与整体参数的差别。三、简答题1、统计学的基本步骤有哪些?设计、采集、整理、解析资料2、整体与样本的差别与关系?差别:整体:依据研究目确实定的研究对象的全体。当研究有详细而明确的指标时,整体是指该项变量值的全体。样本:整体中有代表性的一部分。联系:整体包括样本,样本是整体中的一部分3、抽样误差产生的原因有哪些?可以防备抽样误差吗?产生原因:(1)整体单位的标志值的差别程度。差别程度愈大则抽样误差愈大,反之则愈小。(2)样本单位数的多少。在其他条件同样的情况下,样本单位数愈多,则抽样误差愈小。(3)抽样方法。抽样方法不同样,抽样误差也不同样。一般说,重复抽样比不重复抽样,误差要大些。(4)抽样检查的组织形式。抽样检查的组织形式不同样,其抽样误差也不同样,而且同一组织形式的合理程度也会影响抽样误差。不可以够,它拥有不能防备性,只能减少抽样误差4、何为概率及小概率事件?概率:胸怀随机事件发生可能性大小的一个数值,是一个在0到1之间的实数。小概率事件:统计解析中的好多结论都鉴于必然置信程度下的概率推断,习惯大将p(A)≤0.05或≤0.01称为小概率事件,认为小概率事件在一次试验中不能能发生。第二章第三章1.正态散布

(normaldistribution)

:也叫高斯散布(

Gaussiandistribution

),一种最常有、最重要的连续型对称散布(正态散布是对称散布,但对称散布不用然是正态散布)中位数(median):是将一批数据从小至大排列后位次居中的数据值,反应一批察看值在位次上的平均水平。3.四分位数间距(quartileinterval):是上四分位数与下四分位数之差,用四分位数间距可反应变异程度的大小.即:Q3--Q1方差(variance):样本察看值的离均差平方和的均值。表示一组数据的平均失散情况。反应一组数据的平均失散水平。5.正偏态散布(positivelyskeweddistribution):也称右偏态散布,右侧的组段数多于左侧的组段数,频数向右侧拖尾6.负偏态散布

(negativelyskeweddistribution)

:左偏态散布,左侧的组段数多于右侧的组段数,频数向左侧拖尾7.对数正态散布(logarithmicnormaldistribution)假如X是正态散布的随机变量,则exp(X)

:对数为正态散布的随意随机变量的概率散布。为对数散布;同样,假如Y是对数正态散布,则

log(Y)为正态散布。8.医学参照值范围(medicalreferencerange)产物的含量等各样数据的颠簸范围。最常用的是

:指绝大部分正常人的解剖、生理、生化、免疫及组织代谢95%参照值范围。三、简答题1.描绘数值变量资料集中趋势的指标有哪些?其合用范围有何异同?平均数:描绘一组变量值的集中地点或平均水平的指标系统。不同样的散布使用不同样的指标(算术)均数:正态或近似正态或察看值相差不大的小样本资料几何均数:对数正态散布或等比级数资料中位数:一般偏态散布(传患病发病的暗藏期)描绘数值变量资料失散趋势的指标有哪些?其合用范围有何异同?反应数据的失散度(Dispersion)。即个体察看值的变异(variation)程度。常用的指标有:极差(Range)(全距)合用范围:任何计量资料;是参照变异指标2.百分位数与四分位数间距PercentileandQuartilerange百分位数:合用范围宽泛,可用于偏态资料,散布不明的资料和散布两头无确定值的资料四分位数间距:常用于描绘偏态散布资料的失散程度,值越大——变异程度越大,中位数与四分位间距一同使用,描绘偏态散布资料的特色。方差Variance正态散布资料标准差StandardDeviation合用范围:均数与标准差经常被同时用来描绘正态散布资料的集中和失散趋势。变异系数CoefficientofVariation合用范围:主要用于单位不同样或均数相差悬殊资料医学中参照值范围的涵义是什么?确定的步骤和方法是什么?医学参照值范围:指绝大部分正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各样数据的颠簸范围。最常用的是95%参照值范围。步骤与方法:1).确定“正常人”对象的范围:即依据研究目确实定的未患被研究疾病的个体。2).一致测定标准:即查验用的试剂批号、仪器、人员、条件等应同样。3).确定分组:一般需用年纪、性别等对“正常人”对象进行分组,分组特色也可依据查验判断。4).样本含量确定:一般来讲,正态散布资料所需的样本含量应在100以上,偏态或未知散布时样本含量应更大。5).确定参照值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。6).确定百分位点:一般取95%或99%。第四章第五章一、名词解说1标准误(standarderror):表示样本统计量抽样误差大小的统计指标,统计上平时将统计量(如样本均数、样本率p等)的标准差称为标准误。2可信区间(confidenceinterval):按必然的概率或可信度(1-α)用一个区间来估计整体参数所在的范围,该范围平时称为参数的可信区间或许置信区间(confidenceinterval,CI),开初给定的概率(1-α)称为可信度或许置信度(confidencelevel),常取95%或99%。3假定查验(hypothesistesting):利用样本供给的信息判断假定能否成立的统计方法称为统计假定查验。4统计推断(statisticalinference):用一个或一系列样本的结果去估计整体可能的结果的过程。包括假定查验和参数估计。5Ⅰ型错误(typeIerror)::“实质无差别,但下了有差其他结论”,假阳性错误。犯这种错误的概率是(其值等于查验水平)6Ⅱ型错误

(typeIIerror)

:“实质有差别,但下了不拒绝

H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)7查验效能(poweroftest):当两整体确有差别,按查验水平所能发现这种差其他能力。8变量变换(variabletransformation):也称变量代换,是将原始数据作某种函数变换,如变换为对数值。三、简答题1假定查验的基根源理和步骤。假定查验过去称显着性查验。它是利用小概率反证法,从问题的对峙面

(H0)出发间接判断要解决的问题

(H1)H0

P1.成立查验假定,确定查验水平(采用单侧或双侧查验)(1)无效假定(

nullhypothesis

)零假定,记为

H0;(2)备择假定又称对峙假定,记为2.计算查验统计量

H1。依据变量和资料种类、设计方案、统计推断的目的、能否知足特定条件等(如数据的散布种类)选择相应的查验统计量。3.确定P值,下结论。选定显着性水平α的值,P≤α,拒绝H0,接受H1,下“有差别”的结论。P>α不拒绝H0,但不可以下“无差别”或“相等”的结论,只能下“依据目前试验结果,尚不可以认为有差别”的结论。标准差和标准误的异同。同样点:都是用来表示变异程度的,均是反应随机误差的。差别:标准差与标准误的意义、作用和使用范围均不同样。标准差

(亦称单数标准差

)

一般用

SD表示,是表示个体间变异大小的指标

,反应了整个样本对样本平均数的失散程度

,是数据精巧度的权衡指标

;而标准误一般用

SE表示,反应样本平均数对整体平均数的变异程度

,进而反应抽样误差

,是量度结果精巧度的指标。标准差是最常用的统计量

,

一般用于表示一组样本变量的分别程度

;标准误一般用于统计推断中

,主要包括假定查验和参数估计,如样本平均数的假定查验、参数的区间估计与点估计等。3参照值范围和置信区间有何差别?参照值范围是指拥有明确背景资料的参照人群某项指标的测定值的人体形态,功能和代谢产物等,表示值时可能有单侧也可能有双侧

,比方医学参照范围指包括绝大部分的正常人,表示方法为正态散布或百分位数法.置信区间是指在做区间的估计时指按必然的概率

(1-a)估计整体参数所在的范围

,其中(1-a)被称为置信度

,两者的不同样之处在于前者是关于某种指标的估计,后者是对参数的估计。置信区间与参照值范围的意义、计算公式和用途均不同样。从意义来看95%参照值范围是指同质整体内包括95%个体值的估计范围,而整体均数95%可信区间是指按%可信度估计的整体均数的所在范围。从计算公式看若指标遵照正态散布,95%参照值范围的公式是:x±1.96s。整体均数95%可信区间的公式是:σ未知的小样本Xt0.05/2,vSXσ未知的大样本u0.05/2,vSX前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t或u界值。4t查验和方差解析的基本思想各是什么?两者的差别是什么?t查验(假定查验的一种):假定查验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假定(查验假定H0),再用合适的统计方法确定假定成立的可能性大小,如可能性小,则认为假定不能立,若可能性大,则还不可以认为假定不能立。方差解析的基本思想是依据资料设计的种类及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解说。经过比较可能由某因素所至的变异与随机误差,即可认识该因素对测定结果有无影响。差别:t查验可用于2个样本均数差其他显着性查验,但不适于多组均数的查验。方差解析是判断多组(≥3)数据之间均数差别能否显着的一种假定查验方法。5、t查验和t查验的应用条件有何异同?查验:样本含量n较小时(如n<60)正态散布方差齐性(homogeneityofvariance)方差解析:整体——正态且方差相等

样本——独立、随机6以随机区组设计的两因素方差解析为例,简述方差解析的基根源理

。正态散布且方差齐同的资料,应采用两因素

(办理、配伍)方差解析

(two-wayANOVA)

或配对

t查验(g=2)(1)总变异:反应所有察看值之间的变异,记为SS总。(2)办理间变异:由办理因素的不同样水平作用和随机误差产生的变异,记为(3)区组间变异:由不同样区组作用和随机误差产生的变异,记为SS区组.(4)误差变异:由随机误差产生的变异,记为SS误差。对总离均差平方和及其自由度的分解,有:

SS办理。可信区间和假定查验的差别和联系。(一)主要差别:1、可信区间是以样本资料估计整体参数的真值,假定查验是以样本资料查验对整体参数的先验假定能否成立;2、可信区间为双侧,假定查验既有双侧查验,也有单侧查验;3、可信区间立足于大体率,假定查验立足于小概率。(二)主要联系:1、都是依仍旧本信息推断整体参数;2、都以抽样散布为理论依据,成立在概率论基础之上的推断;3、两者可相互变换,形成对偶性。可信区间与假定查验各自不同样的作用,要联合使用。一方面,可信区间亦可回答假定查验的问题,算得的可信区间若包括了H0,则按水平,不拒绝H0;若不包括H0,则按水平,拒绝H0,接受面,可信区间不单能回答差别有无统计学意义,而且还可以比假定查验供给更多的信息,即提示差别有无实质

H1。另一方的专业意义。8配对

t

查验与两样本

t

查验的基根源理有何不同样。配对t查验合用于配对设计的计量资料。配对设计种类:①两同质受试对象分别接受两种不同样的办理;②同一受试对象分别接受两种不同样办理;③同一受试对象(一种)办理前后。两样本t查验合用于完好随机设计两样本均数的比较,第七章二项散布、Poisson散布与正态散布间有何关系?二项散布:是正态散布的特别形式,记作X~B(n,),理论上n→+∞且→0.5则二项散布呈正态散布;在实质应用中,当n较大、np与n(1-p)均>5,且有→0.5时,二项散布可看作近似正态散布。Poisson

散布:它是一般二项散布在次数极大,发活力率很小时的极限,记作

X~P(

)

越大则

Poisson散布渐近正态散布。实质应用上,

≥20即可将其看作是正态散布。第六章分类资料的统计描绘一、名词解说1、率(rate):是说明某事物(或现象)发生的频次或强度的指标。2、组成比(constituentratio):是说明某事物内部各组成部分的比重或散布的指标。3、相比较(relativeratio):是说明两个相关系的事物间的相对关系的指标。4、标准化率(standardizedrate):也称调整率,是多组率之间按一致的“标准”进行调整,使之拥有可比性的率。5、标化发病比(standardizedincidenceratio):被标化组实质发病数与预期发病数之比。6、标化死亡比(standardizedmortalityratio):被标化组实质死亡(发病、患病等)数与预期死亡(发病、患病等)数之比。第七章二项散布与Poisson散布及其应用第八章X2查验第九章秩和查验三、简答题1、二项散布、Poisson散布与正态散布间有何关系?2、X2查验的应用条件有哪些?1)四格表的解析方法选择条件:n≥40,T≥5,专用公式;n≥40,1≤T<5,校正公式;X2

n<40或T<1,直接计算概率。连续性校正仅用于v=1的四格表资料,当

v≥2时,一般不作校正。2)配对四格表的解析解析方法选择条件:b+c>40,专用公式;20<b+c≤40,用校正公式;b+c<20,二项散布直接计算概率。3)R×C表的解析方法选择条件:1.理论数不可以小于1;2.理论数大于等于1小于5的格子数不超出总格子数的1/5;3.否则用Fisher确实概率,或似然比查验。4.假如以上条件不可以知足,可采用:增加样本含量;删去某行或某列;合理地归并部分行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论