卫生统计学考试大纲串讲文字材料注:以下内容为当初老师串讲文字.doc_第1页
卫生统计学考试大纲串讲文字材料注:以下内容为当初老师串讲文字.doc_第2页
卫生统计学考试大纲串讲文字材料注:以下内容为当初老师串讲文字.doc_第3页
免费预览已结束,剩余17页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫生统计学考试大纲串讲文字材料注:以下内容为当初老师串讲文字卫生统计学考试大纲串讲文字材料注:以下内容为当初老师串讲的文字材料仅供同学进行复习时参考使用。第一部分绪论一、总体与样本的概念例1:某地20_年正常成人血压的研究中其研究总体是该地20_年所有正常成人血压值的全体。对这样的总体作研究时观察单位的数量N多数情况下是巨大或不清楚的统计上称之为无限总体。此时的两个重要参数:总体均数与总体标准差b往往未知为了获得对它的估计需要作抽样研究。例1的样本是指从该地20_年正常成人的血压值的总体中随机抽出的一部分血压值的集合。二、误差、随机抽样、概率与小概率事件的概念抽取样本时应遵循随机化原则使得样本

2、具有足够的代表性能较准确地代表总体。对样本作描述性统计时经常采用的统计量是样本均数_与样本标准差s。用样本均数来估计未知总体均数卩时不可避免地会存在差异各个随机样本所算得的样本均数之间也会存在差异统计上称之为抽样误差。抽样误差属于随机误差的一种随机误差的特点是由偶然因素所致所得结果或大或小如果增加观测次数偏大或偏小的结果会互相中和甚至消除。与随机误差相对立的另一种误差是系统误差其典型例子是用未校准的天平测量物品时所产生的误差。概率是反映事件发生的可能性大小的量用P表示。P<0.05的事件称为小概率事件可以认为在一次试验中该事件不可能发生。未知参数7t未知参数7t均数标准差率三、不同类型的

3、统计资料(计量/计数/等级)及相应的统计方法例1:为调查某地20_年正常成人的血压情况随机抽取该地100名正常成人血压值作为样本。例2:为研究某市1995年住院分娩产妇中妊高症发生情况及可能影响因素故将总体定义为该市1995年所有住院分娩产妇该总体中妊高症发生率用n表示(未知)。现随机抽取该市1000名住院分娩产妇并清点其中发生妊高症的产妇人数所获得的资料。例3:对新药与传统药作疗效对比观察的主要指征是患者的贫血程度有无改善。两组患者均被分为轻度、中度、重度或恶性贫血四种类型并分别清点人数。治疗前后分别统计所获得的资料。第二部分计量资料的统计描述四、掌握各种集中、离散趋势指标的计算、适用条件及

4、意义1为了解计量资料的分布规律可将观察值编制频数表、绘制直方图以描述资料的分布特征(集中趋势和离散趋势)以及分布类型(对称分布、偏态分布)。2?描述计量资料集中趋势(集中位置)常用的指标有均数几何均数中位数常用描述集中趋势的指标指标计算公式适用条件均数_-_-n适用于对称分布尤其正态分布几何均数GM二L十(2一7)fM2等比资料对数正态分布中位数MG虻号_)偏态分布末端无确定值3?描述频数分布离散趋势的指标有:极差和四分位数间距后者较稳定但均不能综合反映全部观察值的变异程度。方差和标准差能综合反映全部观察值的变异程度。变异系数可用于单位不同或均数相差悬殊时资料的变异度的比较。以上指标均为数值越

5、小说明观察值的变异度越小。常用描述离散趋势的指标指标计算公式适用条件极差R最大值-最小值任何分布四分位数间距Q方差;、s2Q=P75-P25偏态分布末端无确定值_2(_)2-N2Z(_-_)s二n1对称分布尤其正态分布标准差二、s-=K_)2s=3(_-_)2对称分布尤其正态分布貯VNn_1变异系数CVCVs100%_量纲不同的资料均数相差悬殊的资料五、对称分布与偏态分布资料的频数分布特征120名20岁男大学生身高资料身高组段频数f(2)(1)162216431661016813170191722817420176101781018041821841合计(送f)120某校急性食物中毒潜伏期资料

6、潜伏期(天)人数(f)(1)(2)0?11?72?323?114115?46?27?18?1合计70六、正态分布与标准正态分布的特征:见预防医学P112或实用卫生统计学P21。七、正态分布与标准正态分布曲线下特殊的面积规律正态分布曲线下面积规律是理论上土1.966、卩2.586区间的面积(观察单位数)各占总面积(总观察单位数)的95%99%。标准正态分布曲线下面积规律是理论上(-1.96,1.96)和(-2.58,2.58)区间内的面积占总面积的95%和99%八、正态分布法计算95%、99%正常值范围的公式实际应用中却很少已知和6,当样本含量n较大时可用_和s作为和6的估计值则有:_1.96s

7、(_-1.96s,_1.96s)包括所有观察值的95%;_2.58s包括所有观察值的99%。第三部分计数资料的统计描述九、常用相对数指标及其应用时注意事项常用相对数的公式和用途相对数公式说明问题发生某现象的观察单位数率苴TUI扇的给企帧窓甜胴商率可能发生某现象的观察单位总数某现象的发生频率或强度构成比A/(A+B+)事物内部各组成部分所占比重分布或比A/BA为B的若干倍或百分之几相对数在应用时应注意:分母不宜过小、不能以构成比代替率平均率的计算及资料的可比性问题。十、率的标准化法的意义当比较两组资料时内部构成有不同以致影响结果时需要进行率的标准化其目的是消除内部构成因素对总率的影响。标准化法的

8、基本思想是选择统一构成的人群作为标准人口对资料进行校正重新计算标化率并作相互比较。第四部分计量与计数资料的统计推断均数的标准误是反映均数抽样误差大小的指标即样本均数的标准差。均数的标准误越小抽样误差就越小用此样本均数估计总体均数就越可靠。据标准误的计算公式可看出在标准差一定的条件下标准误的数值与样本含量的平方根成反比因此适当增加样本含量可以减少均数抽样误差。意义计算直接法:标准差衡量个体观察值离散程度的指标加权法:f_2二f_2/n主要应用估计参考值范围均数标准误YZf-i是样本均数的标准CTn估计总体均数的差衡量样本均数的可信区间离散程度反映了抽样误差的大小sSxs二参考值范围总体均数可信区

9、间意义计算主要应用包括绝大多数人某项指标的数值范围正态分布:_u./2S(双侧)判断观察对象某项指标正常与否(辅助诊断)参考值范围和总体参数可信区间的区别按一定的概率估计总体b未知:_土to(2,S_估计未知的总体均均数所在的可能范围匚已知:_-U:/2;_数所在范围二未知但n足够大:_u:/2S_总体率可信区间按一定的概率估计总体率所在的可能范围(1)n込50,特别是p很接近0或100%:查表法;估计未知的总体率(2)n足够大且np与n(1-p)均所在范围大于5:正态近似法即p二U-/2Sp。当计算双侧95%可信区间公式时u#取1.96;当计算99%可信区间时u:/2取2.58。总体均数、总

10、体标准差及总体率统称为总体参数。参数估计是指按一定的概率估计总体参数所在的可能范围的方法又称为区间估计。总体参数的所在范围通常称为参数的可信区间即该区间以一定的概率(如95%或99%)包含总体参数。十二、假设检验的基本思想与基本步骤统计推断的主要内容有两个:参数估计与假设检验。这两种统计方法都是在研究总体即利用样本信息来对总体特征进行推断。但参数估计的主要任务是找总体参数值等于几;假设检验的兴趣主要是看总体参数的值等于某个特殊值的可能性到底有多大。下面举一个完全随机设计的两样本均数的比较的例子。例:某研究者欲研究冠心病与微量元素的关系用随机抽样方法比较了10例冠心病患者与15例健康人血清中锌含

11、量(Pmol/L)算得:2冠心病患者:ni=l0_1=_1/n1=20.163?=20.453健康人:n2=15_2=_2/n2=15.732S2=9.235试问冠心病患者与健康人血清中锌含量均数有无不同?分析思路:第一步:发现两样本均数之间存在差异冠心病患者血清样本的平均锌含量不同于健康人即_!工_2第二步:希望借助样本信息来回答从总体角度看冠心病患者平均血清锌是否与健康人不同即4=丄。换一句话说即想看两样本均数之间的差异有无显著性(或统计学意义)。第三步:建立无效假设H与备择假设H,采用小概率反证法思想先假定H成立两样本均数间的差异无显著性源于抽样误差。这样的话算出的u或t统计量应该是小的

12、假如假设检验公式得到的统计量太大超出相应的u或t界值P<0.05就有理由认为H)不成立转而接受H假设。假如得到的统计量数值小P0.05就只好认为H)成立。方差分析、卡方检验等各种类型的假设检验方法的基本思想都基于此只是将相应的统计量改为F或x2,并选用相应的检验公式。十三、各种类型检验方法的适用条件各种假设检验的方法总结组别资料类型计量资料计数资料对称分布(正态或近似正态分布)偏态分布或分布不清正态近似成组设计配对设计两组比较大样本资料:U检验小样本资料:t检验秩和检验等非参数统计方法u检验四格表x2检验配对x2检验多组比较方差分析不常见行_列x2检验不常见注:对等级资料多采用秩和检验(

13、一)计量资料的u、t检验t检验的适用条件:当总体标准差;:未知样本含量n较小时理论上要求样本来自正态分布的总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。但在实际应用时与上述条件略有偏离对结果也影响不大。习惯规定样本含量小于或等于50(n<50)为小样本。u检验的适用条件:当总体标准差准差二已知(该情况不常见)时选用不用查u界值表只要记住几个常用的匸未知但样本含量n较大(一般n50)或总体标u检验。uu检验的适用条件:当总体标准差准差二已知(该情况不常见)时选用不用查u界值表只要记住几个常用的(二)计数资料的U检验样本率与总体率比较的U检验或两个样本率比较的U检验的适用条件

14、是:样本含量n足够大且样本率p和(1p)均不太小如np与n(1p)均大于5此时样本率的分布近似正态分布可利用正态分布的原理作u检验。(三)四格表资料的x2检验当n40,且所有T5时用x2检验的基本公式或四格表专用公式。2当n40,但有1<T<5时需用四格表x2检验的校正公式。若n<40,或TW1时需用确切概率计算法(四)行_列表资料的x2检验行_列表x2检验对理论频数的要求是:一般认为不宜有1/5以上格子数的理论频数小于5,或有1个格子的理论数小于1,否则将导致分析的偏性。(五)配对计数资料的x2检验b+c<40时需作连续性校正。应能结合实例掌握各种常见类型的假设检验方

15、法并能正确选择公式并对结果作合理解释。十四、统计图表按资料性质和分析目的选用适合的统计图形图形资料性质分析目的普通线图随时间呈连续变化的资料用线段的升降表达事物的动态(差值)变化直条图相互独立资料用直条长短表达数值大小直方图连续性变量的频数表资料用矩形面积表达各组段的频数(或频率)圆图及百分条图构成比资料用圆的扇形面积或直条各段的长度表达内部构成比散点图双变量资料用点的密集度和趋势表达两变量间相关关系卜五、直线相关回归分析的基本概念1.直线相关分析是研究两个连续型变量间有无线性关系以及关系密切程度的统计方法,而直线回归分析是研究两个连续型变量间的数量依存关系的。对两变量间的关系作直观描述。两变并作r对两变量间的关系作直观描述。两变并作r值的假设检验。只有当拒绝量间的相关密切程度的定量研究需要计算直线相关系数Ho时才能认为_与Y之间存在相关关系。3.直线回归分析的主要内容是建立直线回归方程:Y=a3.直线回归分析的主要内容是建立直线回归方程:Y=a+b_,其中b称为直线回归系数。对求得的样本回归系数要作假设检验。只有当拒绝Ho时才能认为_与Y之间存在直线回归关系。直线相关与回归分析既有区别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论