版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章绪论1 .卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。2 .卫生(医学)统计学的主要步骤P3设计;收集资料;整理资料;分析资料3 .(选择、判断)卫生统计学的基本概念P4同质(homogeneity):统计学中,若某些观察对象具有相同的特征或属性,称之为同质或具有同质性。变异(variation):将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。总体(population):是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。样本(sample):是从总体中随
2、机抽取的具有代表性的部分观察单位的集合。样本中包含的观察单位个数称为样本含量。参数(parameter):反映总体特征的指标称为参数,一般是未知的,常用希腊字母表示。统计量(statistic):根据也逑察值计算出来的指标称为统计量,常用拉丁字母表示。变量(variable):每个观察单位的某项特征或属性称为变量。抽样研究(samplingresearch):从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究。抽样误差(samplingerror):由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。资料(data):变量值的集合称之为资料。4.资料的
3、分类P4(1)定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。(2)定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。可进一步细分为两种资料:1)计数资料:指将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。包括:二项分类资料;无序多项分类资料2)等级资料:亦称有序多分类资料,是将观察单位按某特征或属性的程度或等级顺序分组,清点各组观察单位数所得的资料。第二章调查研究设计1.调查研究的特点P7(1)不能人为施加干预措施(与实验研究主要的区别)(2)不能随机分组(3)很难控制干扰因素(4)一般不能下因果结论
4、2.常用的抽样方法P911基本方法:单纯随机抽样;系统抽样;分层抽样(抽样误差最小);整群抽样(最大)综合应用:多阶段抽样。第三章实验设计1 .实验设计的基本要素(三个)处理因素;受试对象;实验效应2 .实验设计的基本原则(四点)对照;随机化;重复;均衡3 .常用的实验设计方案(1)完全随机设计一一又称随机对照试验,采用完全随机化分组方法将同质的实验单位分配到各处理组,各处理组分别接收不同的处理。优缺点:设计简单,易于实施,出现缺失值时仍可统计分析;小样本时,均衡性可能较差,抽样误差较大。(2)配对设计一一是将实验单位按一定条件配成对子,再将每对中的两个实验单位随机分配到不同处理组。优缺点:抽
5、样误差较小、实验效率较高,所需样本含量较小;当配对条件未能严格控制造成配对失败或欠佳时,会降低效率。(3)随机区组设计一一又称为配伍设计,是配对设计的扩大。是将几个条件相同的受试对象划成一个区组,将区组中的受试对象采用随机的方法,分配到不同的对比组中,接受不同的处理。优点:每个区组内的实验单位具有较好的同质性,比完全随机设计减少了随机误差,因而更易发现处理组间的差别,提高了实验效率。缺点:要求区组内实验单位数与处理组数相等,实验结果中若有数据缺失,统计分析较为麻烦。第四章定量资料的统计描述一、集中趋势的描述1 .算术均数一一又称均数(mean),是用一组观察值相加除以观察值的个数所得。样本均数
6、用X,总体均数用科。应用:适用于对称分布特别是正态分布资料。2 .几何均数一一是n个观察值乘积的n次方根,又称倍数均数,用G表示。应用:适用于对数正态分布;等比级数资料。观察值中不能有03 .中位数一一将一组观察值由小到大排序后,居于中间位置的数值即为中位数,用M表示。中位数的计算:频数表法一一用于频数表资料(2)频数表法;频数表资料一工力JM上lm中位数所在纽段下限/组跑G中位数所在组段的频数»中位数所在组段前一组的累计项数4 .百分位数一一是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用巳表示。5 .中位数与百分位数的应用P
7、55中位数:偏态分布资料一端或两端无确切值总体分布不明百分位数:非正态分布资料描述数值变量资料集中趋势的指标平均教意义应用场合均效平均数量水平对称分根尤其正态分布几何均数平均憎减信教等比、对数正态分布中位数位次居中的观察值水平偏态、分布不明确、分布末端无琥定值二、离散趋势的描述详见P5558/极差描述离散四分位间距趋势指标j标准差I-变异系数掌握以上四个指标的意义和应用。描述数值变量资料离散趋势的指标高融趋势指标篁义应用极差反映一组数据的表髓圉资料和四分位效间距反映金部观察位居中一半的君围资料不限方差和标盘差反映全部双察值之冏的变异勤适用于时称分布,尤正君变异系救标雅差相对于均数的大小适用于单
8、位不同或均数差别粒大的变量之间的比较二、正态分布及其应用P59601 .正态分布的概念及各个字母的含义2.正态分布的分布特征及规律详见P59分布特征:(1)正态曲线一一在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。(2)正态分布有两个参数,即位置参数和形状参数(3)正态曲线下面积的分布有一定的规律:正态曲线卜面积的分布有一定的规律口正态曲线与横轴之间的面积恒等于1或100%:对称分布,对称轴两侧的面积各为50%;在O储区间的面积为68.27%在一-1.96lx/+196<r)区间的面积为95.00%0,在1'.夕-皿区间的面积为99.00%3.
9、统计学家发现,可以使所有的正态分布转化为统一的的正态分布,该正态分布称为标准正态分布。这种变换称为标准化变换或Z变换。若X服从正态分布N,则Z就服从N0,1第五章定性资料的统计描述一、常用相对数及其应用1 .率正一指某现象实际发生数与可能发生某现象总数之比,说明某种现象发生的频率或强度,又称频率指标。玄某时期内实际发生某现象的观察单位数xK个同时期可能发生某现象的观察单位总数2 .构成比一一是事物内部某一观察单位数与事物内部各组成部分观察单位的总数之比,说明事物内部各部分所占的比重。常以百分数表示。构成比某一组成部分观察单位数o/同一事物各组成部分的观察单位总数100%3 .相对比一一相对比是
10、两个有关的指标之比,用以描述两者的对比水平。两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。相对比甲沙(或100%)乙指标二、应用相对数需注意的问题(4个)1 .计算相对数分母不宜过小2 .不能以构成比代替率3 .计算合计率时,不能简单地相加求平均4率的比较时应注意可比性三、率的标准化P72标准化法一一是在一个指定的标准构成条件下进行率的对比的方法。意义:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。当两组定性资料的内部构成明显不同时,不宜直接比较两组的总率(即平均率),否则有时会出现局部结果与整体结果相矛盾的现象。当统一标准后再进行计算,这种矛盾的现
11、象便会消失所采用的方法即标准化法。第六章总体均数和总体率的估计1 .抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。2 .标准误:样本均数的标准差称为均数的标准误,简称标准误。P78均数的标准误表示样本均数的变异度"n总体标准差未知时,用样本标准差代替SSX-.用途:衡量样本均数的可靠性;估计总体均数的可信区间;用于均数的假设检验。标准差与标准误的区别P79(1)意义不同:标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。(2)用途不同:标准差描述资料的频数分布情况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和
12、假设检验。(3)公式不同:sr(x-x)fs标准差:nn1;标准误:3.t分布P8081概念:从正态总体N(科2(T)中进行无数次样本含量为n的随机抽样,每次均可得到一个X和一个s,通过公式:X-IIS"转换,可得无数个t值,t值的分布即为t分布。特征:以0为中心,左右对称;t分布是一簇曲线,形状与自由度v有关;当Y趋于00时,t分布逼近标准正态分布;t分布曲线下面积为1。4 .总体均数的估计点估计一一用样本均数估计总体均数。区间估计一一按一定的概率(可信度,1-a)估计总体均数所在范围亦称总体均数的可信区间。5 .(选择、判断)95碗信区间的涵义P828395碗信区间意味着做100
13、次抽样,算得100个可信区间,平均有95个区间(或95%勺把握、95%勺可能性)估计正确。思考题(1)标准差与标准误有什么区别与联系?区别:详见前面知识点S-S一X:一SX联系:2n或Un标准误的大小与标准差成正比,与根号n成反比。(2)可信区间与正常值范围有什么不同?意义不同:可信区间是按一定的概率(可信度,1-a)估计总体均数所在范围;正常值范围则是指绝大多数“正常人”的解剖、生理、生化等指标的波动范围。公式不同用途不同:可信区间用于估计总体均数;正常值范围用于判断观察对象的某项指标正常与否。第七章假设检验1 .假设检验的描述两种假设可以总结为工HH由抽样误差引起烹,H、:N手再由本质差别
14、号I起j°解析:假设0,即认为的差别是由抽样误差造成的,则可用公式计算t值。卞据t值确定P值的大小,并作出推断。P小于或等于预先规定的概率值a(如0.05),则为小概率事件,即在一次抽样中发生的可能性很小,如果它发生了,则怀疑原假设0可能不成立,故认为其对立面0成立。2 .假设检验的基本思想应用反证法和小概率事件的原理,先对总体的参数或分布作出某种假设,在H0成立的条件下,再用适当的方法(如t检验)根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。3 .假设检验的基本步骤详见P9192/PPT格式要规范,注意下结论的用词!4.I型错误与II型错误P9293I型错误一一拒绝了实际上
15、成立的H。,犯“弃真”的错误。其概率大小用a表示,a可取单侧亦可取双侧。n型错误一一不拒绝了实际上不成立的H0,犯“存伪”的错误。其概率大小用3表示。3只取单侧,其大小一般未知,只有在已知两总体差值8,a及n时,才能估算出来。推断结论时可能出现的四种情况:推断结论万两类错误检验结果实际情况拒绝为不拒绝用名成立第一类错误(b)结论正确(I-叮)H不成立结论正确门-万)第二类错误(尸)5.单侧检验与双侧检验P95误用单侧检验会易犯I型错误;误用双侧检验会易犯n型错误。P>ao对于同一资料,凡双侧检验PW9单侧验必P<a;凡单侧检验P>a,双侧检验必6.假设检验应注意的事项P96(
16、1)应有严密的研究设计(2)正确理解a水准和P值的意义(3)正确理解结论的统计学意义(4)假设检验的结论不能绝对化第八章t检验概念:t检验是一种以t分布为基础,以t值为检验统计量的计量资料的检验方法。t检验的适用条件(4个)(1)总体方差(T未知;(2)样本含量n较小(n<60);(3)样本来自正态总体;2_2(4)两样本所来自的总体方差齐,即"1="2(注意:t检验都是针对总体下结论的!)应用:1 .样本与总体均数的比较tS/vn丫=2 .配对设计均数的比较v=n-1d-0_dt:3.两样本均数的比较v=n-1课本P100-106,掌握案例8-1、8-2、8-3、8
17、-7的资料分析和检验步骤。第九章方差分析方差分析的含义:方差是描述研究对象变异程度的一种指标。方差分析一一是一种以分析数据的变异为基础,以F值为统计量的计量资料的假设检验方法。方差分析的基本思想:根据资料的设计类型(即变异的不同来源),将全部观察值之间的变异(总变异)分解为两个或多个部分,除随机误差外其余每个部分的变异都可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。三种不同的变异之间的关系:ssS0间S%内总组间组内(9-4)将组间均方除以组内均方即得方差分析的统计量F:组间变异MS组间组内变异MS组内MS组
18、间SSB间,组间MS组内SSa内组内(9-5) 方差分析的应用条件:各样本须是相互独立的随机样本(独立性)各样本来自正态分布总体(正态性)各总体方差相等(方差齐性)方差分析常应用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t检验等价,即F=t2完全随机设计的方差分析P119 掌握案例9-1的资料分析和检验步骤SNK-q检验一一也称q检验,适用于探索性研究,对任意两个样本均数都进行检验。第十章卡方检验1 .概念:X检验是一种以笈分布为基础,以法。声反映了实际频数与理论频数吻合的程度x检验(Pearson卡方检验)基本公式:2 (AT)2T2值为检验统计量的计数资料的假设检验
19、方(差别的程度)。(R1)(C1)上式中A为实际频数,T为理论频数;R为行数,C为列数。主要用途:推断两个或两个以上总体率(或构成比)之间有无差别两变量间有无相关关系(有无关联)检验频数分布的拟合优度 2.2X2表的卡方检验的注意事项少廿;)基四格表资料筋检验的计算公式当。>40且所有T±5时; 2_(.4乃?基本公式为:/=乙2_(ad-be)2n专用公式为:N(口+8j(c+d)(o+c)(6十)当门*0但有KT<5时:人,(1"小。,5f校正的基本公式为:,一乙1、2(|id-如|一柱n校正的基本公式为;(订+b)(七+4当打<4。或T<1时采
20、用四格表确切概窣法以案例10-1为例,掌握列表和检验步骤3.配对设计2检验配对四格表资料/检验的计算公式当fr+r>40时:2_(b-C)2始计算公式为,x=TTT当fi+c<4fl:校正工计算公式为:7-b+c掌握课本P142表格的绘制、运算和检验步骤4.行X歹U(RXC)表资料的x2检验P143144知识点10-4RXC表资料的卡方检验可用于:1、多个样本率的比较2、两组构成比的比较3、多组构成比的比较适用条件:无T<1的理论数,并且1WT<5的格子数不超过总格子数的1/5。适用条件不满足时,可采用以下三种措施:增加样本含量:可以增大理论频数将理论频数太小的行或列与
21、性质相近的邻行或邻列中的实际频数合并:合并后可以产生较大的理论频数,但要注意相邻类别合并的合理性,合并后要有实际意义,合并后自由度应作相应调整删去理论频数太小的格子所对应的行或列。第一种措施为首选,但实际工作中实施起来较难后两种措施会损失部分信息,应慎用5.Fisher确切概率法条件:n40,或T1,或P时理论依据:超几何分布(非2检验的范畴)第十章非参数检验1.基本概念参数检验一一已知总体分布类型,对未知参数进行统计推断;依赖于特定分布类型,比较的是参数。非参数检验一一不依赖总体分布类型,不针对总体参数;不受总体参数影响,比较分布或分布位置。2.非参数检验应用范围:总体分布形式未知或分布类型
22、不明偏态分布的资料等级资料:不能精确测定,只能以严重程度优劣等级、次序先后等表示不满足参数检验条件资料:各组方差明显不齐数据的一端或两端是不确定数值,如“>50mg”3 .秩和检验 是一类常用的非参数统计分析方法 对数据从小到大排序,排序号在统计学上称秩 用数据的秩次代替原数据进行假设检验的方法4 .配对设计两样本比较以案例11-1为例,掌握检验步骤P154155编秩原则:按照差值的绝对值从小到大编秩差值为0者不参加编秩绝对值相等,符号相同时顺次编秩绝对值相等,符号相反时取平均秩次查表法下结论时,要注意T界值的“内大外小”原则计算分析步骤建立检验假设/:此二0II.:MdH0。-0,05
23、2、计算检验统计量7求差值”编秩求秩和,确定检验统计量值(任取或为统计量)3、确定产情,做而推断结论|S表法;用于有效对子数打£5。若丁值在上,卜界值范国内,则值大F相应的概率若丁值在上、下界值上或外,则产值小于等于相应的概率本例仇人,5,直附表6得双侧30_05N双侧005口一配108-钗5-50|5.两样本比较的秩和检验完全随机(成组)设计的两个样本比较,若不满足参数检验的条件(如t检验),可以用成组设计两样本比较的秩和检验方法,本法利用两样本观察值的秩和来推断样本分别代表的两总体分布是否相同。以案例11-3为例,掌握检验步骤P156157注意:以样本例数较少组的秩和为统计量To
24、 6.参数检验与非参数检验的比较参数检验与非参数检验比较分类优点缺点参数检脸(parametrictest)充分利用提供的信息,校验效能较高非参数检验(nooparametrictest)分布类型不作要求.适用范围广;可用于任何类型资料对总体分布类型有比较严格的要求,适用范围受到眼制一般犯第二类错谈的概率比参数检验大第十一章双变量关联性分析 1.相关分析的概念直线相关:又称简单相关,是用来描述具有直线关系的两变量x、y的相互关系的统计方法。应用条件:要求两变量均来自于双变量正态总体的随机变量;变量不分主次,处于同等地位。 2.相关系数的概念和意义直线相关系数:亦称Pearson积矩相关系数,是定量描述两个变量间直线关系的方向和密切程度的指标。总体相关系数用P表示,样本相关系数用r表示。r没有单位,取值介于-1与1之间;相关方向用正负号表示;相关的密切程度用绝对值表示,r绝对值越大,表示两变量相关关系密切程度越高。3 .t检验可用于双变量相关关系的检验。4 .直线相关分析的注意事项相关分析资料要求x、y都应是来自双变量正态总体的随机变量。进行相关分析前,应先绘制散点图。相关分析要有实际意义,不能把毫无关联的两个事物或者现象拿来做比较。不能只根据相关系数绝对值的大小来推断两个变量之间有无相关以及相关的密切程度,而必须对相关系数做假设检验。5.等级相关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年衢州职业技术学院单招(计算机)测试备考题库必考题
- 2026年河南水利与环境职业学院辅导员招聘备考题库附答案
- 2026年延边职业技术学院辅导员招聘备考题库附答案
- 2026年上海兴伟学院单招(计算机)测试模拟题库及答案1套
- 2025年黑龙江商业职业学院单招(计算机)考试备考题库必考题
- 2026年遂宁能源职业学院单招职业倾向性测试题库附答案
- 2026年黑龙江职业学院单招职业技能测试模拟测试卷附答案
- 2026年福建林业职业技术学院单招职业技能测试模拟测试卷附答案
- 2026年邯郸职业技术学院单招职业适应性考试题库附答案
- 2026年齐齐哈尔高等师范专科学校单招(计算机)测试备考题库及答案1套
- 《数控技术课件课题》课件
- 2023钢结构冷却塔技术规程
- 高分子材料在生活中的应用课件
- 人体发育学-第九章青春期发育-课件
- 药品生产现场管理与过程控制培训ppt
- 数据分析与SPSS软件应用(微课版)-课后习题答案1-10章全书章节练习题答案
- 风机及塔筒生产全流程检验分析课件
- 矿井工业场地总平面布置中的防洪设计docx
- 电大专科《建筑制图基础》期末机考试题
- 超星尔雅学习通《大学生心理健康教育(兰州大学版)》2022章节测试答案
- GB/T 39518-2020产品几何技术规范(GPS)使用单探针和多探针接触式探测系统坐标测量机的检测不确定度评估指南
评论
0/150
提交评论