医学统计学基础与科研分析思路课件_第1页
医学统计学基础与科研分析思路课件_第2页
医学统计学基础与科研分析思路课件_第3页
医学统计学基础与科研分析思路课件_第4页
医学统计学基础与科研分析思路课件_第5页
已阅读5页,还剩217页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 卫生统计学基础知识与科研资料分析思路医学统计学基础与科研分析思路 卫生统计学基础知识与科研资料分析思路医学统计学基础与科 内容医学统计学基础知识实验设计科研资料的分析思路医学统计学基础与科研分析思路 内容医学统计学基础知识医学统计学基础与科研 第一部分医学统计学基础知识医学统计学基础与科研分析思路 第一部分医学统计学基础知识医学统计内容一、医学统计学的定义二、统计学中的基本概念三、统计工作的步骤四、常见的抽样分布 五、描述性指标六、总体参数的估计 七、假设检验医学统计学基础与科研分析思路内容一、医学统计学的定义医学统计学基础与科研分析思路一、医学统计学的定义 统计学(statistics)是

2、认识社会和自然界中随机现象的数量特征的一门科学。自然界中存在的各种现象可归纳为两类: 必然现象在一定条件下必然发生的现象。(一定条件下其发生与否是确定的) 随机现象在同一条件下进行实验,一次实验结果不确定,而在一定数量的重复试验后呈现统计规律性的现象。医学统计学基础与科研分析思路一、医学统计学的定义 统计学(statistics)是认industrygovernmentbusinesseducationresearchfinancehealththe natural worldStatistics in .医学统计学的定义医学统计学基础与科研分析思路industrygovernmentbusi

3、nesseduc医学统计学 (medical statistics) 是运用概率论和数理统计学的原理与方法,研究医学和卫生学领域中随机现象有关数据的搜集、整理、分析与推断,进而阐明其客观规律的一门应用科学。医学统计学的定义医学统计学基础与科研分析思路医学统计学 (medical statistics) 是运二、统计学中的基本概念同质与变异变量 总体与样本抽样误差概率医学统计学基础与科研分析思路二、统计学中的基本概念同质与变异医学统计学基础与科研分析思路 同质与变异 - 同质(homogeneity) 影响研究指标较大的、可以控制的主要因素尽可能相同。 - 变异 (variation) 同质基础

4、上的各观察值间的差异称为变异。 变异可理解为同质基础上的个体差异。基本概念医学统计学基础与科研分析思路 同质与变异 - 同质(homogeneity) 变量 - 变量 (variable)搜集资料时,先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,这种特征称为变量。 - 变量值(value of variable) 变量的观察结果或测量值称为变量值,亦称为资料(data) - 变量按其值的性质可分为不同类型。基本概念医学统计学基础与科研分析思路变量 - 变量 (variable)搜集资料时,先要根据研 变量 - 变量的类型数值变量 (numerical variab

5、le)分类变量(categorical variable) - 无序分类变量(unordered categorical variable) 二项分类(binomial)、多项分类(multinomial) - 有序分类变量(ordinal categorical variable) 基本概念医学统计学基础与科研分析思路 变量 - 变量的类型基本概念医学统计学基础与科研分析 变量数值变量 其变量值是定量的,表现为数值大小,多有度量单位。由数值变量的测定值构成的资料称为计量资料(measurement data)或数值变量资料(numerical variable data)。 多数的数值变量为

6、连续型变量,如身高、体重、血压;但有的数值变量的测定值只是正整数,如心率、白细胞计数等,在医学统计学中也视为连续型变量。基本概念医学统计学基础与科研分析思路 变量数值变量 其变量值是定量的,表现为数值大小,多 变量分类变量 表现为互不相容的类别或属性,亦称定性变量。- 无序分类变量的各类别或属性之间无程度(或顺序)上的差别;所得资料称为计数资料(enumeration data)或无序分类变量资料(unordered categorical variable data);又有二项分类和多项分类之分。- 有序分类变量的各类别之间有程度(或顺序)的差别。所得资料称为等级资料(ranked data

7、)或有序分类变量资料(ordinal categorical variable data)。基本概念医学统计学基础与科研分析思路 变量分类变量 表现为互不相容的类别或属性,亦称定性 变量 注意!变量类型不是一成不变的,可根据分析的需要进行转化。 例,白细胞计数原属数值变量 若按正常、异常分组,则为无序分类变量; 若按过低(10000)分组,则为有序分类变量。 分类变量也可数量化:有序分类变量可用0、1、2、3、4表示;无序分类变量可用哑变量(dummy variable)表示。基本概念医学统计学基础与科研分析思路 变量 注意!变量类型不是一成不变的,可根据分析的需要 总体与样本 总体(popu

8、lation)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体所包含的范围随研究目的的不同而变化。 在医学科学研究中,研究对象可以是人、实验动物、微生物等;观察单位可以是一个地区、一个家庭、一个人、一只眼睛、一个细胞株、一个基因片段等。基本概念医学统计学基础与科研分析思路 总体与样本 总体(population)根据研究目的 总体与样本 有限总体与无限总体在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限的,称为有限总体 (finite population)。 总体是假设的,无时间和空间的限制,观察单位数是无限的,称为无限总体(infinite p

9、opulation)。 基本概念医学统计学基础与科研分析思路 总体与样本 有限总体与无限总体基本概念医学统计学基础与 总体与样本样本(sample)样本是按随机化原则从同质总体中抽取的部分观察单位其变量值的集合。样本须具有代表性。“代表性”的前提是来自同质总体、足够的观察单位数和随机抽样。样本中所含的观察单位个数称为样本含量 n 。随机化原则通常是指总体中的每个个体都有同样的机会被抽到样本中;但不同的研究目的,所采用的抽样方法不同,如单纯随机抽样、系统抽样、整群抽样和分层抽样等。基本概念医学统计学基础与科研分析思路 总体与样本样本(sample)样本是按随机化原则从同质总体 总体与样本 抽样研

10、究的目的是用样本信息去推断总体特征。描述样本特征的指标称为统计量(statistics);描述总体特征的指标称为参数(parameter)基本概念医学统计学基础与科研分析思路 总体与样本 抽样研究的目的是用样本信息去推断总体特征 抽样误差 抽样误差(sampling error) 由于个体变异的存在,抽样研究时,样本的统计量与总体参数往往不等;即使若干个样本是从同一总体中随机抽取的,各样本统计量也往往不等。这种因抽样研究所引起的各统计量之间以及统计量与参数之间的差异,称为抽样误差。 抽样误差在抽样研究中是不可避免的,但只要遵循随机化原则抽样的话,抽样误差的大小是可以估计的。基本概念医学统计学基

11、础与科研分析思路 抽样误差 抽样误差(sampling error) 抽样误差基本概念医学统计学基础与科研分析思路 抽样误差基本概念医学统计学基础与科研分析思路 概率随机事件概率小概率事件基本概念医学统计学基础与科研分析思路 概率随机事件基本概念医学统计学基础与科研分析思路 概率随机事件 (random event)对随机现象进行实验或观察称为随机试验(random trial)。随机试验的各种可能结果的集合称为随机事件(random event ),简称事件( event )。在一次随机试验中,某随机事件可能发生,也可能不发生;但在一定数量的重复试验后,某随机事件的发生与否是有规律的。基本概

12、念医学统计学基础与科研分析思路 概率随机事件 (random event)基本概念 概率概率(probability)是描述随机事件在一定条件下发生的可能性大小的一个度量,通常用P表示。对事件A,若有 ,则称A为必然事件;若 ,称A为不可能事件。随机事件A的概率为 。基本概念医学统计学基础与科研分析思路 概率概率(probability)是描述随机事件在一 概率小概率事件(small probability event)若随机事件A的概率 ,则称随机事件A为小概率事件。其统计学意义是小概率事件在一次随机试验中认为不可能发生。 “小概率”的标准 是人为规定的。在医学统计学中,通常设 ;但对于可能

13、引起严重后果的事件,如术中大出血等,可设 ,甚至更小。基本概念医学统计学基础与科研分析思路 概率小概率事件(small probability三、统计工作的步骤设计搜集资料整理资料分析资料医学统计学基础与科研分析思路三、统计工作的步骤设计医学统计学基础与科研分析思路 设计(design) 在保证科学性、可重复性和高效性的前提下,为验证研究假说而进行的周密安排。明确研究目的和研究假说,确定研究内容、观察对象与观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用。根据医学研究类型,有调查设计和实验设计之分。统计工作的步骤医学统计学基础与科研分析思路 设计(design

14、) 在保证科学性、可重复性和高效性 搜集资料(collection of data)遵循统计学原理原则:及时、准确、完整来源:统计报表 经常性工作记录 专题调查(或实验)资料储存:所搜集的原始记录,要妥善保存,并定期备份复制。统计工作的步骤医学统计学基础与科研分析思路 搜集资料(collection of data)遵循统计 整理之前的资料称为原始资料(raw data)目的:经科学分组与归纳,使原始资料系统化、条理化,便于计算统计指标和分析。过程:准确性审查(逻辑审查与技术审查)和完整性审查;拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行

15、数量分组;统计归纳。 整理资料(sorting data)统计工作的步骤医学统计学基础与科研分析思路 整理之前的资料称为原始资料(raw data) 整 分析资料(analysis of data)目的 计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计描述 (descriptive statistics)用描述性指标、统计表与统计图等,对样本资料的数量特征及其分布规律进行描述。统计推断(inferential statistics)如何抽样?如何用样本信息推断总体特征。统计分析时,要根据研究目的、设计类型、样本含量、资料类型及其分布特征选择恰当的统计指标和分析方法。统计工作的步

16、骤医学统计学基础与科研分析思路 分析资料(analysis of data)目的 计四、常见的抽样分布医学统计学基础与科研分析思路四、常见的抽样分布医学统计学基础与科研分析思路抽样分布 分布和 分布N(,2)N(0,1)标准正态分布以固定样本含量n抽样N(,2/n)Xt 分布00医学统计学基础与科研分析思路抽样分布 分布和 分布N(,2)N(0,1)标准正态分抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路t 值的分布称为 t 分布,由于s 随 n 的增大渐稳定于,故 越大,t 分布越逼近 u 分布。抽样分布医学统计学基础与科研分析思路t 值的分布称为 t 分布,抽样分

17、布医学统计学基础与科研分析抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路t 分布的分位数( t 界值)/2/21-t/2,-t/2,阴影部分表示 的概率抽样分布医学统计学基础与科研分析思路t 分布的分位数( t 界值)/2/21-t/2,1-t,t 分布的分位数( t 界值)阴影部分表示 的概率抽样分布医学统计学基础与科研分析思路1-t,t 分布的分位数( t 界值)阴影部分表示 抽样分布二项分布(binomial distribution)医学统计学基础与科研分析思路抽样分布二项分布(binom

18、ial distribution二项分布的应用条件 试验中只有对立的两类结果,每一个观察单位只能发生两种对立结果之一(即两分类资料); 已知其中一类结果的发生率为 ,其对立结果的发生率为 ; 在同一条件下,n 次试验是相互独立的,即各观察单位的观察结果相互独立。抽样分布医学统计学基础与科研分析思路二项分布的应用条件 试验中只有对立的两类结果,每一个观察抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路 Poisson分布抽样分布医学统计学基础与科研分析思路 Poisson分布抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科研分析思路抽样分布医学统计学基础与科

19、研分析思路 五、描述性指标 需根据研究目的、资料类型及其分布、样本含量选用恰当的描述性指标。数值变量资料的描述性指标分类变量资料的描述性指标医学统计学基础与科研分析思路 五、描述性指标 需根据研究目的、资料类型及其分布、样本数值变量资料的描述性指标集中趋势指标(central tendency)反映一组变量值的平均水平或中心位置。 - 均数、几何均数、中位数、调和均数和众数离散趋势指标(dispersion tendency) 反映一组变量值的变异(分散)程度。 - 全距、四分位数间距、方差、标准差、变异系数描述性指标医学统计学基础与科研分析思路数值变量资料的描述性指标集中趋势指标(centr

20、al ten集中趋势指标(数值变量)均数(mean) 适用于正态及近似正态分布的数值变量资料。 符号:样本均数( )、总体均数( ) 计算公式:直接法公式加权法公式(用于小样本资料)(用于频数表资料)描述性指标医学统计学基础与科研分析思路集中趋势指标(数值变量)均数(mean) 适用于正态及近例 随机抽取某地10名2030岁健康男性居民血清铁含量分别为:6.58,7.42,15.32,15.78,17.60,17.98 ,15.21,17.53,20.11,22.64。试求其平均血清铁含量。例 计算某地100名男大学生身高平均数描述性指标集中趋势指标(数值变量)医学统计学基础与科研分析思路例

21、随机抽取某地10名2030岁健康男性居民血清铁含量分几何均数(geometric mean) 适用于对数正态分布资料或等比级数资料。 符号:G 计算公式: 直接法(小样本资料)加权法(频数表资料)描述性指标集中趋势指标(数值变量)医学统计学基础与科研分析思路几何均数(geometric mean) 适用于对数正态例 9名麻疹易感儿接种麻疹疫苗一个月后,其血凝抑制抗体滴度为: 1:4,1:8,1:16,1:32,1:64,1:128,1:256,1:512,1:1024。试求其平均滴度。9名麻疹易感儿的平均抗体滴度为1:64。描述性指标集中趋势指标(数值变量)医学统计学基础与科研分析思路例 9名

22、麻疹易感儿接种麻疹疫苗一个月后,其血凝抑制抗体滴度例 某地区50名麻疹易感儿童接种麻疹疫苗1个月后,测其血凝抑制抗体滴度,如表中(1)、(2)栏,求平均抗体滴度。其血凝抗体滴度的平均滴度为1:57。 描述性指标医学统计学基础与科研分析思路例 某地区50名麻疹易感儿童接种麻疹疫苗1个月后,测其血凝中位数(median) 适用于任何分布类型的数值变量资料,常用于偏态分布资料及频数分布一端或两端无确切数值的数值变量资料。符号:M计算公式:加权法(频数表资料)(n为奇数时)直接法(小样本资料)(n为偶数时)描述性指标集中趋势指标(数值变量)医学统计学基础与科研分析思路中位数(median) 适用于任何

23、分布类型的数值变量资料,常例 5名成年男子的体重(kg)分别为 60、70、75、80、90,求中位数 例 6名成年男子的体重(kg)分别为 60,70, 75,80,82,90,求中位数 =(X3+X4)/2=(75+80)/2=77.5(kg)=75(kg)描述性指标集中趋势指标(数值变量)医学统计学基础与科研分析思路例 5名成年男子的体重(kg)分别为 60、70、75、8例 某疾病控制中心记录了199名沙门氏菌属食物中毒患者发病的潜伏期,并整理成表2-3中(1)、(2)栏,试计算其平均发病潜伏期。 (h)描述性指标医学统计学基础与科研分析思路例 某疾病控制中心记录了199名沙门氏菌属食

24、物中毒患者发病离散趋势指标(数值变量)全距(range) 亦称极差,适用于任何分布类型的资料。 符号:R 计算公式:描述性指标医学统计学基础与科研分析思路离散趋势指标(数值变量)全距(range) 亦称极差,适用于四分位数间距(quartile range) 适用资料类型同中位数。符号:Q或QR计算公式:描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路四分位数间距(quartile range) 适用资料类型同方差 (variance) 适用于正态和近似正态 分布资料计算公式:符号: ,样本方差 总体方差描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路方差 (var

25、iance) 适用于正态和近似正态计算公式标准差(standard deviation) 适用于正态和 近似正态分布资料计算公式:符号: ,样本标准差 总体标准差直接法(小样本资料)加权法(小样本资料)描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路标准差(standard deviation) 适用于正例 求表2-1中100名18岁男大学生身高的标准差。 描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路例 求表2-1中100名18岁男大学生身高的标准差。 描述性描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路描述性指标离散趋势指标(数值变量)医学统计

26、学基础与科研分析思变异系数(coefficient of variation)适用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异度。符号:CV计算公式:描述性指标离散趋势指标(数值变量)医学统计学基础与科研分析思路变异系数(coefficient of variation)分类变量资料的统计描述相对数:两个有关数值之比称为相对数常用的相对数:构成比、率、相对比描述性指标医学统计学基础与科研分析思路分类变量资料的统计描述相对数:两个有关数值之比称为相对数描述构成比(proportion),又称构成指标,它说明某事物(或现象)内部各组成部分所占的比重或分布,常以百分数表示。计算公式:

27、注意:所有组成部分的构成比之和应等于100%; 同一事物内部各组成部分的构成比,计算时 小数点后保留位数应相同。描述性指标分类变量资料医学统计学基础与科研分析思路构成比(proportion),又称构成指标,它说明某事物(率(rate),又称频率指标或强度指标,它说明某现象发生的频率或强度。计算公式:式中,K为比例基数,常用的K 有100%或1000、 10000/万、100000/10万等。选择K的要点:根据习惯用法以便于比较,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;恶性肿瘤死亡率用十万分率;使算得的率至少保留12位整数。描述性指标分类变量资料医学统计学基础

28、与科研分析思路率(rate),又称频率指标或强度指标,它说明某现象发生的频相对比(relative ratio),亦称比(ratio),是A、B 2个有关指标之比,说明A为B的若干倍或百分之几。A、B两个指标可以是性质相同的,也可以是性质不同的;两个指标可以是绝对数,也可以是相对数或平均数。计算公式为:描述性指标分类变量资料医学统计学基础与科研分析思路相对比(relative ratio),亦称比(ratio)A、B为同类指标时,相对比用以说明两事物的相对水平。常以百分数或倍数表示,如人口出生性别比、两病区病床数之比。流行病学中常用: 相对危险度(RR)、比数比(OR)也为此类。A、B为不同类

29、指标时,如人口密度(人/平方公里)、医生数/千人口、病床数/千人口、小鼠肝重与体重之比、变异系数等。相对比是相对数的最简单形式,常用于动态数列的分析。描述性指标分类变量资料医学统计学基础与科研分析思路A、B为同类指标时,相对比用以说明两事物的相对水平。常以百分描述性指标分类变量资料医学统计学基础与科研分析思路描述性指标分类变量资料医学统计学基础与科研分析思路 应用相对数时应注意的问题计算相对数的分母不宜过小 当分母观察例数足够多时,计算的相对数比较稳定,能够正确反映实际情况;当分母观察例数很少(如少于30)时,易受偶然因素的影响,不宜计算相对数,可用绝对数表示。如必须计算率,应同时列出可信区间

30、。某文章报道“5 名患者, 治愈3 人, 治愈率为60%”。该结论恰当否?分析: 该结论不恰当,当观察例数很少时, 分子每改变一个单位对结果的影响很大, 此时不宜计算相对数, 直接用绝对数描述即可。描述性指标分类变量资料医学统计学基础与科研分析思路 应用相对数时应注意的问题某文章报道“5 名患者, 治分析时不能以构成比代替率 构成比是说明某现象中各组成部分的比重或分布的指标,率则反映某现象发生的频率或强度的指标。应用时两者不能混淆。 描述性指标分类变量资料医学统计学基础与科研分析思路分析时不能以构成比代替率描述性指标分类变量资料医学统计学基础以比代率应用相对数的注意事项描述性指标医学统计学基础

31、与科研分析思路以比代率应用相对数的注意事项描述性指标医学统计学基础与科研分观察单位数不等的几个率,不能直接相加求其平均率 对观察单位数不等的几个率求平均率时,要用各率的分子之和与分母之和来计算。“用某疗法治疗肝炎, 甲医院治疗150 人,治愈30 人, 治愈率为20%; 乙医院治疗100 人, 治愈30 人, 治愈率为30%。则两个医院平均治愈率为( 20%+30%) /2=25%。”上述计算方法有无问题?分析: 该作者平均率的计算方法有误。两个医院共治疗250 人, 其中治愈60 人, 则平均治愈率为60/250=24%。应用相对数的注意事项描述性指标分类变量资料医学统计学基础与科研分析思路

32、观察单位数不等的几个率,不能直接相加求其平均率“用某疗法治疗比较相对数时应注意其可比性 影响率和构成比的因素很多。两个或多个率(构成比)比较时,各组间除研究因素外,其它影响因素要基本相同,即各组间要具有可比性。 注意: 各组的研究对象要同质,研究方法要相同,观察时间 相等以及内外环境条件相近。 所比较资料的内部构成要相同。 同一地区不同时期资料的对比,应注意客观条件有无变化。应用相对数的注意事项描述性指标分类变量资料医学统计学基础与科研分析思路比较相对数时应注意其可比性 应用相对数的注意事项描述性指标分对样本率(或构成比)的比较应遵循随机抽样,并做假设检验 遵循随机抽样的原则才能保证样本具有代

33、表性,才能用该样本信息推断总体特征。 抽样研究中,样本率或构成比也存在抽样误差,因此在比较两个或多个率(构成比)时,要做假设检验。应用相对数的注意事项描述性指标分类变量资料医学统计学基础与科研分析思路对样本率(或构成比)的比较应遵循随机抽样,并做假设检验应用相六、总体参数的估计数值变量资料 - 总体均数的估计 - 总体几何均数的估计 - 总体中位数的估计分类变量资料 - 总体率的估计 - 总体平均数的估计医学统计学基础与科研分析思路六、总体参数的估计数值变量资料医学统计学基础与科研分析思路总体均数的估计点值估计 (point estimation) : 用样本均数 作为总体均数 的点值估计。由

34、于抽样误差的存在, 往往不等于 。 区间估计 (interval estimation) : 按一定的概率100(1)%估计总体均数 所在的范围,亦称可信区间 (confidence interval, CI)。 常取95%和99%的可信度,即95%CI和99%CI。 总体参数估计数值变量资料医学统计学基础与科研分析思路总体均数的估计总体参数估计数值变量资料医学统计学基础与科研分总体均数的区间估计未知且n 小时, 按 t 分布原理计算, 总体均数(1-)100%的可信区间为:未知,但 n足够大时( n 100),t 分布近似 u 分布,按正态分布的原理估计可信区间。总体 均数(1-)100%的

35、可信区间为:总体参数估计数值变量资料医学统计学基础与科研分析思路总体均数的区间估计未知且n 小时, 按 t 分布原理计算,总体均数的区间估计已知时,按正态分布的原理估计可信区间。总体均数(1-)100%的可信区间为:总体参数估计数值变量资料医学统计学基础与科研分析思路总体均数的区间估计已知时,按正态分布的原理估计可信区间。总由20名18岁男大学生身高均数资料得, cm, cm,试估计该地18岁男大学生身高总体均数的95%可信区间。 n = 20 ,且 未知,双侧 即该地18岁男大学生身高总体均数的95%可信区间为170.70173.80cm 总体参数估计总体均数的区间估计数值变量资料医学统计学

36、基础与科研分析思路由20名18岁男大学生身高均数资料得, 总体参数估计总体均数总体几何均数的估计点值估计 用样本几何均数作为总体几何均数的点值估计。区间估计 总体参数估计数值变量资料医学统计学基础与科研分析思路总体几何均数的估计总体参数估计数值变量资料医学统计学基础与科总体中位数的区间估计 先求第50百分位数的上、下限: 下限 上限 再按 分别求 和总体参数估计数值变量资料医学统计学基础与科研分析思路总体中位数的区间估计总体参数估计数值变量资料医学统计学基础与总体率的估计点值估计:p 为 的点值估计。 由于抽样误差的存在,p 往往不等于 ,故通常用区间估计。区间估计:根据样本含量n的大小以及

37、p 是否远离0.5,可用查表法和正态近似法。总体参数估计分类变量资料医学统计学基础与科研分析思路总体率的估计点值估计:p 为 的点值估计。总体参数估计分类总体率的区间估计-查表法当样本含量n较小,如 ,特别是 p 很接近于0或1 (远离0.5)时,根据 n 和阳性数 X 查 “百分率的可信区间”表。某医院眼科医生用某种方法矫正30名近视眼患者的视力,其中8人近期有效,求该法近期有效率的95%CI。注意:由于附表7中X值只列出了 的部分, 当 时,应以 查表,再从100中减去查得的数值即为所求可信区间。总体参数估计分类变量资料医学统计学基础与科研分析思路总体率的区间估计-查表法当样本含量n较小,

38、如 总体率的区间估计-正态近似法当样本含量 n 足够大(如 ),且样本率p和 1-p均不太小,一般 n p 与n(1-p)均大于5时,样本率 p 的抽样分布近似正态分布,可用正态近似法。总体率 的可信区间可按下式进行估计 : 95CI为总体参数估计分类变量资料医学统计学基础与科研分析思路总体率的区间估计-正态近似法当样本含量 n 足够大(如在某镇按人口的1/20随机抽取520人,作汉坦病毒IgG抗体滴度实验,得肾综合症出血热隐性感染率为5.17,求该镇人群中肾综合症出血热隐性感染率的95%可信区间。本例 P=0.0517,该镇人群中肾综合症出血热隐性感染率的95%可信区间为3.27%7.07%

39、。 总体参数估计分类变量资料总体率的区间估计-正态近似法医学统计学基础与科研分析思路在某镇按人口的1/20随机抽取520人,作汉坦病毒IgG抗体总体平均数的估计点值估计:以 X 作为为 的点值估计。 由于抽样误差的存在,X往往不等于 ,通常用区间估计。区间估计:根据样本平均数X是否大于50,可用 查表法和正态近似法。总体参数估计分类变量资料医学统计学基础与科研分析思路总体平均数的估计点值估计:以 X 作为为 的点值估计。 由总体平均数区间估计-查表法当样本阳性数 时,用 查Poisson分布 的可信区间,可得总体平均数 的95%或99%可信区间。 例 将一个面积为100cm2的培养皿置于病房中

40、,1h后取出,培养24h,查得8个菌落,试估计该病房平均每100cm2细菌数的95CI。 本例 ,查附表4 ,得 的95%下限为3.4,上限为15.8,即该病房平均每100cm2细菌数的95可信区间为3.415.8。总体参数估计分类变量资料医学统计学基础与科研分析思路总体平均数区间估计-查表法当样本阳性数 总体平均数区间估计-正态近似法当样本阳性数 时,可按正态近似法估计 的可信区间: 总体参数估计分类变量资料医学统计学基础与科研分析思路总体平均数区间估计-正态近似法当样本阳性数 总体平均数区间估计-正态近似法用计数器测得某放射性物质2小时内发出的脉冲数为400个, 据此估计该放射性物质平均每

41、小时发出的脉冲数的95%可信区间。x=400,则平均每 2小时发出的脉冲数的95%CI为:平均每小时发出的脉冲数的95%CI为总体参数估计分类变量资料医学统计学基础与科研分析思路总体平均数区间估计-正态近似法用计数器测得某放射性物质七、假设检验假设检验的基本思想与步骤假设检验的数值变量资料的假设检验 - t 检验与u 检验 - 方差分析分类变量资料的假设检验 - 服从二项分布与poisson分布的假设检验 - 卡方检验秩和检验医学统计学基础与科研分析思路七、假设检验假设检验的基本思想与步骤医学统计学基础与科研分析 由于个体变异的普遍存在,抽样研究时,不可避免地存在着抽样误差。当根据样本资料求出

42、样本统计量后,遇到样本统计量与某一总体参数不等,或两个(多个)样本统计量不等时,首先要考虑到抽样误差的问题,还要考虑到样本统计量可能不是来自该总体。即有两种可能性:一种可能:样本是从该总体(或同一总体)中随机抽取的,其差异仅仅是由抽样误差造成的;另一种可能:样本不是从该总体(或同一总体)中随机抽取的,而是有本质上的不同,单纯用抽样误差解释不了。 如何判断?需进行假设检验。 假设检验假设检验的基本思想医学统计学基础与科研分析思路 由于个体变异的普遍存在,抽样研究时,不可避免地存在着抽假设检验假设检验的基本思想医学统计学基础与科研分析思路假设检验假设检验的基本思想医学统计学基础与科研分析思路假设检

43、验假设检验的基本思想医学统计学基础与科研分析思路假设检验假设检验的基本思想医学统计学基础与科研分析思路 2确定单、双侧检验 根据研究目的或专业知识确 定单侧检验(one-sided test)或双侧检验(two-sided test)。单侧检验要注明 假设检验假设检验的基本步骤(一)建立假设和确定检验水准医学统计学基础与科研分析思路 2确定单、双侧检验 根据研究目的或专业知识确 假(二)选定检验方法和计算统计量 根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。 假设检验假设检验的基本步骤医学统计学基础与科研分析思路(二)选定检验方法和计算统计量假

44、设检验假设检验的基本步骤医学假设检验假设检验的基本步骤医学统计学基础与科研分析思路假设检验假设检验的基本步骤医学统计学基础与科研分析思路假设检验数值变量资料的假设检验 t 检验医学统计学基础与科研分析思路假设检验数值变量资料的假设检验 t 检验医学统计学基础与科研假设检验 t 检验-数值变量医学统计学基础与科研分析思路假设检验 t 检验-数值变量医学统计学基础与科研分析思路假设检验 t 检验-数值变量单样本 t 检验 ( one sample t-test)医学统计学基础与科研分析思路假设检验 t 检验-数值变量单样本 t 检验 ( one s假设检验 t 检验-数值变量单样本 t 检验随机测

45、得26名男性汽车司机的脉搏平均数为73.7次/分,标准差为8.8/分。据此能否认为男性汽车司机的脉搏平均数高于一般男性脉搏数(72次/分)?医学统计学基础与科研分析思路假设检验 t 检验-数值变量单样本 t 检验随机测得26名男假设检验 t 检验-数值变量单样本 t 检验医学统计学基础与科研分析思路假设检验 t 检验-数值变量单样本 t 检验医学统计学基础与假设检验 t 检验-数值变量配对t 检验(paired t-test for dependent samples )医学统计学基础与科研分析思路假设检验 t 检验-数值变量配对t 检验(paired t- t 检验-数值变量配对t 检验假设

46、检验医学统计学基础与科研分析思路 t 检验-数值变量配对t 检验假设检验医学统计学基础与科研 t 检验-数值变量配对t 检验假设检验医学统计学基础与科研分析思路 t 检验-数值变量配对t 检验假设检验医学统计学基础与科研假设检验 t 检验-数值变量配对t 检验医学统计学基础与科研分析思路假设检验 t 检验-数值变量配对t 检验医学统计学基础与科研 t 检验-数值变量配对t 检验假设检验医学统计学基础与科研分析思路 t 检验-数值变量配对t 检验假设检验医学统计学基础与科研两样本t 检验(two-sample/group t-test for independent samples)假设检验 t

47、 检验-数值变量医学统计学基础与科研分析思路两样本t 检验(two-sample/group t-tes假设检验 t 检验-数值变量两样本t 检验医学统计学基础与科研分析思路假设检验 t 检验-数值变量两样本t 检验医学统计学基础与科 u检验数值变量资料的假设检验假设检验医学统计学基础与科研分析思路 u检验数值变量资料的假设检验假设检验医学统计学基础与科研分假设检验单样本u 检验(one sample u test) u检验-数值变量医学统计学基础与科研分析思路假设检验单样本u 检验(one sample u test假设检验两样本u 检验 two-sample u-test for inde

48、pendent samples u检验-数值变量医学统计学基础与科研分析思路假设检验两样本u 检验 two-sample u-test 用途:两个或多个样本均数间的比较分析两个或多个因素间的交互作用直线回归方程的假设检验多元线性回归方程的假设检验两个方差的齐性检验假设检验数值变量资料的假设检验 方差分析医学统计学基础与科研分析思路 用途:假设检验数值变量资料的假设检验 方差分析医学统计 应用条件:方差分析的应用条件基本同 检验:各样本是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等,即 。假设检验 方差分析-数值变量医学统计学基础与科研分析思路 假设检验 方差分析-数值变量医学统计

49、学基础与科研分析思假设检验分类变量资料的假设检验医学统计学基础与科研分析思路假设检验分类变量资料的假设检验医学统计学基础与科研分析思路假设检验分类变量资料的假设检验 检验医学统计学基础与科研分析思路假设检验分类变量资料的假设检验 检验医学统计学基础与假设检验 检验-分类变量医学统计学基础与科研分析思路假设检验 检验-分类变量医学统计学基础与科研分析思路假设检验 检验-分类变量医学统计学基础与科研分析思路假设检验 检验-分类变量医学统计学基础与科研分析思路假设检验 检验-分类变量医学统计学基础与科研分析思路假设检验 检验-分类变量医学统计学基础与科研分析思路 属非参数检验。 常用的方法有:配对设

50、计的符号秩和检验成组设计的两样本比较的秩和检验成组设计的多样本比较的秩和检验随机区组设计资料的秩和检验假设检验秩和检验医学统计学基础与科研分析思路 属非参数检验。假设检验秩和检验医学统计学基础与科研分析假设检验时应注意的事项 1.要有严密的抽样研究设计 样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即对比组间除处理因素(如新药和常规药)外,非处理因素(如年龄、性别、病程、病情轻重等)应尽可能相同。2.正确选用检验方法 应根据研究目的、设计类型、资料类型及其分布特征等选用适当的假设检验方法。 假设检验医学统计学基础与科研分析思路假设检验时应注意的事项 1.要有严密的抽样研究

51、设计 样本假设检验假设检验时应注意的事项医学统计学基础与科研分析思路假设检验假设检验时应注意的事项医学统计学基础与科研分析思路 第二部分 实验设计医学统计学基础与科研分析思路 第二部分 实验设计医 实验设计是科研计划的具体实施方案,是进行实验和统计分析的先决条件,是实验研究获得预期结果的重要保证。 科学合理的实验设计方案,不仅要根据研究目的确定研究内容、技术路线和方法,而且要能保证用较少的人力、物力、财力及时间进行实验,最大限度地减少误差,获得可靠的结果。 实验设计是专业设计和统计设计的有机结合。医学统计学基础与科研分析思路 实验设计是科研计划的具体实施方案,是进行实验和统 内容实验设计概述

52、常用实验设计方法医学统计学基础与科研分析思路 内容实验设计概述 医学统计学基础与实验设计的基本要素实验设计的基本原则实验设计概述医学统计学基础与科研分析思路实验设计的基本要素实验设计概述医学统计学基础与科研分析思路实验研究的目的是阐明处理因素作用于受试对象的效应。实验设计的基本要素:处理因素、受试对象和实验效应。实验设计概述实验设计的基本要素医学统计学基础与科研分析思路实验研究的目的是阐明处理因素作用于受试对象的效应。实验设计概 在实验过程中,影响实验结果的因素是多方面的,根据研究目的可分为处理因素和非处理因素两类。 处理因素是指研究者欲研究的因素,如:药物的种类、剂量、浓度、作用时间,某手术

53、方法的改进等外部因素;有时也可以是年龄、性别。 非处理因素是指对正确评价处理因素的作用有影响的因素,例如,病人的病情、病程等。 在设计中应注意以下几点: 实验设计概述实验设计的基本要素-处理因素 医学统计学基础与科研分析思路 在实验过程中,影响实验结果的因素是多方面的,根据研究目要分清处理因素和非处理因素 根据研究目的明确何为处理因素,何为非处理因素。如冷水试验。要抓主要因素 实验效应通常是多种因素作用的结果,由于人、财、物和时间所限,研究者不可能通过一次或几次实验把已知的所有因素都进行研究与分析,只能抓主要因素。处理因素必须标准化 处理因素标准化就是要保证处理因素在整个实验过程中始终如一,保

54、持不变。在实验设计时,必须制定处理因素标准化的具体措施和方法。实验设计概述实验设计的基本要素-处理因素 医学统计学基础与科研分析思路要分清处理因素和非处理因素 根据研究目的明确何为处理因素 受试对象选择的合适与否,也是实验研究是否成功的关键。 医学研究的受试对象有人、动物(标本)。 根据受试对象是动物还是人,选择受试对象时应注意以下几点:实验设计概述实验设计的基本要素-受试对象 医学统计学基础与科研分析思路 受试对象选择的合适与否,也是实验研究是否成功的关键。实动物的选择 实验研究中,动物的选择比较灵活,但要根据研究目的选择动物病例的选择 临床试验中,受试对象是病人。必须明确病例的纳入和排除标

55、准,还要符合医学伦理学要求,以及病人要有知情权实验设计概述实验设计的基本要素-受试对象 医学统计学基础与科研分析思路动物的选择 实验研究中,动物的选择比较灵活,但要根据研究目 实验效应是通过某些观察指标定量或定性地反映实验结果。研究者应对欲研究的问题有较为全面的了解,以便选择恰当的观察指标来反映实验结果。选择观察指标的原则:客观性、关联性、灵敏性、特异性、精确性。指标的观察:对实验效应的观察应避免偏倚。 实验设计概述实验设计的基本要素-实验效应 医学统计学基础与科研分析思路 实验效应是通过某些观察指标定量或定性地反映实验结果。研对照(control)随机(randomization)重复(re

56、plication)均衡(homogeneity)实验设计概述实验设计的基本原则医学统计学基础与科研分析思路对照(control)实验设计概述实验设计的基本原则医学统计 设立对照组的目的在于消除非处理因素对实验效应的影响,使处理因素的实验效应反映出来。 设立对照时,实验组与对照组的非处理因素必须相同。 其原理可用以下符号表达:实验设计概述实验设计的基本原则-对照医学统计学基础与科研分析思路 设立对照组的目的在于消除非处理因素对实验效应的影响,使 实验设计概述实验设计的基本原则-对照医学统计学基础与科研分析思路 实验设计概述实验设计的基本原则-对照 常用的对照形式有以下几种空白对照 对照组不施加

57、任何处理因素。在临床试验中,一般不用空白对照。实验对照 对照组不施加处理因素,但施加某种实验因素。标准对照 不设立专门的对照组,用现有标准值或正常值作对照。实验设计概述实验设计的基本原则-对照医学统计学基础与科研分析思路 常用的对照形式有以下几种实验设计概述实验设计的基本原则-自身对照 对照与实验在同一受试者身上进行,如用药前后、不同部位、同一标本的不同测定方法。一般情况下要求设立平行对照组。相互对照 不单独设立对照组,而是两个或几个试验组相互对照。配对对照 把条件相同的两个研究对象配成一对,分别给以不同的处理因素,对比两者之间的不同效应。配对对照常用于动物实验。 实验设计概述实验设计的基本原

58、则-对照医学统计学基础与科研分析思路自身对照 对照与实验在同一受试者身上进行,如用药前后、不同历史对照 以本人过去的研究或他人研究结果与本次研究结果作对照。除了非处理因素影响较小的少数疾病外,一般不宜使用这种对照。用时要特别注意资料的可比性。实验设计的基本原则-对照实验设计概述医学统计学基础与科研分析思路历史对照 以本人过去的研究或他人研究结果与本次研究结果作对 所谓随机,就是每一个受试对象都有同等的机会被分配到任何一个组中去,分组的结果不受人为因素的干扰和影响。 随机化分组可达到实验组和对照组均衡的目的。 常用随机数字表和随机排列表来随机分组。 实验设计概述实验设计的基本原则-随机医学统计学

59、基础与科研分析思路 所谓随机,就是每一个受试对象都有同等的机会被分配到任何 所谓均衡是指各组间除处理因素不同外,非处理因素均相同.实验设计概述实验设计的基本原则-均衡医学统计学基础与科研分析思路 所谓均衡是指各组间除处理因素不同外,非处理因素均相同. 所谓重复,就是实验要有足够的样本含量。影响样本含量大小的因素有: 检验水准 , 越小,样本含量 越大; 检验效能 ,检验效能越大,样本含量 越大; 处理组间的差别 , 越小,样本含量 越大; 标准差 , 越大,样本含量 越大。 常用的估计样本含量的方法:查表或用公式 实验设计概述实验设计的基本原则-重复医学统计学基础与科研分析思路 所谓重复,就是

60、实验要有足够的样本含量。影响样本含量大小1. 样本均数与总体均数的比较 实验设计概述实验设计的基本原则-重复医学统计学基础与科研分析思路实验设计概述实验设计的基本原则-重复医学统计学基础与科研分析 2. 配对设计和交叉实验设计的 样本含量估计式中,N为实验所需的对子数目。实验设计概述实验设计的基本原则-重复医学统计学基础与科研分析思路 2. 配对设计和交叉实验设计的 样本含量估计式3. 两样本均数比较 式中,N为每组所需的样本例数。实验设计概述实验设计的基本原则-重复医学统计学基础与科研分析思路3. 两样本均数比较 式中,N为每组所需的样本例数。实验设计4. 样本率与总体率的比较 式中,N为所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论