




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,假设检验的基本原理,主要用于判断两个或多个参数间的差别有无统计学意义。 首先建立假设,然后看假设的事件发生的概率 P ,通过比较 P 与 的大小作出统计推断。,2,假设检验的一般步骤,1.建立检验假设,确立检验水准 无效假设 H0: 0 备择假设 H1: 0或0( 0 ) 检验水准,是预先规定的概率值,它确定了 小概率事件的标准。,3,2. 选定检验方法和计算检验统计量 根据假设检验的目的和研究设计的类型选用不同的检验方法。检验的具体方法,通常以选定的检验统计量来命名。,4,3. 确定 P 值,做出统计结论 P值是指在无效假设 H0 成立的前提下,获得大于等于(或小于等于)现有统计量的概率
2、。P:就是 H0 成立的概率。,当P时,按检验水准,拒绝H0,接受H1; 当P时,按检验水准,不拒绝H0。,5,第四节 t 检验与 u 检验,6,掌握: t 检验和u 检验(应用条件、方法选择、分析步骤),本节课学习目的与要求,7,1. u 检验应用条件: 已知; 未知但 n 较大(n100) 2. t 检验应用条件: 未知且 n 较小(n100)时,要求样本来自正态 总体; 两个小样本均数比较时,要求两样本所属总体 的方差齐。,应用条件,8,单样本(one sample t test) t检验 配对样本(paired t test) 两独立样本(two independent samples
3、 t-test) 单样本 两独立样本,数值变量 假设检验,u检验,9,比较的目的是推断样本均数代表的总体均数是否与一已知的总体均数0相同,0一般为理论值、标准值或经过大量观察所得的稳定值等。 根据 是否已知和样本含量 n 的大小,选用 u 检验或 t 检验。,一、样本均数与总体均数的比较,10,=n-1,(一)u 检验,当 未知而 n 较大时(n100),可用 S 代替 估计 u 值。,11,例 某市某年抽查了150名2岁男孩的体重,得平均 体重为11.18kg,标准差为1.23kg。而同期全国九城 市大量调查得同龄男孩的平均体重为11kg(此调查 结果可作为总体均数)。问该市2岁男孩的平均体
4、重 与全国的同期水平有无差别?,12,1. 建立假设,确定检验水准 H0: =0, 2岁男孩的平均体重与全国的同期 水平无差别 H1: 0 , 2岁男孩的平均体重与全国的同 期水平有差别 = 0.05 2. 选定检验方法,计算统计量,13,3. 确定 P 值,作出推断结论 u值 P 值 结 论 u0.05 0.05 接受H0,差别无统计学意义 u0.05 0.05 拒绝H0,接受H1,差别有 统计学意义,14,本例 u=1.792,u0.05 =1.96,u=1.792 u0.05 =1.96。 因此P0.05,说明在 a=0.05 水准上,接受H0, 根据现有样本信息,尚不能认为该市 2 岁
5、男孩的 平均体重与全国的同期水平不同。,15,=n-1,(二)t 检验,当 未知而 n 较小时,样本均数与总体均数的比较用 t 检验。,16,例14 15例长期服用某种避孕药的妇女,其 血清胆固醇含量的均数为6.5 mmol/L,标准差 为0.7 mmol/L,一般健康妇女血清胆固醇含量 的均数为4.4 mmol/L ,问长期服用该种避孕药 的妇女其血清胆固醇含量的均数与一般健康妇 女有无差别?,17,1. 建立假设,确定检验水准 H0: =0=4.4 H1: 0 = 0.05 2. 选定检验方法,计算统计量,11.619,18,3. 确定 P 值,作出推断结论 t值 P 值 结 论 t0.0
6、5 0.05 接受H0,差别无统计学意义 t0.05 0.05 拒绝H0,接受H1,差别有 统计学意义,19,v = n -1 = 15-1 =14,查 t 界值,t0.05, 14 = 本例 t = 11.619 t0.05, 14 ,故 P0.05。 因此在 a =0.05 水准上,拒绝H0,接受H1,可 认为长期服用该种避孕药的妇女其血清胆固醇 含量均数与一般健康妇女的差别有统计学意义。,2.145,,检验步骤,首先假定H0是成立的, 0.05,在此前提下计算统计量,根据其分布函数,通过查该分布的界值表,得到大于或等于此统计量值的概率P,21,配对的主要形式有: 同源配对 同一受试对象处
7、理前后的数据; 同一受试对象两个部位的数据; 同一样品用两种方法(仪器)检验的结果; 异源配对 配对的两个受试对象分别接受两种处理后的数据。 配对目的:推断两种处理(方法)的结果有无差别。,二、配对设计的差值均数与总体均数0的比较,22,=n-1,其中 为差值的均数, 为差值的标准差, 为差值的标准误,n 为对子数。,Paired t test,23,例15 按性别、年龄相近、病情相近把 16 例某 病患者配成 8 对,每对分别给予A药和B药治疗, 现测得治疗后血沉(mm/h)结果如表15-8, 问不同药物治疗后病人血沉水平是否有差别?,24,25,1. 建立假设,确定检验水准 H0: d =
8、 0 H1: d0 = 0.05 2. 选定检验方法,计算统计量,26,3. 确定 P 值,作出推断结论 v = n 1 = 8 1 = 7,查 t 界值表,t0.05,7=2.365 本例 t = 4.582 t0.05,7 ,所以 P0.05。 结论:在 a = 0.05 水准上拒绝 H0,接受 H1,可认为不同药物治疗后病人血沉水平不同。,27,例 有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应直径(mm)如下表,问两种结核菌素的反应性有无差别?,28,12名儿童分别用两种结核菌素皮肤浸润反应
9、结果,被检测者号 标准品 新制品 d d2 (1) (2) (3) (4)=(2)-(3) (5) 1 12.0 10.0 2.0 4.00 2 14.5 10.0 4.5 20.25 3 15.5 12.5 3.0 9.00 4 12.0 13.0 -1.0 1.00 5 13.0 10.0 3.0 9.00 6 12.0 5.5 6.5 42.25 . . . . . . . . . . 12 10.5 9.5 1.0 1.00 合计 39 ( ) 195,29,1. 建立检验假设,确定检验水准,H0: d = 0 ,即两种结果相同 H1: d 0 ,即两种结果不同 =0.05(双侧检验)
10、 2. 计算检验统计量 已知: d=39 d2 =195,30,3. 确定P值,作出推断结论 =n-1=12-1=11 t0.05(11)=2.201 t0.01(11)=3.106 本例t = 4.5195 t0.01(11) ,P0.01,差别有高度统计学意义, 按=0.01水准,拒绝H0,接受H1,可认为两种方法皮肤浸润反应结果不同。,31,例 设有12名志愿受试者服用某减肥药,服药前和 服药后一个疗程各测量一次体重(kg),数据 如下表。问此减肥药是否有效?,32,某减肥药研究的体重(kg)观察值 个体号 服药前 服药后 d d2 (1) (2) (3) (4)=(3)-(2) (5)
11、 1 101 100 -1 1 2 131 136 5 25 3 131 126 -5 25 4 143 150 7 49 5 124 128 4 16 6 137 126 -11 121 7 126 116 -10 100 8 105 115 10 100 9 100 97 -3 9 10 107 97 -10 100 11 94 84 -10 100 12 101 109 8 64 合计 d= -16 d2=710,33,1. 建立假设,确定检验水准 H0: d = 0,即该减肥药无效 H1: d0 ,即该减肥药有效 单侧= 0.05 2. 选定检验方法,计算统计量,34,3. 确定 P
12、值,作出推断结论 v = n 1 = 12 1 = 11,查 t 界值表,t0.05,11=1.796(单侧) 本例 t = 0.58 t0.05,11 ,所以 P 0.05。 结论:在 a = 0.05 水准上不拒绝 H0,可认为服用该减肥药前后体重差异无统计学意义。,35,两种类型: 选择一定数量的观察单位,将它们随机分为两组或多组,分别给予不同处理; 从两组或多组具有不同特征的人群中,分别随机抽取一定 数量的样本,比较某一指标在不同特征人群中是否相等。 比较目的:推断两样本各自代表的总体均数1 和2 是否相同。,三、完全随机设计两个样本均数的比较,36,=n-1,(一)u 检验,当两样本
13、含量均较大时,如均大于100,可用下式进行 u 检验。,式中 为两样本均数之差的标准误。,37,例 某医师为研究血清胆固醇水平与职业的关系, 得调查资料如下表,问这两种职业的血清胆 固醇水平是否不同?,38,两种职业血清胆固醇水平/(mmol/L),职业类型 人数 均值 标准差 教师 537 4.8 0.72 工人 643 4.6 0.81,39,1. 建立假设,确定检验水准 H0: 1=2,两种职业的血清胆 固醇水平相同 H1: 12 ,两种职业的血清胆 固醇水平不同 = 0.05 2. 选定检验方法,计算统计量,40,3. 确定 P 值,作出推断结论 查 u 界值表,u0.05 = 1.9
14、6,u = 4.488 u0.05 所以,P0.05。 结论:在 a = 0.05 水准上,拒绝H0,接受H1,两种职业血清胆固醇水平的差异有统计学意义,可认为教师的血清胆固醇水平高于工人。,41,=n-1,(二)t 检验,t 检验用于两样本含量 n1、n2 较小时,要求样本来自正态分布总体,且要求两总体方差相等(又称方差齐性)。,42,式中 为两样本均数之差的标准误; 为两样本合并方差。,43,例16 某医师分别抽取原发性高血压病人25例和脑卒中病人27例,测定其尿酸的含量,结果见表15-9。问原发性高血压病人和脑卒中病人的尿酸含量有无差别?,44,表 15 9 原发性高血压病人与脑卒中病人
15、的尿酸含量(mmol/L),组别 例数 均数 标准差 原发性高血压 25 221.7 86.1 脑卒中 27 246.5 96.9,45,1. 建立假设,确定检验水准 H0: 1 = 2,原发性高血压病人和脑卒中 病人的尿酸含量无差别 H1: 12 ,原发性高血压病人和脑卒中 病人的尿酸含量有差别 = 0.05,46,2. 选定检验方法,计算统计量,47,3. 确定 P 值,作出推断结论 v = (n1-1)+(n2-1)=(25-1)+(27-1)=50 查 t 界值表,t0.05, 50 = 2.009, t = 0.973 t0.05, 50 所以,P0.05。 结论:在 a = 0.0
16、5 水准上,不拒绝H0,尚不能认为原发性高血压和脑卒中病人的尿酸含量不同。,48,单样本(one sample t test) t检验 配对样本(paired t test) 两独立样本(two independent samples t-test) 单样本 两独立样本,数值变量 假设检验,u检验,49,第五节 方差分析(Analysis of Variance),方差分析由英国统计学家R.A.Fisher在1923年提出,为纪念Fisher,以F 命名,故方差分析又称 F 检验。,50,例17 某研究者将 27 只雄性大鼠随机分成 三组(每组 9 只),给予不同处理后 3 周, 测定血清中的
17、SOD(超氧化物歧化酶)活性。 结果见下表。问三组的SOD活性是否相同?,51,三组大鼠血清中SOD活性/(mol/L),想一想,可否用 t 检验?,多次使用ttest,使犯第类错误(假阳性错误)的概率增大; 资料的利用率很低,统计量所对应的自由度减小,结论不可靠; 分裂了原先的整体设计,结论片面。,试想假设检验时通常检验水平取0.05,亦即弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,总可靠度成为(1-0.05)3=0.857 4个均数比较作6次 (1-0.05)6=0.735 5均数比较作10次 (1-0.05)10=0.599 6均数比较作15次 (1-0.05)15
18、=0.463,54,方差分析(analysis of variance,ANOVA)又称变异数分析或 F 检验。 主要原理:将各组数据的总变异按设计及研究目的分为若干部分,再计算各部分的均方,两均方之比为 F 值。F 值与 F 临界值比较,决定 P 值大小,再根据 P 值大小推断结论。,55,基本思想:按分析目的和设计把全部数据之间 的总变异分成两部分或更多部分,然后借助F 分布作出统计推断。 总变异 = 组间变异 + 组内变异,56,用途: 两个或两个以上样本均数的比较; 分析一个、两个或者多个因素的作用和影响; 分析因素之间的独立作用或交互作用; 两样本或多样本的方差齐性检验。,用途和适用
19、条件,57,适用条件: 各样本是相互独立的随机样本; 各样本来自正态总体; 各处理组总体方差相等(齐性)。,58,类型,单因素方差分析(one-way ANOVA)也称完全随机设计的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个水平对试验结果的影响。 双因素方差分析( two-way ANOVA)也称随机区组设计的方差分析,双向或双方式方差分析,该设计可分析两个因素。一个为处理因素,一个为区组因素。,59,三因素方差分析也称拉丁方设计(Latin square design)的方差分析,该设计可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。 析因设计
20、的方差分析(factorial design)当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计进行分析。该设计不仅可以分析多个因素的独立作用,也可分析多个因素之间的交互作用,是一种高效率的方差分析方法。,60,单因素方差分析(one-way ANOVA)也称完全随机设计的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个水平对试验结果的影响。,一、完全随机设计多个样本均数比较,方差分析的数据格式,Xij第i 个组的第j 个观察值 i=1,2,k j=1,2,ni ni第i 个处理组的例数 ni=N , =第i组的均数= =总的均数=,各种符号的意义,有关方差分析的几个概念
21、,什么是方差? 离均差 离均差之和 离均差平方和 SS,方差(2 , S2 )也叫均方(MS) 自由度: =N-1 关系: MS= SS/ =,65,基本思想:按分析目的和设计把全部数据之间 的总变异分成两部分或更多部分,然后借助F 分布作出统计推断。 总变异 = 组间变异 + 组内变异,66,三组大鼠血清中SOD活性/(mol/L),从这个表,可以看到三种变异: 组内数据的变异 组内变异 三组之间数据的变异 组间变异 全部数据间的变异 总变异,67,组间变异主要受到处理因素和个体误差两方面影 响,组内变异主要受个体误差的影响。当H0为真时, 由于处理因素不起作用,组间变异只受个体误差的影 响
22、。此时,组间变异与组内变异相差不能太大,两部 分的均方(方差)也相差不大,其比值 F 值接近1。 如果比值远远大于1,如大于3-5倍时,则处理因 素就产生作用,影响了数据的结果。,68,离均差平方和与其自由度之比在方差分析中称为 均方(记作MS),当 H0 为真时,组间均方与组内 均方相差不大,两者比值 F 值约接近于1。即 F = 组间均方 / 组内均方 1,69,当H0不成立时,处理因素产生了作用,使得组间均方增大,此时 F 1,当大于等于F 临界值时,则P0.05,可认为H0不成立,各样本均数不全相等。,70,F 值与 F 分布,组间均方与组内均方的比值称为 F 统计量,服从 F 分布,
23、即:,如果 H0 成立,即各处理组的样本来自相同总体,处理因素没有作用,则组间变异同组内变异一样,只反映随机误差作用的大小。,71,4.3.3 F分布,图4-3 不同自由度时的F分布曲线,F分布有两个自由度,第一自由度()是分子的自由度,第二自由度()是分母的自由度。,F分布是方差比的分布,常用于方差齐性检验、方差分析等。,72,变异的分割及其意义,总变异=组内个体差异+组间差异,73,组内变异( SS 组内 ),组内各个观测值 X i j 与本组内均值 之差 的平方和。反映了组内(同一水平下)样本的随 机波动。,74,组间变异( SS 组间),组内均值 与总均值 之差的平方和。反 映了处理因
24、素各个水平组间的差异,同时也包含 了随机误差。,75,总变异( SS 总 ),全部测量值大小不同,这种变异称为总变异, 以各测量值 X ij与总均数 间的差异度量。,76,总变异、组间变异、组内变异的关系:,对应自由度的关系:,77,均方(mean square),离均差平方和大小: 与变异程度大小有关 与其自由度大小有关 将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(MS)。,78,方差分析表,79,例17 某研究者将 27 只雄性大鼠随机分成 三组(每组 9 只),给予不同处理后 3 周, 测定血清中的SOD(超氧化物歧化酶)活性。 结果见下表。问三组的SOD活性是否相同
25、?,80,三组大鼠血清中SOD活性/(mol/L),从这个表,可以看到三种变异: 组内数据的变异 组内变异 三组之间数据的变异 组间变异 全部数据间的变异 总变异,81,82,1. 建立假设,确定检验水准 H0: 1 = 2 = 3 H1: 1、2 、 3 不等或不全相等 = 0.05,83,2. 选定检验方法,计算统计量,84,85,3. 确定 P 值,作出推断结论 以 v组间 为 v1 ,以 v组内 为 v2,查附表 F 界值表, 得F0.01(2,24)=5.61,本例 F F0.01(2,24),故 P0.01。 结论:按 a = 0.05 检验水准,拒绝 H0,接受 H1,可认为三组
26、的 SOD 活性有差别,但不能认为任何两组SOD活性均有差别。,86,87,P197200,88,表 15 12 例 17 资料的方差分析表,89,二、随机区组设计资料的方差分析,随机区组设计(randomized block design)又 称为配伍组设计,涉及处理因素(主要因素) 和区组因素(配伍组因素,个体特征),故随 机区组设计的多个样本均数比较分析又称两因 素方差分析。,90,随机区组设计资料常见情况:,区组设计资料:先将全部观察对象按某种或某些 特征分为若干个区组,每个区组的观察对象数等于 处理组数 k,然后将同一区组的 k 个对象随机分配 到 k 个不同的处理组所得到的数据资料
27、; 同一个对象的k个部位测定同一指标所得的数据 资料; 同一样品用多种不同方法测定同一指标所得的数 据资料。,91,随机区组设计资料数据结构,92,变异分解,总变异SST可分解为: 处理因素的变异SSA SSA 反映了各个水平组间的差异(包含随机误差) 区组因素的变异SSB SSB 反映了各个区组间的差异(包含随机误差) 随机误差SSe SSe 反映了样本的随机波动,三者的关系如下:,93,方差分析表,94,例18 按性别相同、年龄相近、病情相近 把 33 例某病患者配成 11 个区组,每区组 3 个 患者,分别给予A 药、B 药和 C药治疗。治疗 后患者血浆中的 IGA 含量见表15-14。
28、问经三 种不同药物治疗后该病患者血浆中IGA含量有 无差别?,95,区组号 A药 B药 C药 1 1.67 1.77 2.10 5.54 2 2.04 2.03 2.07 6.14 3 1.38 1.45 1.48 4.31 4 1.02 1.09 1.07 3.18 5 1.29 1.15 1.92 4.36 6 1.32 1.05 1.28 3.65 7 1.17 1.26 1.08 3.51 8 2.12 1.87 2.07 6.06 9 1.64 1.72 1.65 5.01 10 1.75 1.85 2.45 6.05 11 1.65 1.56 1.38 4.59 n i 11 1
29、1 11 33(N) 17.05 16.80 18.55 52.40( ) 1.55 1.53 1.69 27.64 26.87 33.44 87.95( ),表 15-10 三种不同药物治疗后某病患者血浆IGA含量,96,处理间: H0: 1 = 2 = 3,即三种不同药物治疗后IGA 含量的总体均数相等; H1: 1、2 、 3 不等或不全相等 = 0.05 区组间: H0: 1 = 2 = 11,即11个区组的IGA含量的 总体均数相等; H1: 1、2 、 11 不等或不全相等 = 0.05,1. 建立假设,确定检验水准,97,2. 选定检验方法,计算统计量,98,99,对于三种药物,以v处理为 v1 ,以v误差为v2,查F界值表得:F0.05(2,20)=3.49,本例F处理=2.2893 F0.05(2,20),故P 0.05。按a= 0.05 检验水准,不拒绝 H0,即尚不能认为三种不同药物治疗后该病患者血浆中IGA含量不同。,3. 确定 P 值,作出推断结论,100,对于区组,以v区组为 v1 ,以v误差为v2,查F界值表得:F0.05(10,20)=2.3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 风电工程管理培训课件
- 风电工程培训课件
- 血尿手术患者护理常规
- 宫腹腔镜护理常规
- 颐和园介绍教学课件
- 幼儿园常规教育我爱喝水
- 垃圾分类与中班健康教育
- 《网页设计与制作》课件-第6章Flash动画制作
- 预防艾滋病的课件
- 预防校园主题班会课件
- 《思想道德与法治》学习通课后章节答案期末考试题库2025年
- 清廉讲堂活动方案
- 家居落地活动方案
- 2025年医保知识考试题库及答案:医保信息化建设应用法律法规试题
- 环境现场采样培训
- 2025年 汕头市公安局警务辅助人员招聘考试笔试试卷附答案
- 车辆伤害事故桌面功能演练方案、脚本
- XX公司年产10万吨阳极铜及5万吨铜杆项目环境影响报告书
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案
- 财务考试试题及答案大全
- 2024-2025学年人教版数学五年级下学期期末试卷(含答案)
评论
0/150
提交评论