版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、单组与配对设计定量资料的统计分析,去年东北玉米的平均亩产量为382公斤,今年春季遭遇了低温天气,但是由于应对措施得当,同时采用了一系列新品种,预计平均亩产量高于去年。现调查得到20亩玉米的亩产量数据如下,试对该数据进行分析。 355.73 360.37 400.40 451.59 456.86 422.41 397.96 427.49 366.74 441.90 343.87 412.92 386.14 411.70 422.24 425.98 423.54 441.40 351.69 406.39,单组设计的概念,对来自同一总体的一个随机样本在一个特定条件下观测其定量指标的数值,必须提供标准
2、值或总体平均值 若定量指标只有1个,其资料就叫做单组设计一元定量资料;若定量指标有m个(m1),其资料就叫做单组设计m元定量资料,单组设计的特点及应用场合,实验中仅涉及一个实验因素的一个特定水平,受试对象未按任何其他实验因素或区组因素进一步被分组 在定量指标有公认的标准值或理论值的问题中,若对某特定总体中受试对象相应定量指标的取值感兴趣时,可以采用此设计类型进行实验研究,参数估计,参数估计是用样本统计量推断总体参数,有点估计和区间估计两种 点估计是用相应样本统计量直接作为其总体参数的估计值,如本例中可以算得20亩玉米亩产量的样本均数为 ,将其作为今年平均亩产量的估计值 点估计比较简单,但未考虑
3、抽样误差的大小,区间估计,按预先给定的概率1确定包含未知总体参数的一个范围,该范围叫做参数的置信区间,也称为可信区间 预先给定的概率1称为置信度或可信度,一般取95%或99% 置信区间通常由两个数值即置信限表示,较小者称为置信下限,较大者称为置信上限,可信区间的含义,总体均数95%置信区间的确切含义是指,如果能够进行重复抽样试验,平均有95%的置信区间包含了总体均数,而不是总体均数落在该范围内的可能性为95% 在实际工作中,只能根据一次试验结果估计可信区间,就认为该区间包含了,该结论犯错误的概率,可信区间估计的优劣取决两个方面: 一是可信度1,即区间包含的理论概率大小,愈接近1愈好 二是区间的
4、宽度,区间愈窄愈好 当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。在可信度确定的情况下,增加样本含量可减小区间宽度,单组设计定量资料总体均数可信区间的计算,样本均数的标准差称为标准误 在实际工作中总体标准差常未知,用样本标准差S来估计。均数标准误估计值,反映均数抽样误差的大小,当总体标准差已知或样本含量较大时,按正态分布 双侧: 单侧: 或 或,当总体标准差未知时,按t分布 双侧: 单侧: 或 自由度 , 可通过t界值表查得,本例中 ,S=34.36, , 今年玉米平均亩产量的95%可信区间为(389.30,421.44),说明该区间有95%的可能包含总体均数,可信
5、区间与参考值范围的区别,含义不同 计算公式不同 用途不同,假设检验,由样本信息推断总体特征,除参数估计外,还会遇到这样的问题: 某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总体等? 要回答这类问题,更多的是用统计推断的另一方面 假设检验,观测到的样本均数与总体均数间或两样本均数间差异的可能原因: 总体均数不同; 总体均数相同,差别由抽样造成。 需要通过统计学假设检验来判断,假设检验的基本思想,小概率事件在一次试验中不会轻易发生的原理 反证法,定量资料假设检验中的定量资料指什么,指结果变量的性质为定量资料,而原因变量通常仅为定性变量,有时也会有定量变量 例如:为了推测教
6、室里男生与女生的平均体重是否相等,从教室里随机抽取男生和女生各30人,还测量了他们的身高。 男生(体重,kg): 60 63 58 67 (身高,cm):167 173 159 169 女生(体重,kg): 62 57 53 61 (身高,cm): 172 163 157 159 ,参数检验与非参数检验,参数检验:检验统计量的分布与样本所抽取的总体分布和总体参数有关,且总体中只有有限个未知参数 如:u检验、t检验、F检验(方差分析) 非参数检验:检验统计量的分布与样本所抽取的总体分布或总体参数无关 如:秩和检验,定量资料假设检验的关键点,其一、检查定量资料是否具备参数检验的前提条件 其二、正确
7、判定定量资料所对应的实验设计类型,单组设计定量资料参数检验的前提条件,独立性:根据专业知识判定 正态性:进行正态性检验,正确判定定量资料所对应的实验设计类型,一定要弄清单因素与多因素的区别 应熟悉各种标准的多因素设计 不要被多因素非平衡组合实验所迷惑,单组设计定量资料的检验方法,参数检验:t检验、u检验 非参数检验:符号秩检验,假设检验的步骤,第一步,建立假设,确定检验水准 H0:=0=382 (今年的平均亩产量与去年相同) H1:0(今年的平均亩产量与去年不同) =0.05 H0 零假设(又称无效假设、原假设) H1 备择假设(又称对立假设) 检验水准,显著性水准,犯类错误的概率,双侧检验:
8、H0:=0,H1:0 单侧检验:H0:=0,H1:0 H0:=0,H1:0 根据专业知识,确定用单侧或是双侧检验。没有特殊专业知识说明的情况下,一般用双侧检验 双侧检验较保守和稳妥,单侧检验更容易得出阳性结论,第二步,计算检验统计量 根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择相应的检验方法和检验统计量 本例中数据经检验服从正态分布,故可算得,第三步,根据求得的t值和自由度去查t分布表,获得对应的概率,也就是P值 本例中查表得0.005P0.01,也可以通过统计软件得到P=0.0067 P值的含义是指从H0规定的总体随机抽样,其检验统计量等于及大于(或/和等于及小于)现有
9、样本获得的检验统计量值的概率,第四步,先给出统计学结论,再结合专业知识给出专业结论 因P382,说明今年的平均亩产量高于去年,两类错误,假设检验是根据样本的信息并依据小概率原理,作出接受还是拒绝H0的判断。由于样本具有随机性,因而假设检验所作出的结论有可能是错误的. 这种错误有两类: (1)当原假设H0为真,观察值却落入拒绝域,而作出了拒绝H0的判断,称做第一类错误,又叫弃真错误。犯第一类错误的概率是显著性水平 (2)当原假设H0不真,却作出了接受H0的判断, 称做第二类错误,又叫取伪错误。犯第二类错误的概率记为,当样本容量n一定时, 愈小, 愈大; 愈大, 愈小 若要使犯两类错误的概率都减小
10、, 除非增加样本容量 1 称检验效能,也称把握度。为当两总体确有差异,按检验水准所能发现该差异的能力 拒绝H0,只可能犯I型错误,不可能犯II型错误;不拒绝H0,只可能犯II型错误,不可能犯I型错误,u检验,又称Z检验,适用于样本量较大(n60)或总体标准差已知时 (已知时) (n较大时),data a1; input x; cards; 355.73 360.37 400.40 451.59 456.86 422.41 397.96 427.49 366.74 441.90 343.87 412.92 386.14 411.70 422.24 425.98 423.54 441.40 351
11、.69 406.39 ; run; proc univariate data=a1 mu0=382 normal cibasic; var x; run;,单组设计定量资料的符号秩检验,非参数检验的适用场合: 非正态分布或方差不齐的资料 等级资料 一端或两端有不确定数值(如10.0、0.1等)的资料 分布不明的资料,假定非吸烟男子的牙菌斑指数约为1.23,某研究者现测得20位吸烟男子的牙菌斑指数分别为: 1.67,1.48,1.20,1.25,1.28,1.21,0.90,1.20,2.10,1.65,1.88,0.90,1.05,2.56,1.20,0.95,0.87,2.52,2.34,2
12、.69 请问:吸烟男子的牙菌斑指数与1.23的差别有无统计学意义? 本例经采用W 检验法检验,得W =0.877721,P =0.0161,因P 0.05,可以认为此资料不服从正态分布,故宜选用单组设计定量资料的符号秩检验进行统计分析,符号秩检验的具体步骤,第一步,建立假设,确定检验水准 H0:M=M0=1.23 (吸烟男子牙菌斑指数的中位数与1.23相同) H1:MM0(吸烟男子牙菌斑指数的中位数与1.23不同) =0.05 M代表与样本观测值所对应的总体中相应指标的中位数,而M0则是与观测指标对应的理论中位数或标准值,第二步,求差值d=xiM0。 说明:xi为第i个样本观测值 第三步,编秩
13、。依差值的绝对值从小到大编秩。编秩时遇差数等于零,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺序编秩,符号相反取平均秩次,再给秩次冠以原差值的正负号 20个差值及其对应的秩依次为: 0.44(14),0.25(8),-0.03(-3),0.02(1.5),0.05(6),-0.02(-1.5),-0.33(-10),-0.03(-4),0.87(16),0.42(13),0.65(15),-0.33(-11),-0.18(-7),1.33(19),-0.03(-5),-0.28(-9),-0.36(-12),1.29(18),1.11(17),1.46(20),第四步,求秩和并确定
14、检验统计量:分别求出正负秩次之和,正秩和以T+表示,负秩和的绝对值以T-表示。T+与T- 之和等于n(n+1)/2,即1+2+3+ n 之和。此式可验算T+与T- 的计算是否正确。任取T+或T-作为检验统计量 本例中 T+=14+8+1.5+6+16+13+15+19+18+17+20=147.5 T- =|-3-1.5-10-4-11-7-5-9-12|=62.5, T+T-=147.5+62.5=210,n=20,取T=T+=147.5,第五步,确定 P 值,并作出统计推断结论。当n50时,可查T界值表。查表时,自左侧找到n,用T值与相邻一栏的界值相比,若检验统计量T值在上、下界值范围内,
15、其P 值大于表上方相应的概率水平;若T值在上、下界值上或范围外,则P 值小于相应的概率水平,可向右移一栏,再与界值相比 查T界值表,得双侧P 0.10,按双侧检验水准接受H0,即吸烟男子的牙菌斑指数与1.23的差别无统计学意义,认为吸烟男子的牙菌斑指数约为1.23,data a2; input x ; cards; 1.67 1.48 1.20 1.25 1.28 1.21 0.90 1.20 2.10 1.65 1.88 0.90 1.05 2.56 1.20 0.95 0.87 2.52 2.34 2.69 ; run; proc univariate data=a2 normal mu0
16、=1.23; var x; run;,配对设计的概念,与同一个定量指标对应的两组数据成对出现,这些成对数据有三种可能的来源 其一、来自同一个体,则叫做自身配对设计 其二、来自母体相同的两个个体,则叫做同源配对设计 其三、来自条件接近的两个个体,则叫做条件相近者配对设计,配对设计的特点及应用场合,实验中仅涉及一个实验因素的两个水平,在这两个水平作用下分别获得一系列成对的数据 在自身配对设计中,受试对象未按任何其他实验因素被分组,“配对条件”是“自身” 在同源配对设计中,受试对象按“配对条件”被分组,“配对条件”是“来源(如窝别)”,来源相同的每两个个体被分配到两个处理组中去,在条件相近者配对设计
17、中,受试对象按“配对条件”被分组,“配对条件”是来自受试对象的对观测结果可能有较大影响的单个重要非实验因素或多个重要非实验因素的复合结果,配对条件相同的每两个个体被随机分配到两个处理组中去 当实验研究中仅需考察一个两水平的实验因素且有条件选用配对设计时,可以选用此设计类型安排实验 配对设计减少了个体差异,更能显示出处理因素的效应,配对设计定量资料的检验方法,参数检验:t检验 非参数检验:符号秩检验,配对设计定量资料参数检验的前提条件,独立性 正态性:每对数据的差值要服从正态分布,研究者考察肌激动器对类1分类错颌的疗效。选择了16例患者,均使用肌激动器治疗,测得治疗前后的有效上颌长度(单位:mm
18、)数据如表2所示。问:治疗前后的差别是否具有统计学意义? 经正态性检验,治疗前后的差值服从正态分布,故可以采用t检验分析该资料,表2 使用肌激动器治疗前后患者的有效上颌长度,配对设计定量资料的t检验,第一步,建立假设,确定检验水准 H0:d=0 (治疗前后的有效上颌长度相同) H1:d0(治疗前后的有效上颌长度不同) =0.05,第二步,计算检验统计量 本例中 =16, , ,,第三步,根据求得的t值和自由度去查t分布表,获得对应的概率,也就是P值 本例中查表得0.05P0.1,也可以通过统计软件得到P=0.0590,第四步,先给出统计学结论,再结合专业知识给出专业结论 因P0.05,故不拒绝H0,治疗前后有效上颌长度之间的差异没有统计学意义 虽然肌激动器治疗后与治疗前有效上颌长度差值的平均值3.53750,但经假设检验得P 0.05,故基于目前的样本,尚不能认为肌激动器治疗可以使患者的有效上颌长度增加,data a3; input x1 x2; diff=x2-x1; cards; 82.2 93.2 82.8 88.5 80.9 95.1 90.9 93.8 85.0
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宜春市教体局直属学校面向2026届高校毕业生招聘教师25人备考题库及完整答案详解一套
- 公共交通票务管理制度
- 三明市沙县区2026年紧缺急需学科教育人才引进备考题库及一套答案详解
- 2026年陕西省商业学校关于临聘部分学科教师的招聘备考题库及参考答案详解一套
- 中学教育教学改革制度
- 2026年河北空天备考题库投资控股有限公司社会招聘备考题库及一套完整答案详解
- 2026年温医大眼视光干细胞生物医学与生物材料工程研究组招聘备考题库及一套参考答案详解
- 2026年潍坊市金控集团招聘备考题库有答案详解
- 乐山职业技术学院2025年下半年公开考核招聘工作人员备考题库及答案详解1套
- 中国地质大学(北京)2026年教师及专技岗位招聘备考题库(第一批)及答案详解一套
- 2025-2026学年人教版七年级生物上册知识点梳理总结
- 工业设计工作流程及标准教程
- 《好睡新的睡眠科学与医学》阅读笔记
- 寒假安全教育课件模板
- GB 20101-2025涂装有机废气净化装置安全技术要求
- 熔铝炉施工方案及流程
- 折弯工技能等级评定标准
- 全屋定制家具合同
- 短视频内容版权协议2025年执行版
- 社区康养服务活动方案
- 2025年数字印刷可行性报告
评论
0/150
提交评论