




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本资料来源 第三章显著性检验 第一节显著性测验的原理第二节测验两样本均数差异 含两样本观察值配对和非配对的数据 第三节测验二项资料的百分数 针对单个样本百分数和两样本百分数 第四节测验次数资料的卡方值 包括适合性测验和独立性测验两类 第三章要点提示 显著性检验反映了调查或试验研究与上一章抽样分析的不同点 又是学习统计分析方法的基础 学习时 应充分理解检验的原理和特点 熟悉两尾检验与一尾检验的异同 重点掌握检验 和 1 2时依据的抽样分布类型及标准误 S 和差数标准误 1 2 S 1 2的计算公式 并与检验 时依据的差数的抽样分布和计算差数平均数的标准误 S 的公式相区别 对于百分数的检验 要注意应用u test的条件和不符合这些条件时进行连续性矫正的必要性 掌握依据 2变量SS 2服从的理论分布进行适合性检验和独立性检验时计算 2值的方法 涉及教材内容 第五章前三节 第七章前四节 作业布置 教材第五章第四节内容自习 教材P97T2 T3 T4 T7 T11 P144T4 T6 T7 T8 第一节显著性检验的原理 一 什么是显著性检验 在由样本研究总体时 先提出关于总体的统计假设 Ho 然后利用样本提供的信息去反证它是否成立 这种证明Ho是否成立的过程就叫统计假设测验 简称假设测 检 验 如果假设测验只针对一个Ho 并不同时研究其它假设 则称为显著性检验 还有一些假设测验问题 需要研究两个或更多的统计假设 必须采取包括多重比较在内的方差分析法才能解决 因而不再一般化地称之为假设测验 所以假设测验大多局限于显著性测验 例3 1某地小麦亩产一般 o 300kg 并从多年种植的经验知 75kg 今引进一新品种得n 25个亩产量观察值 算得 327kg 如何评价其表面效应 解本例表面效应 27kg产量差异 要区分它是本质差别还是抽样误差1 先假定表面效应是抽样误差 Ho o或 300kg2 按误差理论计算获此抽样误差的概率 P 27 P o 27 P u 27 75 25 2P u 9 5 2 1 8 2 0 036 0 0723 根据小概率原理推断Ho是否成立 按惯例 0 05 故Ho成立 第一节显著性检验的原理 0 05也叫显著水平 是一个概率临界值 它是根据 小概率事件在当前这次试验 观察 中实际不可能发生 这种 道德确定性 基于农业和生物学领域的行业要求而规定的小概率标准 0 05只能理解为否定Ho时容许犯错误的概率 本例获得27kg抽样误差的概率虽然很小 但尚未小到否定Ho时规定的显著水平 反过来讲就是没有95 以上的把握来认定其表面效应是 本质差别 而不是抽样误差 或者说表面效应虽然较大 但还没有大到有95 以上的把握来排除它是抽样误差的可能性 上述通过计算两尾概率评价其表面效应的做法通常针对的提问方式是 新品种的单产与当地品种有无显著差异 实际上评价表面效应还有一种问法 新品种的单产是否高于当地品种 解这样提问往往是根据专业方面的信息已明知新品种的单产不可能低于当地品种 于是检验方法由两尾测验变成一尾测验 1 仍假定表面效应是抽样误差 Ho o或 300kg2 计算获此抽样误差的一尾概率 P 27 P o 27 P u 9 5 1 8 0 0363 根据小概率原理推断 Ho不成立 第一节显著性检验的原理 二 显著性检验的特点1 是一种概率反证法 先假定 单向 成立 再计算标准误 然后将表面效应转换成标准化变量后查算其属于抽样误差的概率是否为小概率 是则接受Ho 否则拒绝Ho 2 用了小概率原理 否定Ho有95 以上的把握 但不可能为100 即表面效应只要大到视其为抽样误差时的两尾或一尾概率小到显著水平就能否定Ho 不然就暂且接受Ho 决不意味着接受Ho时有95 以上的把握 3 不同的场合依据不同的抽样分布 三 关于t分布定义 t S 其中S S n叫样本标准误参数 t 0 t 2 曲线特性 以 t 0处的纵轴对称 并以之为曲线最高点位置 而后往两侧递降 不同的 决定一条特异的t分布曲线 曲线形状随着 的增加 峰顶由下往上朝标准曲线的峰顶逼近 两尾由上往下朝标准曲线的两尾收拢 而当 120 时 t分布曲线与标准曲线N 0 1 重合 4 附表4与t分布的关系 第一节显著性检验的原理 附表4所列为9种两尾概率对应的 t 如右图所示 当n 1 7时 0 05和0 10栏目下的2 365和1 895就表明所得标准化变量t在n 8时绝对值超过2 365的概率 两尾面积 为0 05 超过1 895的概率 两尾面积 为0 10 按照显著性检验原理 计算获得某抽样误差的概率只是为了确认它是否为小概率 那反过来也就可以根据0 05的显著水平确定标准化变量u或t的 临界值 再和抽样误差标准化的结果相比较就是了 由此而来的显著性检验步骤见下例 0 90 0 05 0 025 0 025 1 895 2 365 t f t 7 第一节显著性检验的原理 f t t 2 7 4 N 0 1 第一节显著性检验的原理 四 显著性检验的步骤例3 2某地春小麦良种的千粒重 0 34克 现自外地引进一高产品种 8个小区种植得平均千粒重为 35 2克 S 1 64克 则测验该品种的千粒重是否显著高于当地良种的步骤为 H0 o或 34g S S n 1 64 8 0 58t S 1 2 0 58 2 07按自由度 7查得 一尾t0 05 两尾t0 10 1 895 4 推断 t t0 05H0不成立 本次测验的显著水平 0 05 本例是按照题目要求进行一尾测验 实际应用中这种提问方式必须有所谓的 附加知识 为依据 即有来自专业方面的信息表明外地品种的千粒重不可能低于当地良种 否则就只能用两尾测验 H0 o或 34g S S n 1 64 8 0 58t S 1 2 0 58 2 07 3 按自由度 7查得两尾t0 05 2 365 4 推断 t t0 05H0成立 意即外地品种的千粒重与当地良种无显著差异 本例两尾测验对H0的态度与一尾测验截然不同 但实际研究中有相同的 第二节两个样本平均数 一 测验 1 2例3 3根据以往资料 某小麦品种每m2产量的 2 0 4 kg2 今在该地的一块地上以A B两法取样 A法取12个样点 得每m2产量 1 1 2kg B法取8个样点 得 2 1 4kg 试问两法差异是否显著 解题意指两种取方法得到的单产有无本质差别 即表面效应能否视为抽样误差 1 H0 1 2或 1 2 0 2 12 22 2 0 4 kg2 1 2 0 4 12 0 4 8 0 2887kgu 1 2 1 4 0 2887 0 69 3 查得两尾u0 05 1 96 4 推断 u u0 05 H0成立表明两种取样方法无本质差别 关于原始数据用不同的单位对显著性检验过程的影响问题 要具体步骤具体分析 本例若以 斤 或500g为单位 则 2 4 0 4 斤2 1 2 2 0 2887 斤 而u 0 69不变 第二节两个样本平均数 例3 4调查某地每亩30万苗和35万苗的稻田各5块 得到 1 428kg SS1 1930kg2 2 440kg SS2 550kg2 测验两种密度单产差异显著性的步骤为 1 H0 1 2或 1 2 0 2 F S大2 S小2 1930 4 550 4 3 57ns查得右尾F0 05 4 4 6 39 于是有 Se2 SS1 SS2 1 2 2480 8 1S12 2S22 1 2 310S 1 2 Se2 1 n1 1 n2 11 14t 1 2 1 2 S 1 2 1 2 1 2 S 1 2 428 440 11 14 1 08 3 按 4 4 8查得两尾t0 05 2 306 4 推断 t t0 05H0成立 本例属于实际应用中普遍遇到的参数 12及 22未知的情形 不可能用u test而只能用t test 由于S 1 通过合并均方Se2计算时必须以两样本均方经F test证实无显著差异 齐性检验 为先决条件 故要在用加权法合并两个样本方差前插入一个F test过程 倘若经F test证实有显著差异 表明 12 22 那就不能计算Se2而只能仿照中心极限定理有关结论计算 S 1 2 S12 n1 S22 n2 只是以它为标准误转换出来的标准化变量已不再是严格意义上的 t 变量 还是先了解一下F分布 第二节两个样本平均数 关于F的定义及其分布从一个母总体N 2 中随机抽取两个独立样本 算得两个样本均方依次为S12 S22 则定义 F S12 S22 抽样研究的结果证明 F是一个连续性随机变量 理论上存在着抽样分布 这就是F分布 它具有平均数为 F 2 2 2 F分布是由自由度 1 2决定的曲线系统 因为受F 0的限制 任一条限于纵坐标右侧 F分布曲线不对称往左倾斜 左倾程度随着 1 2的一齐增加而减小 2 时 F的取值从大于1的那边由右往左 1 曲线峰顶向上 向右往 F 1的垂线逼近 附表5 右尾F临界值表 与F分布的关系 第二节两个样本平均数 F f F 1 1 2 7 1 1 2 4 1 1 2 2 5 59 7 71 18 51 这里只显示 1 1的反J型曲线 1 2时也是如此 当 1 3时 F分布曲线就转为偏态 呈现反S型 第二节两个样本平均数 例3 5在抽穗期间测定喷矮壮素玉米8株 得到株高 1 176 3cm SS1 3787 5cm2 对照区玉米9株 得株高 2 233 3cm SS2 18400cm2 试测验矮化效果 1 H0 1 2或 1 2 0F S大2 S小2 2300 541 1 4 25 查得F0 05 8 7 3 73 2 S 1 2 S12 n1 S22 n2 67 64 255 56 18 t 1 2 S 1 2 176 3 233 3 18 3 17 3 k S2 1 S2 1 S2 2 1 k 0 79 67 64 323 2 0 21 故 1 k2 1 1 k 2 2 12 1 0 212 7 0 792 8 11 85 按 查得一尾t0 05 两尾t0 10 1 782 4 推断 t t0 05H0不成立本例经F test知两个样本所属的总体方差 12 22 因此不能计算合并Se2而只能模仿中心极限定理计算S 1 2 由于以它为标准误转换出来的标准化变量已不再是严格意义上的 t 所以查表时不能简单地根据合并自由度15即 1 2 而必须予以修正 这就是 Aspin Welch检验 第二节两个样本平均数 例3 6一个容量为6的样本来自一个正态总体 得平均数为 1 30 均方S12 40 另一个容量为11的样本来自一个正态总体 其平均数为 2 22 均方为S22 45 测验H0 1 2 4 1 F S大2 S小2 45 40 1 125ns查得右尾F0 05 10 5 4 74 2 Se2 1S12 2S22 1 2 650 15 43 33S 1 2 Se2 1 n1 1 n2 43 33 17 66 3 34t 1 2 1 2 S 1 2 30 22 4 3 34 1 2 3 按 15 查得一尾t0 05 1 753 4 推断 t t0 05H0成立 本例有一个特别之处 即不是测验两个样本所属的总体平均数 1与 2是否相等 而是测验其相差是否超过 小于 某一常数 我们把这一类H0称为 非零假设 相应地称前者为 零假设 用非零假设往往能使H0更有实用性 因为针对它进行检验后获得信息更充分 如本例只检验零假设 t 8 3 34 2 4显然超过一尾t0 05而否定H0 用非零假设时常数则是根据实际应用的要求而设定 并且多为一尾测验 如 1 2为产量差异 常数就可按高产者多投入的成本换算出所属的总体平均数必须超过低产方多大的幅度 才有效益 来确定 值得普遍推行 第二节两个样本平均数 二 测验 例3 7选生长期 发育进度等方面一致的番茄配对 共得7组 每组中随机安排一株接种A病毒 另一株接种B病毒 试验结果得每组中B处理产生的病痕数分别比A处理15 1 6 12 7 7 12个 故测验B法产生的病痕数显著高于A法的步骤为 1 H0 d 0 di为抽样引起的误差 d n 58 7 8 3SSd d 2 167 43S Sd n SSd n n 1 2t d S 8 3 2 4 15按自由度 7 1 查得一尾t0 05 1 943 4 推断 t t0 05H0不成立 将性质相同也就是试验条件非常接近的两个试验单元 小区 配成一对 然后在每一对中随机安排两种处理 如此配对设计有几个重复就可以得到几组成对的观察值 若各对观察值总是固定其中一个处理的观察值为减数 另一个为处理的为被减数 则所得差数d1 d2 di dn的算术平均数就是 如果两个处理无本质差别 则配对观察值的差数d必然服从正态分布 于是测验 的显著性也就相当于把d视为变量y的单个样本平均数的差异 显著性检验 计算S 的公式形式和计算S 的公式是一样的 这就是测验 的实质 也可以是两尾测验 第二节两个样本平均数 病毒用A B两法钝化后经配对设计在番茄上产生成对数据的过程 第二节两个样本平均数 例3 8研究某新肥料能否比原肥料增产5kg以上皮棉 采用配对设计 重复9次 根据各重复新肥料施用 后比原肥料多收皮棉kg数算得 5 61kg SSd 35 28kg2 故显著性测验步骤为 1 H0 d 5kg 一尾检验 反意假设 d n 50 5 9 5 61SSd d 2 d2 C 35 28S Sd n SSd n n 1 0 7t d S 5 61 5 0 7 0 87按自由度 9 1 查得一尾t0 05 1 860推断 t t0 05H0成立 本例若检验H0 d 0则会有 t d S 5 61 0 0 7 8 第三节二项资料的百分数 所谓二项资料的百分数 指数据资料可以看成是从二项总体中抽得样本后 通过计数某一属性的个体数目算出来的样本百分数 其实质是样本平均数 正因为经计数获得 所以是间断性变量 从理论上讲 这类百分数的显著性检验应按二项分布进行 即用 p q n的二项展开式求出某项属性的个体数达到某个百分数p的概率 但n稍大时 直接用 p q n来计算区间概率很不方便 除非制成类似附表9那样的统计表来查 而样本容量足够大 n 50 时 若p q不过于小 np或nq 5 则 p q n的分布趋近于正态 p可转换为u查算概率 适合u test的p和np值表 第三节二项资料的百分数 一 单个样本百分数p例3 9以紫花和白花的大豆品种杂交 F2代共289株中紫花208株 白花81株 如果花柱头色受一对等位基因控制 则紫花的理论百分数po 0 75 白花的qo 0 25 试测验该结果是否符合3 1的分离规律 解本例n 289 p 208 289 0 72 n 200 p 0 2 0 8 用u test H0 p p0或p 0 75 p pq n 0 75 0 25 289 0 0255u p p p 0 72 0 75 0 0255 1 18 查表知u0 05 1 96 推断 u u0 05故H0成立 本例若以np np 208 216 75 8 75 进行测验 np npq 7 36 u不变 若以H0 p 0 25进行检验 p或 np结果一样 u 1 18 本例因为有理论百分数为测验依据 具备计算总体标准误的先决条件 所以用u test 这是很少见的几种能直接应用标准正态分布的场合 也是应用二项总体抽样分布进行检验的优势 用正态分布替代二项分布进行检验 其本质是将间断性变量的概率分布去逼近它的极限 连续性变量的fN y 这种近似过程会有偏差 当数据不符合前表所列条件时还得照下例操作 第三节二项资料的百分数 例3 10用基因型纯合的糯和非糯玉米杂交 按遗传规律 预期F1植株上糯性花粉粒的P0 0 5 现于一视野中检视20粒花粉 发现糯性花粉8粒 试测验此次镜检结果是否符合F1代配子1 1的分离规律 解本例n 20 50 p 8 20 0 4不符合u test的条件 只能用t test H0 p p0或p 0 5 S2 npq n 1 是 2 pq的无偏估计值 Sp pq n 1 0 4 0 6 19 0 1124tc p p 0 5 n Sp 0 667 0 1 0 025 0 1124 按自由度 19查得t0 05 2 093 推断 t t0 05故H0成立 本例若以np np 8 10 2进行测验 则同样应根据 2 pq的无偏估计值S2 npq n 1 先计算标准误 Snp n2pq n 1 npq 202 0 4 0 6 19 2 25再算tc np np 0 5 Snp 2 0 5 2 25 0 667计算tc的做法叫连续性矫正 为的是纠正用连续性变量的t分布替代二项分布时 因为n太小而不能忽略的偏差 即使如此 对这种n 50的资料进行检验只适宜于希望H0被接受的场合 如果希望H0被拒绝 设计获得样本百分数的n还是越大越好 达不到100也不要少于50 第三节二项资料的百分数 二 两个样本百分数例3 11原杀虫剂在1000头虫子中杀死657头 新杀虫剂在1000头虫子中杀死728头 试测验两者的杀虫率有无显著差异 解p1 0 657 p2 0 728 n1 n2 1000p1或p2 0 1 0 9 可进行u test 1 H0 p1 p2 同时有 p12 p22 2 pe n1p1 n2p2 n1 n2 0 6925 657 728 1000 1000 qe 1 pe 1 0 6925 0 3075 p1 p2 peqe 1 n1 1 n2 0 021 peqe 1 1000 1 1000 u p1 p2 p1 p2 p1 p2 0 657 0 728 0 021 3 44 3 查得两尾u0 05 1 96 4 推断 u u0 05H0不成立 本例计算标准误的前提是可以合并两个样本百分数 然后计算Se2 peqe 之所以这样作而不象前例计算Se2 1S12 2S22 1 2 前先插入F检验且知两个样本方差比无显著性 是因为该题型的H0有双重作用 即作出H0 p1 p2后 H0 p12 p22也同真 原因在于二项总体的 2 pq p 1 p 至于n1或n2 50的两个样本百分数差异显著性检验问题 即使是有t test并且可以进行连续性矫正 同样因为只有利于接受H0而不利于拒绝H0 实际应用中不受推崇 第四节次数资料的 2 一 2的定义和分布假定从一个 既定的母总体中随机抽取容量为n的样本 则定义 2 SS 2 n 1 S2 2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025甘肃天水市武山县人力资源和社会保障局招聘城镇公益性岗位人员26人考前自测高频考点模拟试题带答案详解
- 2025年扶余市博物馆公开选调解说员(4人)考前自测高频考点模拟试题及答案详解(名校卷)
- 2025年中共溧阳市委党校长期招聘教师2人(江苏常州市)考前自测高频考点模拟试题及答案详解(新)
- 2025江苏南京大数据集团有限公司招聘模拟试卷附答案详解(黄金题型)
- 2025年四会市市级机关公开遴选考试真题
- 2025年DNA、RNA疫苗项目合作计划书
- 2025年宁东镇公开招聘公益性岗位人员模拟试卷及答案详解一套
- 2025福建莆田市市直事业单位定向招考未就业随军家属6人模拟试卷附答案详解(模拟题)
- 2025国家民委直属事业单位招聘(48人)模拟试卷附答案详解(考试直接用)
- 2025内蒙古鄂尔多斯实验室成果转化部招聘3人考前自测高频考点模拟试题及答案详解(夺冠系列)
- 2025年“10.13建队日”分批入队活动总结:强国复兴有我争当新时代好少年
- 2024年服装时装项目资金筹措计划书代可行性研究报告
- 施工三方协议7篇
- 2025年数字娱乐行业数字化娱乐内容与虚拟现实体验研究报告
- 水生产处理工三级安全教育(班组级)考核试卷及答案
- 2025年贵州省贵阳市辅警考试题库(附答案)
- 小学科学新教科版三年级上册全册教案(2025秋新版)
- 2024北森图形推理题
- 外科学题库水电解质代谢和酸碱平衡失调
- 35kV输电线路工程旋挖钻孔专项施工方案
- 抗精神病药物的副作用及处理
评论
0/150
提交评论