




免费预览已结束,剩余188页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计推断 statisticalinference 第四章 假设检验 参数估计 由一个样本或一糸列样本所得的结果来推断总体的特征 概念 统计推断 分析误差产生的原因 确定差异的性质 排除误差干扰 对总体特征做出正确判断 任务 第四章 第一节 第二节 第三节 第四节 第五节 假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验 参数的区间估计与点估计 方差的同质性检验 假设检验的原理与方法 统计推断 矽肺病患者的血红蛋白含量 治疗后患者的血红蛋白含量 总体平均数 样本平均数 差异 二者之间的差异是由于抽样误差所致 即治疗后的总体平均数 与 0是相同的 由于药物的影响 两个均数 与 0间有本质的差异 即二者不相同 不完全是抽样误差的原因 抽样误差 本质差异 根据总体的理论分布和小概率原理 对未知或不完全知道的总体提出两种彼此对立的假设 然后由样本的实际结果 经过一定的计算 作出在一定概率意义上应该接受的那种假设的推断 一 假设检验的概念 假设检验 hypothesistest 显著性检验 significancetest 小概率原理 0 05 0 01 如果假设一些条件 并在假设的条件下能够准确地算出事件 出现的概率 为很小 则在假设条件下的n次独立重复试验中 每次事件A将按预定的概率发生 而在一次试验中则几乎不可能发生 为什么小概率事件的界值定为0 05呢 罗纳德 艾尔默 费希尔 RonaldAylmerFisher 现代统计学的奠基人 他拍脑袋订了一个小概率事件的分界点 0 05 没有什么道理好讲 无效假设 ineffectivehypothesis 零假设 nullhypothesis 零假设是针对实验重点考查内容提出来的 零假设 样本和总体的均值没有差别 0 1 零假设是有意义的 2 根据零假设可以计算因抽样误差而获得样本的结果 接受零假设 否定零假设 二 假设检验的步骤 1 提出假设 以样本平均数为例 H0 假设 没有差别 有差别 二 假设检验的步骤 矽肺病患者的血红蛋白含量 治疗后患者的血红蛋白含量 总体平均数 样本平均数 假设 备择假设 alternativehypothesis 对应假设 与零假设相对立的假设 HA 0 HA 0 在拒绝H0的情况下 可供选择的假设 HA 1 提出假设 二 假设检验的步骤 无效假设 备择假设 H0 0 HA 0 误差效应 处理效应 0 05 0 01 显著水平 极显著水平 P 0 05 0 01 P 0 05 0 01 2 确定显著水平 H0的假设可能是正确的 应该接受 同时否定HA 否定H0 接受HA 二 假设检验的步骤 选定检验方法 计算检验统计量 teststatistic 针对不同的研究问题和不同类型的变量 所涉及的统计分布不同 显著性检验使用的方法也不相同 两个样本平均数的比较 多个样本平均数的比较 事物间的构成比的差异进行比较 3 确定统计量 计算概率 二 假设检验的步骤 矽肺病患者的血红蛋白含量 治疗后患者的血红蛋白含量 总体平均数 样本平均数 126 40 检验所计算的概率并不是实得差异本身的概率 而是超过实得差异的概率 依据小概率原理 作出推断结论 是否接受假设 P P 小概率原理 接受H0否定HA 否定H0接受HA 4 推断是否接受假设 二 假设检验的步骤 P 0 1142 0 05 接受H0 可以推断治疗前后的血红蛋白含量未发现有显著差异 其差值10 mg L 应归于误差所致 即抽出样本的总体平均数 0 差异达显著水平 差异达极显著水平 分析题意 提出假设 确定显著水平 计算检验统计量 作出推断 二 假设检验的步骤 0 0 95 接受区 0 025 0 025 临界值 双尾检验 双侧检验 否定区 否定区 左尾 右尾 假设检验的两个否定区 分别位于分布的两尾 三 双尾检验与单尾检验 假设 否定区 右尾检验上尾检验 左尾检验下尾检验 单尾检验 H0 0时 则HA 0 备择假设有两种可能 0或 0 在 0的情况下 样本平均数有可能落入左尾否定区 也有可能落入右尾否定区 双尾检验 H0 0时 则HA 0 备择假设只有一种可能 0 其否定区只有一个 相应的检验只能考虑一侧 左侧或右侧 的概率 单尾检验 三 双尾检验与单尾检验 单尾检验 双尾检验 否定区 否定区 否定区 接受区 接受区 查双尾表时 单尾概率 0 05 等于双尾概率 0 025 乘以2 单尾检验比双尾检验容易对H0进行否定 若对同一资料进行双尾检验和单尾检验 在 水平上单尾检验显著 只相当于双尾检验在2 水平上显著 同一资料双尾检验和单尾检验所得结论不一定相同 单尾检验时利用了已知有一侧是不可能的这一条件 如果事先可以断定 不可能 0或不可能 0 则可以用单尾检验 在可能的情况下 尽量做单尾检验 三 双尾检验与单尾检验 双尾检验显著 单尾检验显著 单尾检验一定显著 双尾检验不一定显著 犯第一类错误的概率等于显著水平 值 四 假设检验中的两类错误 小概率原理 不发生 第一类错误 错误 弃真错误 I型错误 拒绝H0 II 0 01 0 05 每推断100次 会有不超过5次是错误的 每次推断都要冒5 错误推断的风险 0 1 u u 和 不重合 当 1接近 0时 犯II型成熟的概率越大 当 1远离 0时 犯II型成熟的概率越小 第二类错误 错误 纳伪错误 II型错误 0 1 u u 明确知道I和II分布的平均值和方差的时候才能计算 1 计算I分布的ua值 a 0 05时 等于1 96 1 1 2 计算II分布低于ua的概率 积分面积 正态化u 1 96 1 1 2 2 查u的累计概率表 如何计算B类错误的概率 假设检验的两类错误H0正确H0错误否定H0 错误 推断正确 1 接受H0推断正确 1 错误 四 假设检验中的两类错误 1 两类错误既有联系又有区别 错误只在否定H0时发生 错误只在接受H0时发生 错误增加 错误减小 错误增加 错误减小 的选择依赖于两类错误的危害性 四 假设检验中的两类错误 0 0 0较大时 减小 0较小时 增大 2 当 接近 0时 犯II型成熟的概率越大 当 远离 0时 犯II型成熟的概率越小 四 假设检验中的两类错误 0 0 3 增加样本容量n 可使两类错误都减小 概率显著水平的确定与犯两类错误有密切的关系 取值太高或太低都会导致某一种错误的增加 标准误小 正态分布中接受区就变得十分狭窄 和 0之间的差别比较容易发现 四 假设检验中的两类错误 当P 时否定H0 称 差异是显著的 严格的讲应是 由样本推断出的总体平均数 与 0之间的差异有统计学意义 即它们属于两个不同总体 冒 风险 significance的含义是 有意义的 而不是 显著的 只是习惯上说成差异显著而已 二者之间的差异有统计学意义是指在给定的样本含量下 推断出该总体的平均数 与已知总体 0来自不同的总体 同样 在一定样本含量下接受H0 并不意味着真实的 与 0之间并无差异 只要 与 0不相同 当n增加后 这种差异总会被检验出来 因此 接受H0严格意义上讲应是 尚无足够的理由拒绝H0 差异不显著 指表面上的这种差异在同一总体中出现的可能性大于统计上认可的概率水平0 05 不能理解为试验结果间无差异 差异不显著 本质上有差异 但被试验误差所掩盖 表现不出差异的显著性 可能确无本质上的差异 不同自由度下 t分布的两尾概率及其对应的临界t值 自由度 两尾概率值 临界t值 单尾 双尾 对于给定的 0 2 的点 2为 2分布的上 分位点 右尾概率 表中表头的概率P是 2大于表内所列 2值的概率 df 2 对于给定的 0 n 的点 n 为 分布的上 分位点 或临界值点 在df1 4 df2 10的正态总体中连续抽样 所得F值大于3 48的仅有5 而大于5 99的仅有1 第四章 第一节 第二节 第三节 第四节 第五节 假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验 参数的区间估计与点估计 方差的同质性检验 样本平均数的假设检验 41 大样本平均数的假设检验 小样本平均数的假设检验 单样本 双样本 u检验 t检验 总体方差未知时 总体方差已知时 大样本平均数的假设检验 小样本平均数的假设检验 单样本 双样本 u检验 42 一 一个样本平均数的假设检验 43 该样本属于这个以 0为平均数的指定总体 该样本所属的总体与这个指定总体 0 不同 即有显著或极显著差异 一个样本平均数的假设检验 相同 不同 44 1 总体方差 2已知 无论n是否大于30都可采用u检验法 分析新育苗方法与常规方法有无显著差异 分析 这是一个样本平均数的假设检验 因总体 2已知 采用u检验 新育苗方法的鱼苗体长 或 常规方法鱼苗体长 应进行双尾检验 45 假设 2 水平 3 检验 4 推断 H0 0 7 25 cm 即新育苗方法与常规方法所育鱼苗一月龄体长相同 HA 0 选取显著水平 0 05 u 1 96 否定H0 接受HA 认为新育苗方法一月龄体长与常规方法有显著差异 46 分析改善栽培条件是否能显著提高豌豆籽粒重量 分析 这是一个样本平均数的假设检验 虽然样本量较小 但因总体 2已知 所以仍用u检验 又因改善栽培条件不会使籽粒重量降低 故而用单尾检验 47 假设 2 水平 3 检验 4 推断 H0 0 377 2 mg 即改善栽培条件不能使籽粒重量提高 HA 0 选取显著水平 0 05 u 1 64 否定H0 接受HA 改善栽培条件能显著提高豌豆籽粒重量 48 1 对同一资料进行单尾检验和双尾检验 检验结果可能不一致 在 水平上单尾检验显著 只相当于双尾检验在2 水平上显著 49 2 进行单尾检验还是双尾检验 应根据专业知识及问题的要求在试验设计时就确定 事先不知所比较的两个处理效果的效果好坏 分析的目的在于推断两个处理效果有无差别 根据理论知识或实践经验判断甲处理的效果不会比乙处理的效果差 或相反 分析的目的在于推断甲处理是否比乙处理效果好 或差 单尾检验 双尾检验 50 2 总体方差 2未知 但n 30时 可用样本方差s2来代替总体方差 2 仍用u检验法 总体 0 s2 2 未知 51 分析该棉花品种的纤维长度是否符合纺织品的生产要求 分析 这是一个样本平均数的假设检验 因总体 2未知 n 400 30 可用s2代替 2进行u检验 棉花纤维只有 30mm才符合纺织品的生产要求 因此进行单尾检验 52 假设 2 水平 3 检验 4 推断 H0 0 30 cm 即该棉花品种纤维长度达不到纺织品生产的要求 HA 0 选取显著水平 0 05 u 1 64 接受H0 否定HA 认为该棉花品种纤维长度不符合纺织品生产的要求 53 3 总体方差 2未知 且n 30时 可用样本方差s2来代替总体方差 2 采用df n 1的t检验法 总体 0 s2 2 54 例 某鱼塘水中的含氧量 多年来平均为4 5 mg L 该鱼塘设10个点采集水样 测定含氧量为 4 33 4 62 3 89 4 14 4 78 4 64 4 52 4 55 4 48 4 26 mg L 试检验该次抽样测定的水中含氧量与多年平均值有无显著差别 分析 这是一个样本平均数的假设检验 因总体 2未知 n 10 30 可用s2代替 2进行t检验 该次测定的水中含氧量可能 或 多年平均值 用双尾检验 55 假设 2 水平 3 检验 4 推断 H0 0 4 5 mg L 即认为该次测定与多年平均值没有显著差别 HA 0 选取显著水平 0 05 在0 05显著水平上 接受H0 否定HA 认为该次抽样所测结果与多年平均值无显著差别 属于随机误差 t0 05 9 2 262 t t0 05 9 56 在单个样本的显著性检验中 要进行样本统计量与零假设所提出的总体参数之间的比较 这种检验需要我们事先能够提出合理的参数假设值和对参数有某种意义的备择值 然而 在实际工作中往往很难提出这样的假设值及备择值 因此限制了单样本假设检验在实际工作中的应用 57 二 两个样本平均数的假设检验 在生物学试验中常采取设置对照的方法 即选择两个样本 一个作为处理 一个作为对照 在这两个样本之间作比较 判断它们之间的差异是否可用随机误差来解释 对两个样本检验的最大优点是不必知道总体的参数究竟该等于什么数值 而只需判断两个样本之间是否有变化 58 两个样本平均数的假设检验 59 总体1 1 总体2 2 两个样本平均数的假设检验步骤 1 提出假设 60 2 确定显著水平 0 05或0 01 3 检验 1 样本平均数差数的平均数 总体平均数的差数 两个样本平均数的差数 61 2 样本平均数差数的方差 两样本平均数方差之和 样本平均数差数的标准误 62 3 从两个独立正态分布总体中抽出的样本平均数差数的分布 也是正态分布 63 当 12和 22已知 H0 1 2 时 64 当 12和 22未知 两样本都为大样本时 H0 1 2 时 65 当 12和 22未知 两样本都为小样本时 H0 1 2 时 66 4 作出推断 并解释之 67 试验设计 成组数据平均数的比较 成对数据平均数的比较 68 如果两个样本的各个变量是从各自总体中随机抽取的 两个样本之间的变量没有任何关联 即两个抽样样本彼此独立 则不论两样本的容量是否相同 所得数据皆为成组数据 两组数据以组平均数作为相互比较的标准 来检验其差异的显著性 根据两样本所属的总体方差是否已知和样本大小不同而采用不同的检验方法 成组数据平均数的比较 69 1 两个总体方差 12和 22已知 或 12和 22未知 但两个样本都是大样本 n1 30且n2 30 用u检验法 例 某杂交黑麦从播种到开花的天数的标准差为6 9d A法 调查400株 平均天数为69 5d B法 调查200株 平均天数为70 3d 差异 分析 这是两个样本 成组数据 平均数比较的假设检验 12 22 6 9d 2 样本为大样本 用u检验 因事先不知A B两方法得到的天数孰高孰低 用双尾检验 试比较两种调查方法所得黑麦从播种到开花天数有无显著差别 70 假设 2 水平 3 检验 4 推断 H0 1 2 即认为两种方法所得天数相同 HA 1 2 选取显著水平 0 05 在0 05显著水平上 接受H0 否定HA 认为两种方法所得黑麦从播种到开花天数没有显著差别 71 例 为了比较 42 67XRRIM603 和 42 67XPB86 两个橡胶品种的割胶产量 两品种分别随机抽样55株和107株进行割胶 平均产量分别为95 4ml 株和77 6ml 株 割胶产量的方差分别为936 36 ml 株 2和800 89 ml 株 2 分析 这是两个样本 成组数据 平均数比较的假设检验 12和 22未知 n1 30且n2 30 用u检验 因事先不知两品种产量孰高孰低 用双尾检验 试检验两个橡胶品种在割胶产量上是否有显著差别 72 假设 2 水平 3 检验 4 推断 H0 1 2 即认为两品种割胶产量没有显著差别 HA 1 2 选取显著水平 0 01 在0 01显著水平上 否定H0 接受HA 两个橡胶品种的割胶产量存在极显著的差别 42 67XRRIM603 割胶产量极显著高于 42 67XPB86 73 2 两个总体方差 12和 22未知 且两个样本都是小样本 即n1 30且n2 30时 用t检验法 尽管两总体方差未知 成组数据的t检验仍要求它们必须相等 即 12 22 2 方差齐性检验 74 方差齐性 homoscedasticety 检验 F检验 从正态总体抽取n1 n2两个样本 其方差s12 s22的比值即 df1 n1 1 df2 n2 1 F检验是两样本t检验的第一步 75 步骤 提出假设H0 12 22 HA 12 22 推断FF 时 接受HA 方差不具齐性 确定显著水平 0 05 0 01 76 1 如果 12 22 2 Se2 2 平均数差数的标准误 合并的方差 77 H0 1 2 df n1 1 n2 1 n1 n2 2 78 例 用高蛋白和低蛋白两种饲料饲养一月龄大白鼠 在三个月时 测定两组大白鼠的增重 g 高蛋白组 134 146 106 119 124 161 107 83 113 129 97 123低蛋白组 70 118 101 85 107 132 94 分析 这是两个样本平均数的检验 12和 22未知 且为小样本 用t检验 事先不知两种饲料饲养大白鼠增重量孰高孰低 用双尾检验 试问两种饲料饲养的大白鼠增重量是否有差别 79 1 假设 2 水平 3 检验 H0 12 22 2HA 12 22 选取显著水平 0 05 4 推断 两样本方差相等 第一步F检验 80 3 检验 假设 2 水平 H0 1 2 即认为两种饲料饲养的大白鼠增重无差异 HA 1 2 选取显著水平 0 05 第二步t检验 81 4 推断 在0 05显著水平上 接受H0 否定HA 认为两种饲料饲养大白鼠的增重无显著差别 属于随机误差 t0 05 17 2 110 df n1 1 n2 1 17 82 2 如果 12 22 采用近似的t检验 即Aspin Welch检验法 83 检验两品种小麦蛋白质含量是否有显著差异 12 22且n1 n2 用近似的t分布 使用双尾检验 假设 2 水平 3 检验 H0 12 22 2HA 12 22 4 推断 两样本方差有显著不同 选取显著水平 0 05 例 第一步F检验 84 假设 2 水平 3 检验 H0 1 2 即两品种蛋白质含量没有显著差别 HA 1 2 选取显著水平 0 01 第二步近似t检验 85 4 推断 在0 01显著水平上 否定H0 接受HA 认为两品种蛋白质含量有极显著差异 东方红3号小麦蛋白质含量极显著的高于农大193 t0 01 12 3 056 86 问新品系是否值得推广 例 新旧两个小麦品系进行对比试验 成熟后按小区进行计产 假设 2 水平 3 检验 H0 12 22 2HA 12 22 4 推断 两样本方差存在极显著差异 选取显著水平 0 01 第一步F检验 旧品系 新品系 87 假设 2 水平 3 检验 H0 1 2 即新品系不值得推广 HA 1 2 选取显著水平 0 01 第二步近似t检验 分析 n1 n2 用近似的t分布 新品系必须优于旧品系才值得推广 用单尾检验 88 4 推断 在0 01显著水平上 否定H0 接受HA 新品系平均产量极显著高于旧品系 值得推广 t0 01 39 2 423 89 3 如果 12 22 n1 n2 n 2 90 例 两个小麦品种千粒重 g 调查结果 品种甲 50 47 42 43 39 51 43 38 44 37品种乙 36 38 37 38 36 39 37 35 33 37 检验两品种的千粒重有无差异 两样本方差不相等 第一步F检验 91 分析 12和 22未知 且不相等 都小样本 且n1 n2 用近似的t检验 事先不知道两个品种千粒重孰高孰低 故而用双尾检验 第二步t检验 92 假设 2 水平 3 检验 H0 1 2 即认为两品种千粒重无显著差异 HA 1 2 选取显著水平 0 05 93 4 推断 在0 05显著水平上 否定H0 接受HA 认为两品种千粒重存在明显差异 即品种甲的千粒重显著高于品种乙 t0 05 11 2 201 94 成组数据样本平均数的比较要求抽样样本 供试单位 尽可能一致 如果抽样样本变异较大 采用这种方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性 为了避免这一问题出现 可以利用局部控制的原则 采用配对设计 进行成对数据平均数的比较 局限性 95 成对数据平均数的比较 在生物学或医学试验中 经常将试验配成若干配对 分别作以不同处理 例如 用高粱的若干父本与两个不同母本杂交 同一父本的两个杂交种是一个配对 用若干同窝的两只动物作不同处理 每一窝的两只动物是一个配对 在做药效试验时 测定若干试验动物服药前后的有关数值 服药前后的一对数值是一个配对 等等 将性质相同的两个样本 供试单位 配成对 每一对除随机地给予不同处理外 其他试验条件应尽量一致 以检验处理的效果 所得的观测值称为成对数据 96 成对数据的要求 配成对的两个供试单位的初始条件应尽量一致 不同对间的供试单位的初始条件可有差异 每一对就是试验处理的一个重复 由于成对数据同一对内两个供试单位的试验条件非常接近 而不同配对间的条件差异可以通过各个配对差数予以消除 因而可以控制试验误差 具有较高的精确度 成对数据 在进行假设检验时 只要假设两样本的总体差数 d 1 2 0 而不必假定两样本的总体方差 12和 22相同 即不必进行F检验 97 成对数据假设检验 统计对象 每对材料测量值的差数di x1i x2i i 1 2 n 单样本检验 98 样本1 样本2 n对 d为每对数据的差值 差值样本的平均数等于样本平均数的差值 99 样本差数的方差 样本差数平均数的标准误 100 H0 d 0 df n 1 t值的计算 差值的样本均数所代表的未知总体均数为0 101 例 在研究饮食中缺乏VE与肝中VA的关系时 将试验动物按性别 体重等配成8对 并将每对中的两头试验动物用随机分配法分配在正常饲料组和VE缺乏组 然后将试验动物杀死 测定其肝中VA含量 结果如右表 配对正常饲料组VE缺乏组差数dd213550245011001210000220002400 400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合计65007370000 试检验两组饲料对试验动物肝中VA含量的作用有无显著差异 分析 此题为成对数据 事先不知两组饲料作用孰大孰小 用双尾 102 假设 2 水平 3 检验 H0 d 0HA d 0 0 01 4 推断 在0 01显著水平上 否定H0 接受HA 两组饲料对动物肝中VA含量作用有极显著差异 正常饲料组的动物肝中的VA含量极显著高于VE缺乏组 t0 01 7 3 499t t0 01 7 已知 103 对于一些成组数据 即使n1 n2 也不能用作成对数据的比较 因为成组数据的每一个变量都是独立的 没有配对的基础 也就是说 成对数据和成组数据平均数比较所依据的条件是不相同的 成对数据是假设各个配对的差数来自差数的分布为正态分布 具有N 0 d2 而每一配对的两个供试单位是彼此相关的 成组数据则是假定两个样本都来自具有共同或不同方差的正态总体 而两个样本的各个供试单位都是彼此独立的 因此在试验研究中 为加强某些试验条件的控制 以设计成成对数据的比较效果较好 如果在运用中将成对数据按成组数据的方法比较 容易使统计推断发生第二类错误 即不能鉴别本应属于显著的差异 成组数据与成对数据 104 总体方差 2已知 总体方差 2未知 n 30 n 30 一个样本平均数的假设检验 105 n 30 n 30 两个样本平均数的假设检验 12和 22已知 12和 22未知 成对数据 成组数据 106 成组数据 12 22 n1 n2 12 22 n1 n2 n 12 22 2 df n1 n2 2 107 第四章 第一节 第二节 第三节 第四节 第五节 假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验 参数的区间估计与点估计 方差的同质性检验 样本频率的假设检验 108 二项分布 频率分布 二项成数 目标性状 109 频率的假设检验 当np或nq 5 由二项式 p q n展开式直接检验 110 频率的假设检验 当np和nq 30 中心极限定理 正态分布 u检验 近似 111 频率的假设检验 当5 np或nq 30 由于二项总体的百分数 频率 是由某一属性的个体计算来的整数 所以是离散型的 当样本不太大时 把它当作连续型的近似正态总体来处理 结果会有些出入 容易发生第一类错误 补救的办法是仍按正态分布的假设检验计算 但必须进行连续性矫正 即随机变量所落的区间 0 5 如一个样本由矫正为 在经连续性校正之后所作的推断其准确性不亚于2 2列联表 112 一 一个样本频率的假设检验 频率的假设检验 适用范围 检验一个样本频率 记为 和某一理论值或期望值p的差异显著性 113 在二项分布中 二项成数即百分数或频率 二项成数的标准差为 也称为二项总体成数的标准误 当p未知时 常以样本百分数来估计 此时上式改写为 称为样本成数标准误 即样本频率标准误 114 频率的标准误 其中q 1 p 1 当np和nq 30 不需连续性矫正 则u值为 115 2 当5 np或nq 30时 需要进行连续性矫正 其中 表示在 p时取 p时取 如果n 30时 如果n 30时 116 例 以紫花和白花的大豆品种杂交 在F2代共得289株 其中紫花208株 白花81株 如果花色受一对等位基因控制 控制紫花基因为显性 问该结果是否符合一对等位基因的遗传规律 4 紫花理论百分数p 0 75 白花理论百分数q 0 25 3 不知结果与遗传规律之比孰高孰低 用双尾检验 分析 1 一个样本频率的检验 2 np和nq 30 无需连续矫正 用u检验 117 假设 2 水平 3 检验 4 推断 H0 p 0 75HA p 0 75 选取显著水平 0 05 在0 05显著水平上 接受H0 否定HA 认为该结果符合孟德尔第一遗传定律 118 若按照次数资料进行检验 与频率检验结果一致 若检验H0 q 0 25 结果一样 119 例 用糯和非糯玉米杂交 按遗传学原理 预期F1植株上糯性花粉粒的出现率为0 5 现在一视野中检验20粒花粉 得到糯性花粉8粒 问此结果和理论值0 5是否相符 3 结果可能高于或低于理论值 故采用双尾检验 分析 1 一个样本频率的假设检验 2 5 np和nq 30 需要进行连续矫正 且n 30 故用t检验 120 假设 2 水平 3 检验 4 推断 H0 p 0 5 即结果与理论值相符 HA p 0 5 选取显著水平 0 05 t0 05 19 2 093tc t0 05 19 在0 05显著水平上 接受H0 否定HA 认为实得百分数0 4和理论百分数0 5相符 121 二 两个样本频率的假设检验 频率的假设检验 适用范围 检验两个样本频率和差异的显著性 一般假定两个样本的方差是相等的 即 122 两个样本频率差数的标准误 H0 p1 p2 p q1 q2 q 123 当n1 n2 n时 在总体p1和p2未知 假定条件下 可用两样本频率的加权平均值作为对p1和p2的估计 即 124 1 当np和nq 30 不需连续性矫正 用u检验 在H0 p1 p2下 125 2 当5 np或nq 30 需进行连续性矫正 如果n 30 用u检验 在H0 p1 p2下 126 2 当5 np或nq 30 需进行连续性矫正 如果n 30 用t检验 在H0 p1 p2下 127 例 研究地势对小麦锈病发病的影响 比较两块麦田锈病发病率是否有显著性差异 低洼地麦田378株 其中锈病株342株 高坡地麦田396株 其中锈病株313株 3 事先不知两块麦田的锈病发病率孰高孰低 用双尾检验 分析 1 2个样本频率的假设检验 2 np和nq 30 无需连续矫正 用u检验 128 假设 2 水平 3 检验 H0 p1 p2即两块麦田锈病发病率没有显著差异 HA p1 p2 选取显著水平 0 01 129 在0 01显著水平上 否定H0 接受HA 认为两块麦田锈病发病率有极显著差异 即地势对小麦锈病的发生有极显著影响作用 低洼地小麦锈病的发病率极显著高于高坡地 4 推断 u 2 58 130 例 某鱼场发生了药物中毒 检验甲 乙两池发生药物中毒以后 鱼的死亡率是否有显著性差异 抽查甲池中的29尾鱼 有20尾死亡 抽查乙池中的28尾鱼 有21尾死亡 3 事先不知两池鱼的死亡率孰高孰低 用双尾检验 分析 1 2个样本频率的假设检验 2 5 np和nq 30 需进行连续矫正 因n1 30 n2 30 用t检验 131 假设 2 水平 3 检验 H0 p1 p2即甲乙两池鱼的死亡率没有显著差异HA p1 p2 选取显著水平 0 05 132 df 29 28 2 55 在0 05显著水平上 接受H0 否定HA 认为发生药物中毒后 甲 乙两鱼池鱼的死亡率没有显著差异 4 推断 t0 05 55 2 004 tc t0 05 55 133 例 用敌百虫 乐果混合液处理25头棉铃虫 死亡15头 存活10头 单用乐果处理24头 死亡9头 存活15头 检验两种处理的杀虫效果是否有显著性差异 3 事先不知两处理害虫死亡率孰高孰低 双尾检验 分析 1 2个样本频率的假设检验 2 5 np和nq 30 需进行连续矫正 因n1 30 n2 30 用t检验 134 假设 2 水平 3 检验 H0 p1 p2即两种处理的杀虫效果没有显著差异 HA p1 p2 选取显著水平 0 05 135 df 25 24 2 47 在0 05显著水平上 接受H0 否定HA 两种处理的杀虫效果没有显著性差异 4 推断 t0 05 47 2 0147 tc t0 05 47 136 u不作矫正 更容易否定H0 犯 错误 弃真错误 137 统计推断 假设检验 参数估计 由样本统计量对总体参数在一定概率水平下所作的估计 138 第四章 第一节 第二节 第三节 第四节 第五节 假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验 参数的区间估计与点估计 方差的同质性检验 参数的区间估计与点估计 139 在实践中 我们常常希望对某些参数给出估计值 农作物的产量 产品的合格率 某种疾病的发病率 回答 140 答案 参数估计 parameterestimation 141 例 使用克矽平治疗矽肺病 治疗前N 126 240 治疗后n 6 x 136 选择 0 05 则u 1 96 接受H0 接受H0 接受H0 接受H0 142 参数的区间估计和点估计是建立在一定理论分布的基础上的一种方法 理论分布可以是正态分布 也可以是泊松分布或二项分布 由中心极限定理和大数定理得知 只要抽样为大样本 不论其总体是否为正态分布 其样本统计量都近似服从正态分布 143 由此可见 在 0 05条件下 只要落在 1 96 1 96 区间内 所有的H0都将被接受 即满足 在 0 01 144 对于某一概率标准 有通式 其中 取 时 P 1 称为置信度 置信水平 置信系数 称为 的1 置信区间 置信距 区间的上下限称为置信限 分别记作L2和L1 所以 区间便是用样本平均数x对总体平均数 的置信度为P 1 的区间估计 145 那么 可用表示样本平均数x对总体平均数 的置信度为P 1 的点估计 当 0 05时 包含有 的置信度为P 1 0 05 0 95的区间估计为 点估计为 当 0 01时 包含有 的置信度为P 1 0 01 0 99的区间估计为 点估计为 146 在克矽平例子中 区间估计为 点估计为 即 147 二 平均数的区间估计和点估计 一 一个总体平均数 的区间估计和点估计 1 总体方差 2已知 或总体方差 2未知但n 30时 用样本平均数x和总体方差 2作出在置信度P 1 的总体平均数 的区间估计 或 当 2已知 2未知 n 30 148 其置信区间的下限L1和上限L2为 此时 总体平均数的点估计L为 或 或 149 2 总体方差 2未知且n 30时 用s2估计 2 则样本平均数x和总体方差 2作出在置信度P 1 的总体平均数 的区间估计 其置信区间的下限L1和上限L2为 此时 总体平均数的点估计L为 150 例 测得某批25个小麦样本的平均蛋白质含量为14 5 已知 2 50 试进行95 置信度下的蛋白质含量的区间估计和点估计 分析 1 这是一个总体平均数的参数估计 已知 用u 2 置信度P 1 0 95 则 0 05 解 区间估计 151 这批小麦总体蛋白质含量在13 52 15 48 之间的置信度为95 点估计 结论 152 分析 1 这是一个总体平均数的参数估计 未知 用s2估计 2 n 30 用t 2 置信度P 1 0 99 则 0 01 解 例 从某渔场收对虾的总体中 随机取20尾对虾 测得平均体长为120mm 标准差为15mm 试估计置信度为99 的对虾总体平均数 当df 20 1 19时 t0 01 2 861 153 区间估计 该渔场对虾的体长在110 4mm 129 6mm之间 这个估计有99 的把握 点估计 结论 154 二 两个总体平均数 1 2的区间估计和点估计 适用范围 在一定置信度下 估计两总体平均数 1 2至多能差多少 至少能差多少 估计方法依两总体方差是否已知或是否相等而有不同 155 1 当两个总体方差 12和 22为已知 或两总体方差 12和 22未知但为大样本时 在置信度为P 1 下 当 2已知 156 在置信度为P 1 下 两个总体平均数差数 1 2的区间估计为 两个总体平均数差数 1 2的点估计 为 其置信区间的下限 1和上限L2为 157 在置信度为P 1 下 两个总体平均数差数 1 2的区间估计为 当 2未知 n 30 两个总体平均数差数 1 2的点估计 为 其置信区间的下限 1和上限L2为 158 2 当两个样本为小样本 总体方差 12和 22未知 1 当两总体方差相等 即 12 22 2时 可由两样本方差s12和s22估计总体方差 12和 22 在置信度为P 1 下 两总体平均数差数 1 2区间估计为 df n1 n2 2 159 两个总体平均数差数 1 2的点估计 为 其置信区间的下限 1和上限L2为 160 2 当两总体方差不相等 即 12 22时 可由两样本方差s12和s22对总体方差 12和 22的估计而算出的t值 已不是自由度df n1 n2 2的t分布 而是近似的服从自由度df 的t分布 在置信度为P 1 下 两总体平均数差数 1 2的区间估计为 161 其置信区间的下限 1和上限L2为 两个总体平均数差数 1 2的点估计 为 上式中 t df 为置信度为P 1 时自由度为df 的t临界值 162 3 当两样本为成对资料时 在置信度为P 1 时 成对数据总体差数 d的置信区间为 其置信区间的下限 1和上限L2为 其点估计L为 163 例 用高蛋白和低蛋白两种饲料饲养一月龄大白鼠 在三个月时 测定两组大白鼠的增重重量 g 两组的数据分别为 高蛋白组 134 146 106 119 124 161 107 83 113 129 97 123低蛋白组 70 118 101 85 107 132 94试进行置信度为95 时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计 分析 1 这是两个总体平均数的参数估计 因 1 2未知 且n1 n2均 30 用t df 12 7 2 17 2 置信度P 1 0 95 则 0 05 164 已知 区间估计 点估计 结论 高蛋白组大白鼠的增重量比低蛋白组低1 94g到高40 284g 这个估计有95 的把握 165 例 在研究饮食中缺乏VE与肝中VA的关系时 将试验动物按性别 体重等配成8对 并将每对中的两头试验动物用随机分配法分配在正常饲料组和VE缺乏组 然后将试验动物杀死 测定其肝中VA含量 结果如右表 配对正常饲料组VE缺乏组差数dd213550245011001210000220002400 400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合计65007370000 分析 此题为成对数据的参数估计 用t df 8 1 7 置信度P 1 0 99 则 0 01 试对表中资料进行置信度为99 的区间估计和点估计 166 已知 区间估计 点估计 结论 正常饲料组饲养的动物肝脏中VA含量比VE缺乏组至少高136 74IU g 1至多高1488 26IU g 1 这个估计有99 的把握 167 三 频率的区间估计和点估计 二项总体频率p的置信区间 可按二项分布或正态分布来估计 前者所得结果较为精确 可根据样本容量n和某一属性的个体数f 在已经制好的统计表上直接查出一对总体的上 下限 甚为方便 但该统计表上只包括小部分n 所以在实际应用时 可由正态分布来近似估计 由正态分布所得的结果只是一个近似值 168 一 一个总体频率p的区间估计和点估计 1 当np和nq 30时 区间估计为 下限和上限为 点估计为 置信度 1 169 2 当np或nq 30时 需要进行连续性校正 置信度 1 区间估计为 下限和上限为 点估计为 170 例 调查100株玉米 得到受玉米螟为害的植株为20株 即p 0 2或np 20 试进行置信度为95 的玉米螟为害率的区间估计和点估计 分析 1 这是一个总体频率的参数估计 因np30 用u 2 置信度P 1 0 95 则 0 05 171 0 05 1 96 已知 区间估计 点估计 结论 玉米螟为害率在0 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 协议书签字括号
- 2025江西南昌市东方航空配餐有限公司招聘劳务派遣人员1人模拟试卷及答案详解1套
- 文化遗产数字化展示策略报告-2025年文化遗产数字化展示与传播技术应用挑战
- 高校产学研合作2025年智能机器人技术转移与成果转化研究报告
- 2025湖北武汉市青山区区管国有企业有关岗位竞聘6人考前自测高频考点模拟试题附答案详解(典型题)
- 2025年新能源汽车与生物质能混合动力系统研发进展报告
- 2025黑龙江绥化市庆安县招聘教师36人考前自测高频考点模拟试题参考答案详解
- 2025年在线教育平台用户需求分析与满意度改进策略报告
- 2025湖南永州市双牌县第二中学教师遴选3人考前自测高频考点模拟试题及答案详解(名校卷)
- 2025年灌南县公开招聘事业单位工作人员43人考前自测高频考点模拟试题及答案详解(必刷)
- 土地属地管理办法
- (新教材)2025年秋期人教版二年级上册数学核心素养教案(第2单元)(教学反思有内容+二次备课版)
- 行车安全培训课件
- 机械检验培训课件
- 福建民间信仰管理办法
- 2.2中国的气候课件-八年级地理上学期湘教版
- DB11∕T 1130-2024 公共建筑节能运行管理与监测技术规程
- 2025电化学储能电站技术监督规程第5部分:化学与环保技术监督
- ppp审计管理制度
- 小儿鼾症麻醉管理要点
- 健康评估(第3版)课件6-2 泌尿系统常见症状评估
评论
0/150
提交评论