假设检验及其应用毕业论文.pdf_第1页
假设检验及其应用毕业论文.pdf_第2页
假设检验及其应用毕业论文.pdf_第3页
假设检验及其应用毕业论文.pdf_第4页
假设检验及其应用毕业论文.pdf_第5页
已阅读5页,还剩8页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

题 目 假设检验及其应用 1 论 文 提 要 假设检验是抽样推断中的一项重要内容。 它是根据原资料作出一个总体指标是否 等于某一个数值某一随机变量是否服从某种概率分布的假设然后利用样本资料采 用一定的统计方法计算出有关检验的统计量依据一定的概率原则以较小的风险来 判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异是否应当接 受原假设选择的一种检验方法。 用样本指标估计总体指标其结论有的完全可靠有的只有不同程度的可靠性 需要进一步加以检验和证实。通过检验对样本指标与假设的总体指标之间是否存在 差别作出判断是否接受原假设。这里必须明确进行检验的目的不是怀疑样本指标 本身是否计算正确而是为了分析样本指标和总体指标之间是否存在显著差异。从这 个意义上假设检验又称为显著性检验。 2 假设检验及其应用 陈雪枫 摘 要 假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 具体 作法是根据问题的需要对所研究的总体作某种假设记作 0 H选取合适的统计量这个 统计量的选取要使得在假设 0 H成立时 其分布为已知 由实测的样本 计算出统计量的值 并根据预先给定的显著性水平进行检验作出拒绝或接受假设 0 H的判断。常用的假设检验 方法有 u检验法、t检验法、X2 检验法、F检验法秩和检验等 关键词数学归纳法 归纳原理 历程 应用 推广 序言 假设检验亦称“显著性检验Test of statistical significance”是 假设检验 用来判断样本与样本 样本与总体的差异是由抽样误差引起还是本质差别造成的统计 推断方法。其基本原理是先对总体的特征作出某种假设然后通过抽样研究的统计推 理对此假设应该被拒绝还是接受作出推断。 生物现象的个体差异是客观存在以 致抽样误差不可避免所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个 样本均数或率 、样本均数率与已知总体均数率有大有小时应当考虑到 造成这种差别的原因有两种可能 一是这两个或几个样本均数或率 来自同一总体 其差别仅仅由于抽样误差即偶然性所造成二是这两个或几个样本均数或率来自 不同的总体即其差别不仅由抽样误差造成而主要是由实验因素不同所引起的。假 设检验的目的就在于排除抽样误差的影响区分差别在统计上是否成立并了解事件 发生的概率。 3 1 假设检验的基本思想 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件P 0 假设检验就是根 据样本观察结果对原假设H0进行检验接受 H0就否定 H1拒绝 H0就接受 H1。 2 假设检验的原理 一般地说对总体某项或某几项作出假设然后根据样本对假设作出接受或拒绝的判断这 种方法称为假设检验。 假设检验使用了一种类似于“反证法”的推理方法它的特点是 1 先假设总体某项假设成立计算其会导致什么结果产生。若导致不合理现象产生 则拒绝原先的假设。若并不导致不合理的现象产生则不能拒绝原先假设从而接受原先假 设。 2 它又不同于一般的反证法。所谓不合理现象产生并非指形式逻辑上的绝对矛盾 而是基于小概率原理概率很小的事件在一次试验中几乎是不可能发生的若发生了就是 不合理的。至于怎样才算是“小概率”呢通常可将概率不超过 0.05 的事件称为“小概率事 件”也可视具体情形而取 0.1 或 0.01 等。在假设检验中常记这个概率为 称为显著性水 5 平。而把原先设定的假设成为原假设记作 H0。把与 H0相反的假设称为备择假设它是原 假设被拒绝时而应接受的假设记作 H1 3 假设检验的种类 假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。 正态分布检验包括三类JB 检验、KS 检验、Lilliefors 检验用于检验样本是否来自于 一个正态分布总体。 正态总体均值检验检验分析方法和分析结果的准确度考察系统误差对测试结果的影 响。从统计意义上来说各样本均值之差应在随机误差允许的范围之内。反之如果不同样 本的均值之差超过了允许的范围这就说明除了随机误差之外各均值之间还存在系统误 差使得各均值之间出现了显著性差异。 正态总体均值检验分为两种情况 t 检验是用小样本检验总体参数特点是在均方差不知道的情况下可以检验样本平均 数的显著性分为单侧检验与双侧检验。当为双样本检验时在两样本 t 检验中要用到 F 检 验。 从两研究总体中随机抽取样本要对这两个样本进行比较的时候首先要判断两总体方差是 否相同即方差齐性。若两总体方差相等则直接用 t 检验若不等可采用 t检验或变量 变换或秩和检验等方法。 若总体服从正态分布 N(,),但 未知,记,则 t=遵从自由度为 n-1 的 t 分布可 对 有以下的水平为 的检验其中 t 为自由度为 n-1 的 t 分布的上 分位数。这些 检验称为 t 检验。 假设检验 Z 检验是一般用于大样本(即样本容量大于 30)平均值差异性检验的方法。 上面所述的检验都是基于样本来自正态总体的假设在实际工作中有时并不明确知道 样本是否来自正态总体这就为假设检验带来难度。非参数检验方法对样本是否来自正态 总体不做严格的限制而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检 验方法。 6 4 假设检验规则与两类错误 4.1 确定检测规则 检验过程是比较样本观察结果与总体假设的差异。差异显著超过了临界点拒绝 H0反 之差异不显著接受 H0。 差异 临界点 判断 c 拒绝 H0 c 接受 H0 怎样确定 c? 4.2 两类错误 接受或拒绝 H0都可能犯错误 I 类错误弃真错误发生的概率为 II 类错误取伪错误发生的概率为 检验决策 H0为真 H0非真 拒绝 H0 犯 I 类错误 正确 接受 H0 正确 犯 II 类错误 大 就小 小 就大 基本原则力求在控制 前提下减少 7 显著性水平取值0.1, 0.05, 0.001, 等。如果犯 I 类错误损失更大为减少损 失 值取小如果犯 II 类错误损失更大 值取大。 确定 就确定了临界点 c。 设有总体XN22已知。 随机抽样样本均值barXN(mu,sigma2/n)。 标准化 确定 值 查概率表知临界值 计算 Z 值作出判断。 8 5 假设检验的一般步骤 1、提出检验假设又称无效假设符号是 H0 和备择假设符号是 H1 。 H0样本与总体或样本与样本间的差异是由抽样误差引起的 H1样本与总体或样本与样本间存在本质差异 预先设定的检验水准为 0.05当检验假设为真但被错误地拒绝的概率记作 通常取 =0.05 或 =0.01。 2、选定统计方法由样本观察值按相应的公式计算出统计量的大小如 X2 值、 t 值等。根据资料的类型和特点可分别选用 Z 检验T 检验秩和检验和卡方检验 等。 3、 根据统计量的大小及其分布确定检验假设成立的可能性 P 的大小并判断结果。 若 P结论为按 所取水准不显著不拒绝 H0即认为差别很可能是由于抽样误差 造成的在统计上不成立如果 P,结论为按所取 水准显著拒绝 H0接受 H1 则认为此差别不大可能仅由抽样误差所致很可能是实验因素不同造成的故在统计 上成立。P 值的大小一般可通过查阅相应的界值表得到。 教学中的做法 1.根据实际情况提出原假设和备择假设 2.根据假设的特征选择合适的检验统计量 3.根据样本观察值计算检验统计量的观察值(obs) 4.选择许容显著性水平并根据相应的统计量的统计分布表查出相应的临界值 (ctrit) 5.根据检验统计量观察值的位置决定原假设取舍 9 6 假设检验应注意的问题 1、做假设检验之前应注意资料本身是否有可比性。 2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。 3、根据资料类型和特点选用正确的假设检验方法。 4、根据专业及经验确定是选用单侧检验还是双侧检验。 5、当检验结果为拒绝无效假设时应注意有发生 I 类错误的可能性即错误地拒绝了 本身成立的 H0发生这种错误的可能性预先是知道的即检验水准那么大当检验结果为 不拒绝无效假设时应注意有发生 II 类错误的可能性即仍有可能错误地接受了本身就不 成立的 H0发生这种错误的可能性预先是不知道的但与样本含量和 I 类错误的大小有关 系。 6、判断结论时不能绝对化应注意无论接受或拒绝检验假设都有判断错误的可能性。 7、报告结论时是应注意说明所用的统计量检验的单双侧及 P 值的确切范围。 6 参数估计与假设检验 统计推断是由样本的信息来推测母体性能的一种方法它又可以分为两类问题 即参数估计和假设检验。实际生产和科学实验中大量的问题是在获得一批数据后 要对母体的某一参数进行估计和检验。 例如我们对 45 钢的断裂韧性作了测定取得了一批数据然后要求 45 钢断裂 韧性的平均值或要求 45 钢断裂韧性的单侧下限值或要求 45 钢断裂韧性的分散度 (即离散系数)这就是参数估计的问题。 又如经过长期的积累知道了某材料的断裂韧性的平均值和标准差经改进热 处理后又测得一批数据试问新工艺与老工艺相比是否有显著差异这就是假设检 验的问题。 这样可以看出参数估计是假设检验的第一步没有参数估计也就无法完成假 设检验。 7 假设检验与置信区间的关系 假设检验与置信区间有密切的联系我们往往可以由某参数的显著性水平为 的检验得 到该参数的置信度为 1 的置信区间反之亦然。例如显著性水平 的均值 的双侧检 验问题 10 H0: = 0 与置信度为 1- 的置信区间之间有着这样的关系若检验在 水平下接受 H0则 的 1 - 的置信区间必须包含 0反之若检验在 水平下拒绝 H0则 的 1- 的置信区间 必定不包含 0。因此我们可以用构造 的 1- 置信区间的方法来检验上述假设如果构 造出来的置信区间包含 0就接受 H0如果不包含 0就拒绝 H0。同样给定显著水平 可以从构造检验规则的过程中得到 的 1- 置信区间。 如上例 的置信度为 95%的置 信区间为 即置信区间为(80.55 , 85.45)因为 0 = 80不在这个区间内拒绝 H0 8 几种常见的假设检验 考虑下面三种类型的假设检验 (4.12) 1双边检验 2右侧单边检验 3左侧单边检验 11 9 假设检验的应用分析 91 平均值假设应用 例 在两台不同类型的粗糙度测量仪器上测量同一粗糙度样块的Ra值由以往经验知道它 们的测量值服从正态分布且 120 0.04 m,今在这两台仪器上测得同样一块的 Ra值如下 仪 器 甲1.601.631.67 1.581.551.631.651.601.58。 仪 器 乙1.541.571.601.521.601.621.641.57. 问这两台仪器测得的 Ra 值的均值有无显著不同。 解 1已知 120 0.04 m待检验假设 0 H 12 。 2计算统计量 1 x 1.61m 1 n=9 2 x=1.58m 2 n=8 u= 12 1 12 11 xx nn = 1.611.58 11 0.04 89 =1.55 3取0.05由文献1正态分布表查得 u0.025=-1.96=1.96 4判断。令u=1.551.96故接受假设可认为两者的均值无显著差异这两台 仪器可以对同一批粗糙度样块进行检定。 例 某教师为了比较两种不同的短跑教学效果拟采用对照实验以 50m 跑为实验指标 分实验组和对照组。已知实验组、对照组实验前各指标的均值及标准差见表 1 为了考察两组各项指标在实验前是否齐同采用如下假设的检验方法 1 1 H 12 U =U 12 2t= 12 22 122 12 (1)(1)11 () 2 xx nsns nnnn 经计算t=-1.608 3查表 0.05 t25+23-2=2.014P0.05。 4结论两组 50m 跑成绩差异不显著。据此认为可以进行教学实验。 结束语 运用“假设检验”来解决实际问题能避免人工判断中主观因素的影响保证了判断结 果的客观公正、符合实际。合理运用假设检验的统计方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论