第七章假设检验_第1页
第七章假设检验_第2页
第七章假设检验_第3页
第七章假设检验_第4页
第七章假设检验_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 假设检验第一节 检验原理一. 提出原假设 (Null Hypothesis 和备择假设 (Alternative Hypothesis ; 所谓假设,是指需要进行验证的统计结论。原假设是作为统计分析前提的假设,备择假设是在原假设不成立的情况下所接受的假 设。二.确定适当的检验统计量 T ;检验统计量 T 是用于检验原假设是否成立的标准,在原假设成立的前提下,统计量 T 满足某种特征,三.规定显著性水平 a (犯弃真错误的概率 ;显著性水平 是设定一个弃真错误的概率,理论上说,没有一个检验是百分之百正确的, 必然有一定的概率犯错误。检验的错误分为两种类型,一是弃真错误,二是取伪错误。所谓

2、弃真错误,是指原假设为真,但检验的结果拒绝了原假设;取伪错误,是指原假设为假,但检验的结果接受了原假设。当在原假设条件下, T 值 出现的概率小于 a 时,拒绝原假设。一个小概率事件出现,因此拒绝原假设。a 值越大,表明犯弃真错误的概率越大,越容易拒绝原假设,此时称检验越严格。 如果减小拒绝域, 就意味着扩大接受域, 从而扩大了犯取伪错误的概率。 弃真和取伪是 一对矛盾体,只有通过改进检验方法,例如扩大样本量, 或者使用更好的统计量, 才可以使 二者同时缩小。a 值需要由检验目的来确定, 当取伪造成的损失大于弃真造成的损失时, 应扩大 a 值。 四.计算检验统计量 T 的值;根据检验中获得的数

3、据,计算统计量 T 的值。五.作出统计决策。根据 T 的取值特征,计算取该值的概率,如果此概率小于 a ,则拒绝原假设。例子:某裁判观察到球员 A 有类似于上肢触球的表现,现需决定是否判其为手球。1.确定原假设:球员 A 没有上肢触球2.确定统计量 T :球在接触球员 A 的身体后反弹的角度3.确定 显著性水平 :a =0.054.计算 T 值 :根据裁判的观察确定球的反弹角度为 X5.统计判断:当一名球员使用上肢之外的身体部分触球时,球的反弹角度为 X 的概率 为 0.03。由于 0.03<0.05,拒绝原假设,即认为球员 A 存在上肢触球。在本例中,有 3%的可能性发生弃真错误,即球

4、员 A 没有上肢触球,但裁判作出了错 误判断。第二节 利用正态分布的假设检验案例利用正态分布的特征进行假设检验是比较常用的方法, 有许多统计量符合正态分布, 因 此可以利用正态分布进行分析。例题:某厂产品使用寿命符合正态分布,其中 m0=1020, s=100,从最近生产的产品中抽 选 16件,测得 m1=1080,试在 a =0.05的水平下,检验产品质量是否有显著提高。 本例使用正态分布的前提条件, H0:m1=m0=1020计算统计量 z因此,拒绝原假设。统计软件中提供的 P-level 为统计量处于 T 值 范围之外的概率, 当此概率小于 a 值时, 拒绝原假设。在本例中, P(Z&g

5、t;2.4=0.0082<0.05因此拒绝原假设。在统计软件中,对于左侧、右侧和双侧检验需进行区分。第三节 非参数统计非参数统计方法不涉及描述总体分布的有关参数,例如正态分布的方差、期望等内容, 因此称为与分布无关的(Distribution Free 。在推断过程中,仍需利用样本的其他分布信息,尤其是关于秩(rank 的信息。 将数据从小到大进行排列,每一个具体数据项所处的位置或次序,称为该数据的秩。一.卡方检验(Chi-Square Goodness-of-Fit Test卡方检验一直有极其广大的应用领域, 所有这些应用有一个共同点, 即拥有足够大的样 本使得在零假设下通过多元的正态

6、中心极限定理来保证检验统计量有渐近的 Chi-Square 分布一个重要的 Chi-Square 检验类型为 Pearson 拟合优度统计量在 r 个不重叠的类中,所观察到的计数 O 与在零假设下的期望值 E 之间的差距。在零 假设成立时, Q 满足(r-1个自由度的分布。例题:已知某型生态群落中 A 、 B 、 C 、 D 四类植物的比重分别为 80%, 12%, 7%和 1%。 现观察某地共 500株植物,发现四类植物的数量分别为 380、 69、 43和 8株。试在 5%的 显著性水平 下,判断该地生态群落是否为某型。植物 O E O-E (O-E2 (O-E2/EA 380 400 -

7、20 400 1.00B 69 60 9 81 1.35C 43 35 8 64 1.83D 8 5 3 9 1.80合计 500 500 -5.98查表得(4-1=3个自由度, a =0.05的分布值为 7.82,所以不能拒绝原假设。二.列联表分析列联表是调查数据处理中最常见的形式。 列联表分析的目的在于研究两个变量之间是否 存在相互影响的关系。可以认为是一种定类尺度的相关分析。例题:下例为三种不同类型电风扇在三个不同地带销售的数量情况。 欲了解电风扇类型与地带 之间是否存在相关关系。热带 温带 寒带 合计台式 14 30 4 48落地式 67 105 60 232台地式 30 13 14

8、57合计 111 148 78 337假定销售地区与销售产品类型之间没有相关关系,则同为台式电风扇,在热带、温带、 寒带的销售数量比例应当等同于这三个地带购买电风扇数量的比例。即:台式-热带=48111/337同样可求出其余各单元格的期望数值利用观察值与期望值之间的差异,可进行检验。热带 温带 寒带 合计台式 14/15.81 30/21.08 4/13.19 48落地式 67/76.42 105/101.88 60/3.70 232台地式 30/18.77 13/25.04 14/11.11 57合计 111 148 78 337Q 值满足自由度为(R-1 (C-1的分布查表得 4个自由度,

9、 a =0.05的值为 9.49,拒绝原假设。三.符号检验对于一个只存在+、-两种符号的序列,考察两种符号的出现是否具有倾向性。建立原假设 H0:P +=P -计算两种符号的数量 S +和 S -, 利用二项分布计算 S +或 S -出现的概率是否处于接 受域。在 n>20的情况下,二项分布可以用正态分布进行近似四.游程检验游程检验又称连贯检验或串检验, 用于考察一个序列中两种符号的出现次序是否随机。 一种符号连续出现的段称为一个游程。序列 AABBAB 共有四个游程,即 AA 、 BB 、 A 、 B 。在符号随机出现的情况下,游程数应当适中。符号出现非随机的情况包括:游程数过少:序列

10、有成群的倾向游程数过多:序列有混合的倾向例题:观 察 一 个 系 列 , 分 析 30个 脸 谱 的 出 现 是 否 有 规 律 AAAABBBBBBBBBBBBBBBBAAABBBBBBB 。H0:脸谱的出现是随机的H1:脸谱的出现具有成群的倾向当两种符号的数量之和 m+n=N>20时,游程总数目 U 近似符合正态分布:平均值:1+2mn/N方差:2mn(2mn-N/N*N*(N-1在本例中:m=7, n=23, N=30, U=4计算 Z 值P-level 值为 0.0002,拒绝原假设,即认为 U 过小,原序列有成群的倾向。五.上下游程检验上下游程(Runs Up and Down亦称升降串,是利用观察值前后大小变化来进行游 程检验的一种方法。将数据按获得的先后顺序进行排列, 将每个观察值与其前面的观察值进行比较, 如果前 面的数值较小, 记+号, 如果前面的数值较大, 记-号。 +、 -号构成一个新的游程序列。 例如序列:7、 15、 1、 2、 5、 8,经处理后转化为+、-、+、+、+。其中 N =6, 游程数 V =3。例题:对 24名儿童依次进行一项测试活动,获得下列分数序列:31, 23, 36, 43, 41, 44, 12, 26, 43, 75,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论