第八章:统计检验的基本方法课件_第1页
第八章:统计检验的基本方法课件_第2页
第八章:统计检验的基本方法课件_第3页
第八章:统计检验的基本方法课件_第4页
第八章:统计检验的基本方法课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章:统计检验的基本方法第1节:统计假设检验的基本原理第2节:样本平均数与总体平均数的差异检验第3节:两个总体平均数的差异检验第4节:比率差异的显著性检验第5节:多个平均数的差异检验-方差分析初步黔南民族师范学院管理科学系第八章:统计检验的基本方法第1节:统计假设检验的基本原理黔南第1节:统计假设检验的基本原理一、统计检验的目的问题1:某已知样本,其统计量与已知总体参数之间的差异是实质性的还是由误差造成。(部份与整体)问题2:两种现象之间的差异是实质性的还是非实质性的。(整体与整体)(一)概念:事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。(二)目的:判断研究对

2、象之间的差异性质及差异程度。第1节:统计假设检验的基本原理一、统计检验的目的二、假设的建立(一)基本假设(虚无假设、原假设、零假设):即没有差异的假设。1、当前样本所属总体与原总体没有差异。2、两样本所属总体没有差异。记为:“H0”。表示法:如均数差异检验: H0 :=0 H0:u1=u2(二)备择假设(对立假设):即有差异的假设。是研究者希望接受的假设。1、当前样本所属总体与原总体有差异。2、两样本所属总体有差异。记为: “H1” 。表示法:如均数差异检验: H1 :0 H1 :u1 u2二、假设的建立统计检验的思路: 进行统计检验,就是首先假定H0成立,然后运用概率论的原理,计算H0成立的

3、概率P有多大,P大则接受,P小(一般小于0.05或0.01)则说明H0成立的可能性极小,此时要拒绝或否定H0 。第八章:统计检验的基本方法课件三、假设检验的基本思想见下页图三、假设检验的基本思想见下页图平均数抽样分布的置信度与置信区间Z0.05/2=1.96 1 - 置信度:95%返回上页置信区间(Z=1.96)平均数抽样分布的置信度与置信区间Z0.05/2=1.96 (一)否定域的构建: 小概率事件与显著性水平1、小概率事件:落入置信区间的事件称为大概率事件;落入置信区间之外的事件称为小概率事件。即,H0成立的可能性小于0.05或0.01的事件称为小概率事件。如果 与无显著差异,则落入置信区

4、间内的可能性极大,而落入置信区间外的可能性极小。(一)否定域的构建:2、显著性水平(否定域): 拒绝H0的概率称为显著性水平。常用的有0.05与0.01,用=0.05,=0.01表示。显著性水平与置信度相对应,0.050.95,0.010.99。以上两个显著性水平相比,0.05比0.01更容易拒绝H0 2、显著性水平(否定域):(二)、假设检验的两类错误1、错误:拒绝属于真实的H0所犯的错误(弃真)。2、错误:接受错误的H0所犯的错误(纳伪)。为避免类错误,可尽量增大置信区间,减小显著性水平,但同时增大了犯错误的可能性;反之则增大犯错误的可能性。(二)、假设检验的两类错误第八章:统计检验的基本

5、方法课件(三)、单侧检验与双侧检验1、双侧检验:只强调差异而不考虑方向性的检验称为双侧检验。 (显著性概率集中于概率分布两侧)临界值:取双侧临界值,检验中临界值常记为 、 。Z分布中, =1.96、 =2.58。假设符号:“、”。(三)、单侧检验与双侧检验双侧检验的否定域与临界值临界值临界值a/2 a/2 否定域否定域接受域1 - 置信度双侧检验的否定域与临界值临界值临界值a/2 a/2 否定域否2、单侧检验:强调差异方向性的检验称为单侧检验。(显著性概率集中于概率分布一侧)临界值:取单侧临界值,检验中临界值常记为: 、 等。Z分布中,Z0.05=1.65、Z0.01=2.33。假设符号:“=

6、、”或“=、”。2、单侧检验:强调差异方向性的检验称为单侧检验。(显著性概率单侧检验的否定域与临界值临界值a拒绝域接受域1 - 置信度单侧检验的否定域与临界值临界值a拒绝域接受域1 - 置信度单侧检验与双侧检验的选用 逻辑判断法某地某年龄段儿童智商平均为100,该年龄段某普通班为103,检验差异。某地某年龄段儿童智商平均为100,该年龄段某重点班为103,检验差异。单侧检验与双侧检验的选用 备选假设判断法“是否有显著差异”:双侧检验。如某种材料的尺寸。“是否显著低于”:左侧检验。“是否显著高于”:右侧检验。如某种新技术的实施效果。一般情况选用双侧较为稳妥单侧检验与双侧检验的选用Z 检验 t 检

7、验Z 检验 c2检验均值单总体的检验比例方差假设检验主要内容双总体的检验Z 检验t 检验Z 检验F 检验独立样本配对样本均值比例方差多总体检验均数检验方差分析Z 检验 t 检验Z 检验 c2检验均值单总体的检验比例方差第2节:样本平均数与总体平均数的差异检验(单总体均数差异检验)一、基本原理:平均数的抽样分布(前述)平均数抽样分布的几个定律。平均数抽样分布的两种典型形态。第2节:样本平均数与总体平均数的差异检验(单总体均数差异检验二、检验的基本步骤1、确定检验形式:双侧或单侧检验。2、建立H0与H1:双侧检验一般为:=0、03、假设H0成立,计算样本平均数的统计量Z或t:4、推算 的统计量是否

8、落入置信区间内。查表对照,|Z|与Z0.05或Z0.01等临界值比较,| t |与t0.05或t0.01等临界值比较。5、结论:|Z| Z0.05或Z0.01 ,| t | t0.05或t0.01 ,说明H0成立的概率P0.05或0.01,则接受H0,拒绝H1;反之,则接受H1,拒绝H0。 二、检验的基本步骤统计量Z值或t值的计算公式 (总体标准差已知)(总体标准差已知)统计量Z值或t值的计算公式三、假设检验的过程(检验实例)【例1】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽

9、取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05)三、假设检验的过程(检验实例)【检验过程】、已知: 0=0.081mm、 0.076mm n=200、 = 0.025 、 0.05、确定检验形式:双侧检验。、建立假设: 00.081mm : 00.081mm 、计算统计量(总体标准差已知)、统计决断:因|Z|2.83, .58,|Z| ,.01。否定H0,接受H。、结论:新机床加工的零件的椭圆度与以前有显著差异。【检验过程】【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随

10、机抽查9包,测得样本平均重量为986克,样本S校正标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正【检验过程】、已知: 0=1000、 986n=9、 S= 24、df=9-1=8、确定检验形式:双侧检验。、建立假设: 01000 : 01000、计算统计量t(总体标准差未知)、统计决断:因|t|1.75, 2.306,|t| ,.05。保留H0,拒绝H。、结论:统计检验表明这天自动包装机工作正常【检验过程】【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000

11、公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一【检验结果】H0: 40000H1: 0 = 0.05n1 = 10,n2 = 8结论:没有证据表明用第二种方法组装更好【检验结果】 【例3】为检验独生子女与非独生子女的社会性方面的差异,分别随机抽取独生子女50人,非独生子女50人进行认知能力测验。测验结果独生子女平均得分为25.3分,标准差为6分;非独生子女平均得分为29.

12、9分,标准差为5.9分。试检验独生子女与非独生子女社会认知能力方面的差异性? Z=(25.3-29.9)/1.19=-3.86 【例3】为检验独生子女与非独生子女的社会性方面的差异,分【例4】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:在 a = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前94.5101110103.59788.596.5101104116.5训练后8589.5101.5968680.58793.593102【例4】一个以减肥为

13、主要目标的健美俱乐部声称,参加其训练班至H0: m1 m2 8.5H1: m1 m2 8.5a = 0.05df = 10 - 1 = 9结论:该俱乐部的宣称是可信的H0: m1 m2 8.5 说明:以上统计检验方法有一个前提条件,即12与22差异不显著,如果差异较大,要先进行方差齐性检验。 说明:以上统计检验方法有一个前提条件,即12与2EXCEL统计检验:数据分析 Z检验:双样本平均差检验。 t检验:双样本等方差检验。 t检验:双样本异方差检验。 t检验:平均值成对二样本分析。EXCEL统计检验:第4节:比率差异的显著性检验一、样本比率与总体比率差异的显著性检验 (单总体比率差异检验)(一

14、)大样本 条件:1、N30。 2、0.10P0.90。此时比率的抽样分布二项分布近似正态分布。第4节:比率差异的显著性检验一、样本比率与总体比率差异的显著1、比率抽样分布的标准误差(SEP): 上式中,P/:总体比率,n:样本容量。2、检验的统计量:上式中:p:样本比率, P/:总体比率, SEP:比率抽样分布的标准误差。1、比率抽样分布的标准误差(SEP):【例1】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05)【例1】某研究者估计本市居民家庭的电脑拥有率为30%。现随机【检验过程】、已知:n=20

15、0,P=68/200=34%,P/=30%、确定检验形式:双侧检验。、建立假设,设P=34%所属的总体为P0/ : P0/ P/= 30%: P0/ P/ 30%、计算统计量Z、统计决断:因|Z|1.234, Z0.05/21.96,|Z| Z0.05/2 ,.05。保留H0,拒绝H。、结论:检验表明研究者的估计可信。【检验过程】 【例2】某年中国的文盲率为16.5%,该年调查某贫困乡8561口人中,有3578个文盲。试检验该乡文盲率与全国文盲率的差异性? SEP= =0.000028 Z=(0.4179-0.1650)/0.000028=5032.14 【例2】某年中国的文盲率为16.5%,

16、该年调查某贫困乡85(二)小样本同小样本总体比率统计估计一样,需用查表法(包括大样本,但P0.90与P0.10的情况) (二)小样本二、双总体比率的差异显著性检验(一)独立大样本。1、比率之差抽样分布的标准误SED% 上式中,n1、n2:两样本的容量,P:两样本百分数的加权平均数。即:二、双总体比率的差异显著性检验2、检验的统计量:P1:样本1的比率, P2:样本2的比率,SED%:比率之差抽样分布的标准误。2、检验的统计量:(二)检验过程(示例)【例1】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技术培训。能

17、否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?(二)检验过程(示例)【计算必要的统计量】【计算必要的统计量】【检验过程】、已知:n1=60,n2=40,P1=18/60=30%, P2=14/40=35%,、确定检验形式:双侧检验。、建立假设,设P1的总体为P1/,P2的总体为P2/ : P1/ P2/: P1/ P2/、计算统计量Z、统计决断:因|Z|0.53, Z0.05/21.96,|Z| Z0.05/2 ,.05。保留H0,拒绝H。、结论:没有证据表明乙厂工人参加技术培训的人数比例高于甲厂。【检验过程】【例2】比较两种药物对某种疾病的疗效。经临床观察表明,在500例服用

18、药物A的患者中,有效率为81.6%,在800例服用药物B的患者中,有效率为84.5%。问上述资料是否表明药物B比药物A的疗效更显著?P=5000.816+8000.845/500+800=0.8338 SED%=0.0212 Z=(0.816-0.845)/0.0212-1.37【例2】比较两种药物对某种疾病的疗效。经临床观察表明,在50 【例3 】在某城市甲、乙两个地区内,分别抽样调查某种家电的拥有率。甲区抽查了240户,拥有率为37.5%;乙区抽查了150户,拥有率为24%。问调查结果能否说明两个地区拥有该种电器的居民户的比率之间有显著差异? 【例3 】在某城市甲、乙两个地区内,分别抽样调

19、查某种家电的(二)独立小样本 需用查表法或图示法(百分比率的置信上下限表)(二)独立小样本第5节:多个平均数的差异检验-方差分析初步 【示例】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况(见下页表)。试分析饮料的颜色是否对销售量产生影响。第5节:多个平均数的差异检验-方差分析初步 【示例】某第八章:统计检验的基本方法课件一、方差分析的基本原理(一)方差分析的目的通过对方差的分析检验多个平均数的差异显著性。

20、 一、方差分析的基本原理(二)方差分析的几组术语1、因素、水平与观察值(1)因素或因子:所要检验的对象称为因子。(2)水平:因素的具体表现称为水平。(3)观察值:在每个因素水平下得到的样本值。(二)方差分析的几组术语2、随机误差与系统误差(1)随机误差:由于抽样的随机性所造成的误差,称为随机误差 。(2)系统误差:由系统性因素造成的误差,称为系统误差。2、随机误差与系统误差3、组内方差与组间方差(1)组内方差:因素的同一水平(同一个总体)下样本数据的方差。组内方差只包含随机误差(2)组间方差:因素的不同水平(不同总体)下各样本之间的方差。组间方差既包括随机误差,也包括系统误差3、组内方差与组间

21、方差4、单因素方差分析与多因素方差分析(1)单因素方差分析:方差分析只针对一个因素进行。(2)多因素方差分析:方差分析中同时针对多个因素进行。其中双因素方差分析是最常见的。4、单因素方差分析与多因素方差分析(三)方差分析的基本逻辑1、如果不同水平对结果没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组间方差与组内方差就应该很接近,两个方差的比值就会接近12、如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于13、当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异(三)方差分析

22、的基本逻辑(三)F分布 组间方差(水平间方差)与组内方差(水平内方差)之比是一个统计量。数理统计证明,这个统计量服从F分布(F Distribution)。. (三)F分布1、F分布的特点:(1)统计量F是大于0的正数。(2)F分布曲线为正偏态,它的尾端以横轴为渐进线趋于无穷。(3)F分布是一种连续型的概率分布,不同的自由度组合有不同的分布曲线。(见下页图示)2、F分布表的查法。1、F分布的特点:F分布曲线图F(k-1,n-k)0拒绝H0保留H0FF分布曲线图F(k-1,n-k)0拒绝H0保留H0F三、单因素方差分析的过程(以上例示范)(一)建立假设H0:u1=u2=u3=u4:颜色对销售量没

23、有影响。H1:u1u2u3u4:颜色对销售量有影响。三、单因素方差分析的过程(以上例示范)如果原假设成立,即H0: m1 = m2 = m3 = m4则:没有系统误差每个样本都来自均值为、方差为2的同一正态总体 1 2 3 4 如果原假设成立,即H0: m1 = m2 = m3 = m4(二)计算统计量F(三)在一定的显著性水平下,对照F与临界值 (r-1,n-r),如果F (r-1,n-r),则保留H0 ;如F (r-1,n-r),则否定H0。(二)计算统计量FF分布的临界值与否定域a F 分布F(k-1,n-k)0拒绝H0不能拒绝H0FF分布的临界值与否定域a F 分布F(k-1,n-k)

24、0第八章:统计检验的基本方法课件计算F值的步骤1、计算各水平均值与总均值。(1)令 表示第j种水平的样本均值:上例: =(26.5+28.7+27.2)/5=27.3 =29.56、 =27.3、 =27.3计算F值的步骤(2)总均值 :上例: =(26.5+28.7+27.2+31.2+28.3+32.8)/(5+5+5+5)=28.695(2)总均值 :2、计算离差平方和。(1)总离差平方和SST(Sum of Squares for Total):反映总体差异情况。上例:SST=(26.5-28.695)2+(28.7-28.695)2+(32.8-28.695)2=115.9302、计算离差平方和。(2)组内(误差项)离差平方和:反映水平内部或组内观察值的离散状况。上例:SSE=(26.5-27.32)2+(27.2-27.32)2+(31.2-29.56)2+(29.6-29.56)2+ (27.9-26.44)2+(25.1-26.44)2+ (30.8-31.46)2+(29.6-31.46)2=39.084(2)组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论