版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、X2x2snN1nNnC nNAnNC12,n 12,nEEE 12,nDDDK 1,2,3,iDK in0 11lim1niiniPEn设独立随机变量设独立随机变量分别有数学期望分别有数学期望以及方差以及方差并且方差是一致有上界的,即存在某一常数并且方差是一致有上界的,即存在某一常数,使得,使得,则对于任意正数,则对于任意正数,恒有:,恒有:lim1nPxXX2nX2n2,xNXn若总体变量存在有限的平均数若总体变量存在有限的平均数和方差和方差无论总体变量的分布是否为正态分布,在样本单位数目无论总体变量的分布是否为正态分布,在样本单位数目足够多的条件下,样本平均数足够多的条件下,样本平均数
2、的分布将充分接近以总体平均数的分布将充分接近以总体平均数为中心,方差为为中心,方差为的正态分布,即:的正态分布,即:xxp2 1020304050X30()525()五户家庭三月份购买某商品的支出:元, 元, 元, 元, 元元现从五户中抽取二户作调查,如果为重复抽样 考虑顺序种排列组合如下:例例x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本接左:接左:2()() 2500 10()25 ()xxXnn抽样平均误差元为样本配合总数xxX 2(xX) ff 255410() X30()2 1C 种种元元xxX 2xX )
3、(66. 810750n)X-x( )(2元抽样平均误差x上例五户中抽取二户调查,如采取不考虑顺序的不重复抽上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:样方法,则:211() ()nNxinixXN定义式2211() ()niXixxnn计算式ppqn1. 1. 用用过去全面调查或抽样调查的资料,若同时有过去全面调查或抽样调查的资料,若同时有n n个个的资料,应选用数值较大的那个;的资料,应选用数值较大的那个;2. 2. 用用样本标准差样本标准差S S代替全及标准差代替全及标准差;3. 3. 在在大规模调查前,先搞个小规模的试验性的调查来大规模调查前,先搞个小规模的试验性的调
4、查来确定确定S S,代替,代替;4. 4. 用用估计的方法。估计的方法。x2202()100小时 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,)(20 小时于是:例例%1374. 1)150001501 (150)98. 01 (98. 0)1 ()1 ( %14. 1150)98. 01 (98. 0)1 (%98150147 150 15000NnnppnpppnNpp若按不重复抽样方式: 某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从
5、中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例例211() ()nNCxiniNxXC定义式2211(1)(1)() ()niXinnxxnNnN计算式(1)ppqnnN2xNnnN1 2xNnn(1)nN 但但实实际际中中, 往往往往 很很大大, 很很小小,故故改改用用下下列列公公式式:x400100(1)1.99()10010000 上上例例中中,若若为为不不重重复复抽抽样样,则则:小小时时xxX ppP xpxxX1xxxXprob 2xxZ 2ppZ 11SnxX2xxt 概率度概率度t1.00 1.281.641
6、.962.002.58 3.00可靠程可靠程度度p(t)0.67280.80000.90000.95000.95450.99000.9973222t n 重重复复抽抽样样:22t P(1P)n 22222Nt nNt 不不重重复复抽抽样样:二、必要抽样数目的计算公式二、必要抽样数目的计算公式222N P(1P)tnNt P(1P) xXpP由由样样本本指指标标直直接接代代替替全全及及指指标标,不不考考虑虑任任何何抽抽样样误误差差因因素素。即即用用 直直接接代代表表 ,用用直直接接代代表表 。是是就就100 x 1002p98%X 1002P98% 在在全全部部产产品品中中,抽抽取取件件进进行行
7、仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。例例 由于区间估计所表示的是一个可能的范围,而不由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这是一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就个范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。是有一定的概率。 根据中心极限定理,得知当根据中心极限定理,得知当n n足够大时,抽样总足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是体为正态分布,根据
8、正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概给定的区间叫抽样极限误差,也称置信区间,即在概率率F(t)F(t)的保证下:的保证下: 抽样极限误差抽样极限误差=t=t,(,(t t为概率度)为概率度)当当F(t)=68.27%F(t)=68.27%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的1 1倍倍(t=1);(t=1);当当F(t)=95.45%F(t)=95.45%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的2 2倍倍(t
9、=2);(t=2);当当F(t)=99.73%F(t)=99.73%时,抽样极限误差等于抽样平均误差的时,抽样极限误差等于抽样平均误差的3 3倍倍(t=3);(t=3);可见,抽样极限误差,即扩大或缩小了以后的抽样误可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。差范围。例例xxppF(t)xXxpPp()()t 在在概概率率的的保保证证下下:即即:全全及及平平均均数数 成成数数抽抽样样平平均均数数 成成数数)403.57( 100003)99.73%(t (3)402.38( 100002)95.45%(t 千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为
10、:亩小麦的平均保证,该农场若以概率千克43.39619. 1340062.39719. 12400)2()(19. 1)100001001 (10012)1 () 1 (22XxXNnnxx 某农场进行小麦产量的抽样调查,该农场小麦播种面积为某农场进行小麦产量的抽样调查,该农场小麦播种面积为1000010000亩,亩,采用不重复的简单随机抽样从中选采用不重复的简单随机抽样从中选100100亩作为样本,进行实割实测,得到亩作为样本,进行实割实测,得到样本的平均亩产量为样本的平均亩产量为400400千克,样本标准差为千克,样本标准差为1212千克。千克。则:则: 例例1 1pp380p100%95
11、%400P(1P)95%(195%)1.09%n40095.45%Pp95%2 1.09% 92.82% 97.18% 在概率的保证下,全及一级品率: 某机械厂日产某种产品某机械厂日产某种产品80008000件,现采用纯随机不重复抽样方式件,现采用纯随机不重复抽样方式( (按重按重复抽样公式计算复抽样公式计算) ),从中抽取,从中抽取400400件进行观察,其中有件进行观察,其中有380380件为一级品,试件为一级品,试以概率以概率95.45%95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率: 例例2 2312
12、123iinnnnnNNNNNinniNNiiiiiNnnN2xn1pPPn222iiiiNnNn或111iiiiiiN PPn PPPPNn或21xnnN11pPPnnN注意方差的表达式注意方差的表达式22 ; P(1-P)P(1-P) 22222t nt P(1P) n :重重复复抽抽样样22222222Nt nNtNt P(1P) nNt P(1P) 不不重重样样:复复抽抽1.1.随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:k k kk(k为抽取间隔)2k2kk 22kk 2) 1(kkn示意图:示意图:示意图:示意图
13、:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)2222iixxXXxxRr或 者 :iXXixx2222iippPPppRr或者:iPPipp21xxRrrR21ppRrrR2222ppxxnr ; NR ; ; 22x222xx22p222ppRt rRtRt rRt 不不:重重复复抽抽样样.216 100101 21101001XRrrR216100R10r 21221222212212nxnnijijxxxnXEnnxXxXxXEnE xXE xXE xXE xXxXn2201,2,ijiE xXxXE xXin2xn 22122122221222221111n
14、xnnijijniijiijxxxnXEnnxXxXxXEnE xXE xXE xXE xXxXnE xXE xXxXnn221122211111111,2,ijijijNNijijiE xXxXxXxXN NxXxXN NN NNE xXin21xNnnN一、假设检验的意义一、假设检验的意义所谓所谓假设检验假设检验,就是对某一总体参数先作,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,进一步判断两者差异
15、是否显著,若两者差异很小,则假设的参数是可信的,作出则假设的参数是可信的,作出“接受接受”的结论,的结论,若两者的差异很大,则假设的参数准确的可能性若两者的差异很大,则假设的参数准确的可能性很小,作出很小,作出“拒绝拒绝”的结论。的结论。某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。例例1 1某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是
16、否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。例例2 2( (一一) )提出原假设和替代假设提出原假设和替代假设原假设原假设( (又称虚无假设又称虚无假设) )是接受检验的假设,是接受检验的假设,记作记作H H0 0;替代假设替代假设( (又称备选假设又称备选假设) )是当原假设被否定是当原假设被否定时的另一种可成立的假设,记作时的另一种可成立的假设,记作H H1 1;H H0 0与与H H1 1两者是对立的,如两者是对立的,如H H0 0真实,则真实,则H H1 1不真不真实
17、;如实;如H H0 0不真实,则不真实,则H H1 1为真实。为真实。 H H0 0和和H H1 1在统计学在统计学中称为统计假设。中称为统计假设。关于总体平均数的假设有三种情况: (1) H0: =0; H1: 0 (2) H0: 0; H1: 0以上三种类型,对第一种类型的检验,称双边检验,因为0,包含0和0。而对第二、三种类型的检验,称单边检验。例例 当当原假设原假设H H0 0为真时为真时,却因为样本指标的,却因为样本指标的差异而被否定,这种否定真实的原假设的概差异而被否定,这种否定真实的原假设的概率就是显著性水平。用率就是显著性水平。用表示。表示。例例 =0.05(=0.05(即即5
18、%)5%)或或=0.01(=0.01(即即1%)1%) 在假设检验中,要分析样本数值与参数在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假显著,如两者差异是显著的,就要否定原假设,因此,假设检验又称显著性检验。设,因此,假设检验又称显著性检验。 如如下下:样样本本统统计计检检验验统统计计量量的的基基本本量量被被假假设设参参数数检检验验统统计计量量
19、统统形形式式计计量量的的标标准准差差XX Z tSnn 检检验验总总体体平平均均值值的的统统有有计计,量量: 例例 在在计算检验统计量时,要注意是双边计算检验统计量时,要注意是双边检验还是单边检验。检验还是单边检验。要根据显著性水平要根据显著性水平的的值确定统计量的否定域、接受域及临界值。值确定统计量的否定域、接受域及临界值。 如如果检验统计量的数值落在否定域内果检验统计量的数值落在否定域内( (包括临界值包括临界值) ),就说明原假设,就说明原假设H H0 0与样本描述与样本描述的情况有显著差异,的情况有显著差异,应该应该否定原假设;否定原假设;如果如果该数值落在接受域内,就说明原假设该数值
20、落在接受域内,就说明原假设H H0 0与样与样本描述的情况无显著差异,则本描述的情况无显著差异,则应接受应接受原假设。原假设。22220ZZZZH2ZZ 在在假假设设的的双双边边检检验验中中,如如果果检检验验统统计计量量的的数数值值过过大大或或过过小小,都都将将否否定定原原假假设设。否否定定域域位位于于正正态态分分布布曲曲线线两两边边,在在显显著著性性水水平平 条条件件下下,每每个个尾尾部部的的面面积积分分别别为为,临临界界值值为为和和。当当检检验验统统计计量量的的数数值值时时,就就否否定定原原假假设设;时时,认认为为差差异异不不显显著著,就就接接受受原原假假设设,见见图图:221)(2临界值
21、Z)(2临界值Z否定域否定域接受域 )%95(96. 105. 051002 . 061 . 66H6cm 22011的可靠程度否定原假设即有因此这批产品不合格。,体平均数存在显著差异,说明样本平均数和总因为时,对应的临界值:;:解:选择检验统计量方法ZZZnXUcmH 某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令=0.05,检验这批产品是否合格。例例2,95%0.21.966.1 1.96100 (6.06 6.146OHXn,方法 :如果求出的区间包含就不否定原假设的的区间为:即:,)未包含在该区间内,所以该批产品不合格。图:,则为右边检验,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宁夏2025秋九年级英语全册Unit7Teenagersshouldbeallowedtochoosetheirownclothes课时3SectionA(GrammarFocus-4c)课件新版人教新目标版
- 农村厂区租房合同范本
- 信访分类培训课件
- 信用社柜面业务培训课件
- 口才锻炼课件
- 保留灌肠护理课件
- 环保工程施工安全技术方案
- 古典诗词用典技巧教学设计
- 工业防雷接地安全施工标准案例
- 小学三年级英语口语教学方案
- 工程维保及售后服务方案
- GB/Z 43482-2023液压传动软管和软管总成收集流体样本分析清洁度的方法
- 急性中毒的处理与抢救
- 淤泥消纳施工方案
- 附表:医疗美容主诊医师申请表
- 跌落式熔断器熔丝故障原因分析
- 2023年全市中职学校学生职业技能大赛
- 黑布林英语阅读初一年级16《柳林风声》译文和答案
- 仓库安全管理检查表
- 岭南版美术科五年级上册期末素质检测试题附答案
- 以执业医师考试为导向的儿科学临床实习教学改革
评论
0/150
提交评论