版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 统计学复习笔记第七章参数估计一、考虑题解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。根据一个详细的样本计算出来的估计量的数值称为估计值。简述评价估计量好坏的标准1无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。2有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。3一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的阐述是由区间和置信度两局部组成。有些新闻媒体报道
2、一些调查结果只给出百分比和误差即置信区间,并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄显得“准确有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样那么可以由此推算出置信度由后面给出的公式,反之亦然。解释95%的置信区间的含义是什么置信区间95%仅仅描绘用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%的区间包含参数。不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。简述样本量与置信程度、总体方差、估计误差的关系。估计总体均值时
3、样本量n为(zyb2n=曲a其中E2、样本量n与置信程度1-a、总体方差尸、估计误差E之间的关系为与置信程度成正比,在其他条件不变的情况下,置信程度越大,所需要的样本量越大;与总体方差成正比,总体的差异越大,所要求的样本量也越大;与与总体方差成正比,样本量与估计误差的平方成反比,即可以承受的估计误差的平方越大,所需的样本量越小。二、练习题从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。1)样本均值的抽样标准差x等于多少?2)在95%的置信程度下,估计误差是多少?解:1o=5,n=40,=2牙aa=二a豈=5/V400.79X2Z(s/2二可J0釘二1光aE=
4、z2估计误差E=1.96X52/40心1.55某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。1)假定总体标准差为15元,求样本均值的抽样标准误差。2)在95%的置信程度下,求估计误差。a3)假如样本均值为120元,求总体均值A的95%的置信区间。解:1o=15,n=49 三=15FV49=2.142估计误差E=1.96X15749心4.23=120*置信区间为x土E其置信区间=120土4.23从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差g85414,试构建总体均值A的95%的置信区间。解:n=100,=10
5、4560,g=85414,1-a=95%,耳扭二可斶二136由于是正态总体,且总体标准差。总体均伽在1-a置信程度下的置信区间为=叫谄舗护土1012596X854147100144=105.36土3.92匚(10045609.土)67414从总体中抽取一个n=100的简单随机样本,得到x=81,s=12。要求:构建A的90%的置信区间。构建A的95%的置信区间。构建A的99%的置信区间。解:由于是正态总体,但总体标准差未知。总体均值卩在1-a置信程度下的置信区间公式为81土忑昭,12/100=81土弘旷X1.211a=90%,左昭二一1.65其置信区间为81土1.9821-a=95%,春二珂0
6、25=1玄其置信区间为81土2.3521-a=99%,翻=-2.58其置信区间为81土3.0965利用下面的信息,构建总体均值的置信区间。x=25,a=3.5,n=60,置信程度为95%x=119,s=23.89,n=75,置信程度为98%x=3149,s=0.974,n=32,置信程度为90%Cs解:Tx土z或x土z(c未知知)阪,n抵,n:11-a=95%,J廿其置信区间为:25土1.96X3.5160=25土0.88521-a=98%,那么a=0.02,a/2=0.01,1-a/2=0.99,查标准正态分布表,可知:=233其置信区间为:1192.33X23.892/75=119土6.3
7、453)1a=90%,比扭=1.65其置信区间为:3.1491.65X0.9742/32=3.149土0.2846利用下面的信息,构建总体均值A的置信区间:1)总体服从正态分布,且o=500,n=15,=8900,置信程度为95%。解:N=15,为小样本正态分布,但6那么1-a=95%,F=珂叱i-先。其置信区间公式为x+z=105.36+1.96x險口n1025置信区间为:89001.96X5002/15=辺邮56,土3.915?.2=(101.44,109.28)总体不服从正态分布,且o=500,n=35,=8900,置信程度为95%。解:为大样本总体非正态分布,但6那么1-a=95%,,
8、咽二珂S5i-先。其置信区间公式为x+z=105.36+1.96x險口n1025置信区间为:89001.96X5002/35二=7?5369t3.9966.1)=(101.44,109.28)总体不服从正态分布,o未知,n=35,x=8900,s=500,置信程度为90%。解:为大样本总体非正态分布,且o未知,1-a=90%,X翻-1.65。_IwXZa-其置信区间为:89001.65X5002/35二876190394)总体不服从正态分布,o未知,n=35,兀=8900,s=500,置信程度为99%。解:为大样本总体非正态分布,且O未知,1-=99%,X昭二2.58。其置信区间为:盖鼻皿赢一
9、8900土2.58X500735=8681.99118.17某大学为理解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时略1。求该校大学生平均上网时间的置信区间,置信程度分别为90%解:先求样本均值:疋=专=3.327-TI21再求样本标准差:-1牙土需g-置信区间公式:一”肩8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值A的95%置信区间。解:此题为一个小样本正态分布,o未知。X=z先求样本均值:用=80三8=10再求样本标准差:母-1=784/7=3
10、.4641于是,毘的置信程度为1-的置信区间是1-=0.95,n=8,那么=0.05,a/2=0.025,查自由度为nT=7的艺分布表得临界值切一2.45所以,置信区间为:10土2.45X3.46412/79某居民小区为研究职工上班从家里到单位的间隔,抽取了由16个人组成的一个随机样本,他们到单位的间隔分别是:10,3,14,8,6,9,12,11,7,5,10,15,9,16,13,2。假设总体服从正态分布,求职工上班从家里到单位平均间隔的95%的置信区间。解:小样本正态分布,未知。,n=16,1-那么flf=0.05,a/2=0.025,查自由度为n-1二15的f分布表得临界值哦一2.14
11、_*x=一样本均值=150/16=9.375g二2再求样本标准差:V母-1=/253.75/154.11于是,毘的置信程度为1-的置信区间是9.3752.14X4.112/1610从一批零件是随机抽取36个,测得其平均长度是149.5,标准差是193。1)求确定该种零件平均长度的95%的置信区间。2)在上面估计中,你使用了统计中的哪一个重要定理?请解释。解:1这是一个大样本分布。N=36,=149.5,S=1.93,1-0=0.95,=珂J025=136。其置信区间为:149.51.96X1.93三V362中心极限定理论证:假如总体变量存在有限的平均数和方差,那么,不管这个总体的分布如何,随着
12、样本容量总的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随机变量和的分布趋于正态分布那么是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量垃充分大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计理论提供了理论根底。11某企业消费的袋装食品采用自动打包机包装,每袋标准重量为100克,现从某天消费的一批产品中按重复抽样随机抽取50包进展检査,测得每包重量如下:略)食品包重服从正态分布,要求:1)确定该种食品平均重量的95%的置信区间。2)假如规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。解:1此题为一
13、个大样本正态分布,o未知N=50,A=100,l-a=0.95,%宦=左OJO25=136。每组组中值分别为97、99、101、103、105,即此50包样本平均值左二97+99+101+103+105/5=101样本标准差为:V97-1012X2+99-1012x3+101-1012X34+103T012X7+105T012X4三50-1心L666|7其置信区间为:1011.96X1.666三V502不合格包数V100克为2+3=5包,5/50=10%(不合格率,即P=90%。该批食品合格率的95%置信区间为:pZ一鬥0.91.96XV(0.9X0.1)三50=0.91.96X0.04212
14、假设总体服从正态分布,利用下面的数据构建总体均值u的99%的置信区间。(略)re解:X=一样本均值找Ed商样本标准差:”幵-1尽管总体服从正态分布,但是样本n=25是小样本,且总体标対的置信程度为14的置信区间是准差未知,应该用T统计量估计。l-a=0.99,那么a=0.01,a/2=0.005,查自由度为n-1二24的分布表得临界值,一2.8样本均值&=244/18=13.5613一家研究机设想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工,得到他们每周加班的时间数据如下单位:小时:略假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间
15、。解:N二18V30,为小样本正态分布,。未知。样本标准差:二1-a二90%,a二0.1,a/2=0.05,那么查自由度为n-1二17的艺分布表得临界值1.740的置信程度为1-口的置信区间是14利用下面的样本数据构建总体比例开的置信区间:n=44,p=0.51,置信程度为99%n=300,p=0.82,置信程度为95%n=1150,p=0.48,置信程度为90%解:11-A二99%,A二0.01,a/2=0.005,1-a/2=0.995,查标准正态分布表,那么忌=2.5821-a=95%,%二加5=31-a=90%,忑翻=1.65分别代入15在一项家电市场调查中,随机抽取了200个居民户,
16、调査他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信程度分别为90%和95%。解:1置信程度90%,1-0=90%,翻=1.65,N=200P=23%2置信程度95%,1-0=95%,张二可血i,N=200,P=piZ/23%。代入呀16一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存款额的标准差为1000元,要求的估计误差在200元以内,置信程度为99%。应选取多大的样本?解:1-a=99%,那么弘心=258。E=200,。=1000元。那么N二严呻2Xo2e2=2.582X100022002167得数应该是166.41,
17、不管小数后是多少,都向上进位取整,因此至少是167人17要估计总体比例丌,计算以下条件下所需的样本量。E二0.02,丌二0.40,置信程度96%E=0.04,丌未知,置信程度95%E二0.05,丌二0.55,置信程度90%解:11-a=96%,a/2=0.02,那么工叩=2.06N=%2X丌仃-丌FE2=2.062X0.4X0.6三0.02225472)1-a=95%,a/2=0.025,那么=1.96开未知,那么取使开1-开最大时的0.5。N=厲护乂丌(1-丌FE2=1.962X0.5X0.50.0426013置信程度90%,1-=90%,忑翻=1.65,N=应翻2X丌(1一丌FE2=1.6
18、52X0.55X0.45三0.05227018某居民小区共有居民500户,小区管理者准备采用一项新的供水设施,想理解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞同,18户反对。1)求总体中赞成该项改革的户数比例的置信区间&=0052)假如小区管理者预计赞成的比例能到达80%,估计误差不超过10%,应抽取多少户进展调查a=005解:1N=50,P=32/50=0.64,a=0.05,a/2=0.025,那么工啲=1.96置信区间:P土芒皿VP1-P/N=0.641.9670.64X0.36/50=0.641.96X0.48/7.07=0.64土0.1332丌=0.8,E=0.1
19、,a=0.05,a/2=0.025,那么=1.96N=6,丌(1-丌)庄2二1.962X0.8X0.20.126219根据下面的样本结果,计算总体标准差o的90%的置信区间:1=21,S=2,N=502=1.3,S二0.02,N=153)二167,S=31,N=22解:1大样本,。未知,置信程度90%,1-a=90%,E辭=1.65-g_21土1.65X2FV502小样本,。未知,置信程度90%,1-a=90%,那么查自由度为n-1二14的分布表得临界值1.761 0 =1.31.761X0.022/153)大样本,。未知,置信程度90%,1-a=90%=1.65牙土肾g-167土1.65X3
20、1FV2220.题目(略)1)构建第一种排队方式等待时间标准差的95%的置信区间2)构建第二种排队方式等待时间标准差的95%的置信区间3)根据1)和2)的结果,你认为哪种排队方式更好?解:此题为小样本正态分布,。未知,应用公式置信程度95%,1-a=95%,那么查自由度为n-1=9的f分布表得临界值2.311花7.15,母1=72.045/90.48其置信区间为7.152.31X0.48三7102)2=7.15其置信区间为7.1504)第二种排队方式更好.19题是对总体方差的估计,应该用卡方统计量进展估计,20题是对两个总体参数的估计,这二种类型教师未讲,不是本次考试的内容,不能用z统计量像估
21、计总体均值和比例那样去估计,详细内容见书上P188P194第八章假设检验一、考虑题1假设检验和参数估计有什么一样点和不同点?解:参数估计与假设检验是统计推断的两个组成局部。一样点:它们都是利用样本对总体进展某种推断。不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数卩在估计前是未知的。而在假设检验中,那么是先对卩的值提出一个假设,然后利用样本信息去检验这个假设是否成立。2什么是假设检验中的显著性程度?统计显著是什么意思?解:显著性程度用a表示,在假设检验中,它的含义是当原假设正确时却被回绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。
22、我理解的统计学意义,统计显著是统计上专用的断定标准,指在一定的概率原那么下,可以成认一种趋势或者合理性到达的程度,到达为统计上程度显著,达不到为统计上程度不显著3什么是假设检验中的两类错误?解:弃真错误a错误:当原假设为真时回绝原假设,所犯的错误成为第I类错误,又称为弃真错误。犯第I类错误的概率常记作a。取伪错误B错误:当原假设为假时没有回绝原假设,所犯的错误称为第II类错误,又称取伪错误。犯第II类错误概率常记作B。发生第I类错误的概率也常被用于检验结论的可靠性度量。假设检验中犯第I类错误的概率被称为显著性程度,记作a。4两类错误之间存在什么样的数量关系?在样本容量n一定的情况下,假设检验不
23、能同时做到犯a和B两类错误的概率都很小。假设减小a错误,就会增大犯B错误的时机;假设减小B错误,也会增大犯a错误的时机。要使a和B同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进展控制的问题。5解释假设检验中的P值。解:假如原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值。也称为观察到的显著性程度。P值是反映实际观测到的数据与原假设H之间不一致程度的一0个概率值。P值越小,说明实际观测到的数据与H之间不一致程度就0越大。6显著性程度与P值有何区别?解:a显著性
24、程度是一个判断的标准当原假设为真,却被回绝的概率),而P是实际统计量对应分位点的概率值当原假设为真时,所得到的样本观察结果或更极端结果出现的概率。可以通过a计算置信区间,然后与统计量进展比拟判断,也可以通过统计量计算对应的p值,然后与a值比拟判断。7假设检验根据的根本原理是什么?解:假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进展观察,假如样本信息显示出现了与事先假设相反的结果且与原假设差异很大,那么说明原来假定的小概率事件在一次实验中发生了,这是一
25、个违犯小概率原理的不合理现象,因此有理由疑心和回绝原假设;否那么不能回绝原假设。8你认为在单侧检验中原假设和备择假设的方向应该如何确定?解:假设问题有两种情况,一种是所考察的数值越大越好左单侧检验或下限检验临界值和回绝域均在左侧;另一种是数值越小越好右单侧检验或上限检验临界值和回绝域均在右侧。二、练习题1.某炼铁厂的含碳量服从正态分布N(455,0.1082如今测定了9炉铁水,其平均含碳量为4.484。假如估计方差没有变化,可否认为如今消费的铁程度均含碳量为4.55(a=005)?解:uo=4.55,o2=0.1082,N=9,2=4.484,这里采用双侧检验,小样本,。,使用Z统计。假定如今
26、消费的铁程度均含碳量与以前无显著差异。那么,H。:卩=4.55;Hi:卩工4.55a=0.05,a/2=0.025,查表得临界值为卫=1.96计算检验统计量:Z=x_二0=(4.484-4.55)/(0.108/79)a/=-1.833决策:TZ值落入承受域,.在a=0.05的显著性程度上承受H。结论:有证据说明如今消费的铁程度均含碳量与以前没有显著差异,可以认为如今消费的铁程度均含碳量为4.55。2.一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。该元件寿命服从正态分布,。=60小时,试在显著性程度0.05下确定这批元件是否合格。解:
27、N二36,o二60,二680,卩。=700这里是大样本,。,左侧检验,米用Z统计量计算。提出假设:假定使用寿命平均不低于700小时H:心7000H:卩2501计算统计量:Z=2-打/o/VN=270-250/30/25=3.33结论:Z统计量落入回绝域,在a=0.05的显著性程度上,回绝H0,承受斗01。决策:有证据说明,这种化肥可以使小麦明显增产。4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下略)包重服从正态分布,试检验该日打包机工作是否正常。(a=0.05)解:N=9,这里是小样本正态分布,o未知,双侧检验,米用t统计量,自由度为N-l=8。a=005,那么T/2=237a/2启99.98E比-g二-1心1.22提出假设,假设打包机工作正常:即H:u二1000H:u#1001计算统计量:u0=99.98-100/1.22/V9心-0.049结论:t值落入承受域,.在a=0.05的显著性程度上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中信建投证券海南分公司校园招聘备考题库完整参考答案详解
- 2025年确山县招聘高层次教师5人备考题库及完整答案详解1套
- 2025年兰州市红古区红古镇卫生院招聘专业技术人员的备考题库及1套完整答案详解
- 2025年西北工业大学民航学院损伤容限课题组招聘备考题库及答案详解参考
- 2025年怀化市老龄协会招聘招募备考题库及完整答案详解一套
- 2025年金城江区南桥社区卫生服务中心招聘中医医师的备考题库含答案详解
- 泰州职业技术学院2026级专业学部教育长(电气自动化技术、数字媒体技术专业)公开选聘备考题库完整答案详解
- 官桥溪流域高新区段水环境综合治理项目报告表
- 《矿山生态修复效果评估技术规范》编制说明
- 2025四川大西洋焊接材料股份有限公司延长招聘笔试历年典型考点题库附带答案详解
- 肩袖损伤的治疗及护理
- 民办学校托管合同协议
- 2025年郑州铁路职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 2022级中餐烹饪(烹饪工艺与营养) 专业校企合作人才培养方案(五年制)
- 2025年小米集团招聘笔试参考题库含答案解析
- 《J监狱突发事件应急管理现状及完善对策研究》24000字(论文)
- 中药山药课件
- 建筑材料采购投标方案(技术标)
- 小步舞详解(教师版)
- 光伏支架安装技术交底
- 创新思维与创业实验-东南大学中国大学mooc课后章节答案期末考试题库2023年
评论
0/150
提交评论