




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学入门() 统计学人门(l Vl)彤季 十二、参数的点估计在许多实际问题中,对总体的分布类型有所了解,例如根据过去的经验知道产品的某种性能服从正态分布。 此时我们需耍知道的是对于特定的一批产品,这个性能达到什么样的水平?这就需要对该正态分布的两个,参数:均值拼及方差砂中的一个或两个进行估计.根据样本数值对总体的参数进行估计的问题称为参数估计,这是统计推断中的第一大类问题。 有两种参数估计的方法。 第一种方法是通过样本计算一个统计量(样本的函数),将它作为参数的估计。 由于这是用一个量也即一个点值来对一个参数进行估计,故称为点估计。 如果参数在总体中的意义恰好是均值或方差,那么根据上一讲( 十、和 十一、)中的讨论,我们可以用样本平均数又估计总体均值”,用样本方差护估计总体方差砂.我们还知道,这两种估计都是无偏的,且随着样本大小。 的增加,估计可愈来愈精确。 获得点估计的方法很多,要对一个点估计的好坏进行评价的标准也很多。 上面提到的“无偏性”只是其中之一。 这方面有不少理论问题,但在一般的实际应用中差别不是很大,所以我们在入门阶段就不准备多讨论了。 下面我们着重介绍一种利用样本极差估计总体标准差的方法.对于总体标准差口,从直观上讲可用样本标准差S来估计。 注意虽然护是砂的无偏估计,但一s井不是a的无偏估计。 但这个偏倚当n比较大时井不大,事实上用s来估计口通常仍是十分满意的。 问题是s的计算比较复杂,在现场反复应用时不方便,因此在实际应用中有时也用样本极差R来估计a。 因为极差与标准差都是离散度的数量指标,它们之间必然存在一定的内在联系。 设总体的分布为正态N印,砂),从中抽出一个大小为n的随机样本,则理论计算表明,当n固定时,样本极差R的均值可表成如下形式:E(R)=J。 口(12一1)即R的均值与总体标准差口成正比,比例系数心只与。 有关.于是a=R/d。 (12一2)就是a的一个无偏估计。 人及1/d。 的数值见表12一1。 极差系数d。 及1/d。 表12一1?11284169262。 53823259253魂27044284722一3一“”?。 862。 5导。 。 “57。 ,。 9。 ,6036,。 35,。 3367。 3,例12一1设一台轧制滚珠的机床生产的滚珠的直径服从正态分布。 现从中随机抽取4粒浪珠,测得直径如下:(单位:毫米)3.50一3.57,3.4853.52,试估计该机床生产的滚珠道径的标准差a。 从观测数据求得极差R=3.57一3.48=0.09毫米,其中样本大小n=4,查表12一1,i/d=0.4857,于是分成10组,别为:5.40,4.29,平均极差R(12一4),每组5个数据,经计算其极差分2.27,4.28,4,33,7.53,二44.49/10=2.145.694.39,4.17。 4.449,从而根据a=4.449/2.3259=1.913a=o.09x0.4857”0.044毫米根据(12一2)式用极差对总体标准差进行估计,在n比较小时(例如n成10),效率相当高。 但当n10时,效率迅速下降。 这是因为极差只利用了样本中两个极端值的数据,它不能反映其余数据的离散程度。 为了提高效率,当样本数据此较多时,可将数据随机地分成数目相等的组,称为子样本。 设原样本大小为N,将这N个数据分成大小为n的l个子样本,即N二l n.计算每个子样本的极差R,再求平均极差我们曹指出此例中的50个数据是从方差为4,也即标准差为2的正态总体中随机抽取的,由此可知我们用极差法估计的标准差与理论值非常接近。 万二艺凡l/(12一3)则将R代人公式(122)即可获得口的更精确的估计.人-口二R/d_r口.、(12一4)利用上述的随机分组法用平均极差对标准差进行估计,效果相当好。 一般的,分组时每组数据个数(子样本的大小)n以5左右最为适宜,因为这样分精度高,而计算又不过分繁琐。 还有一点需耍说明的是,公式(12一4)还有改进的余地,更好的估计与随机分组的组数l有关,此时需耍改变的只是系数人,且改进了的系数随l而变.当l很大时,这个系数就与上面的人很接近,这里就不详谈了。 例12一2试用极差法估计产生例10一1中所列的数据总体的标准差。 【解】例10一1中共有50个数据,已随机+ 三、留信区间与置信度的概念点估计只是从样本中计算出来的一个数值,它与所估计的参数的其值之间存在一定的偏差.由于参数的真值是的,因此这个偏差也不可知。 所以用点估计,我们拜不知道估计的精度。 为了能知道估计的精度,需耍用一个范围也即区间来对参数进行估计。 这就是说要设法对参数e,根据样本数据给出它的下限人和上限几,使区间(eL,e。 )以很大的概率包含这个参数.区间(口;,8。 )称为8的置信区间,0:,8。 分别称为e的置信下限与置信上限,统称置信限。 对于置信区间我们可以在相当大的程度上相信它包含参数。 例13一1为了估计一种金属缆绳的强力户,经过抽样,随机测试了8个样品,测得的强力数据如下:(单位:k g)2206,2203,2207,2209,2206,2205,2205一2207。 这8个数据的平均数X=2205k g,用X作为强力其值拄(作为待估计的参数)的估计几乎不可能绝对正确,X与拜的距离愈大,估计也就愈不正确,但我们井不知道偏差X一科的确切值是多大。 为对拼进行区间估计,就耍从这8个样本值确定林的两个置信限,即下限汽及上限肠,使置信区间(凡,拼砂能以较大的概率包含拼。 如何确定这两个置信限呢?p:定得愈低,拌。 定得愈高厂那么区间包含拌的概率就愈大.例如我们就取”:为样本中的最小值2203k g,取肠为样本中的最大值2209kg,则区间(2203,2209)包含真值拼的可能性很大.如果拼;取得更小,科u取得更大,那么就能以更大的概率保证这样的区间包含拼。 但置信区间的长度愈大,估计也就愈不精确,往往失去实际意义。 因而为了提高估计的精度又必须将区间的长度定得短一点。 如果我们取(X一1,X+1)即(2205,2207)作为拌的估计区间,这个区间的长度只有k Zg,精度足够了,但代价是这个区间不包含拼也即估计不正确的风险却相应地增加了.因此一个好的置信区间既耍使它的长度尽可能小,从而估计精度尽可能高;又要使它包含参数的概率尽可可能大,从而估计尽可能正确,尽量少犯错误。 当样本大小。 不变时,上述两方面通常不能兼顾.一般的在构造置信区间时,是将置信区间包含参数的概率予先确定下来.置信区间包含它所估计的参数的概率称为置信度.常用的置信度有0.90,0.95,0.99等。 因此在实际应用中,为对一个参数0进行区间估计,是先给定一个概率,然后根据样本数据,按一定的方法确定e的置信下限人及置信上限几,使P(8几8o t)=y(13一2)而单侧的置信上限雌满足:P(88各)=夕(13一3)用一个单侧的置信限来作为待估计参数的下限或上限,实际上也是一种区间估计(这个区间的长度有可能是无限的),称为单侧的区间估计。 为了区别,在有必要时,将具有上、下两个置信限的置信区间称为双侧置信区间,那样的区间估计称为双侧区间估计。 41+ 四、正态总体均值的区间估计构造置信区间的一种常用方法是根据梓本数据,给出待估计参数的某个适当的点估计,若这个点估计(或它的已知函数)的分布已知,则按给定的置信度即可确定置信限.对于正态总体N印,砂)均值拼的置信区间,我们可以从样本平均数X出发,根据叉的分布确定置信限.从荟10一2中的讨论,X的分布根据总体标准差已知或这两种情况有不同的表示,因此下面也分两种情形讨论。 荟14一1总体标准差a已知情形当a已知时,根据(1O一4)式,我们知道为求拌的双侧置信区间,将(14一1)代人(14一2),即得n/_叉一拼_、厂气一u。 又万石下戈ua/=1一“。 =鱼二生 一、(。 ,、)a/侧n(14一1)因此根据给定的置信度y=1一a,可以确定一个正数u。 ,便得U取值在一u。 与u。 之间的概率恰好等于下=1一内用公式表示即是p(U I。 )=z一a.(14一2)戈轰J喇一一-一一一一-一一-一-山父口Z当认州一以仪o以城U图14一1标准正态分布的双侧分位点经过适当的,与上式等价的,我们有p戈一u。 a/亿万u Z。 )=a(14一6)将(14一1)代入上式右边的等式即有根据正态分布的对称性,u。 也满足P(U )=P(U。 )=a/2。 (14一3)u。 称为(标准)正态分布的双侧分位点(也称分位数,参见第(V I)讲第八节)。 表8一2曹给出它的若干最常用的数值,更详尽的表见常用数理统计表表3(中国科学院数学研究所概率统计室编,科学出版社出版)。 n/了一拼_、了气万夕7育户“:。 /=a由此可推得。 /笼一拼_、l一“=I几、蕊了甲于节于反“:。 J./V几/二(PX一拼。 :。 叮训育)=p(拌)X一“:。 a/了育)于是拜的置信度为1一a的单侧置信下限,卜戈一u,。 a/亿广(14一7)完全类似地,户的置信度为1一。 的单侧置信上限略=X+气。 叮了万(14一8)例如在例14一1中若要求”的0.99a(二0.01)的单侧置信下限,则查正态分布表,拼o.o a=2.33,从而料老=2206一2.33xZ/亿8=2204.35荟14一2总体标准差a情形若a,则可用样本标准差代替,此时我们需用t分布来构造”的置信区间,因为我们知道表可查(例如常用数理统计表表8)表14一1是它的一个简表.表14一1,分布的双侧分位点t。 (f)0887邸48“424038373433几O,上,占上d工,占且.上,占.工1人J l319236102949086838175737170676664自O n山几乙曰心自弓d lJ.人.1.11.占.上,占1J l,1d l.1T=X一拼s/亿万t(”一1)(14一9)与前面的讨论完全类似,对给定的置信度夕=1一a,首先求得自由度为。 一1的双侧分位点。 (或记成。 (。 一1),以后在不会引起混淆的地方,略去自由度不记),即P(T) )=1一a(14一20)12。 714。 303。 182.782.572.452.372.312。 262。 232.132。 092。 062.042。 001。 981。 961.321。 811。 301。 291。 28几二门J任匀月才左孟日,“曰勺九0n n舀O甘几O Q臼自O性UR一O U工卜U甲.咬UJ ln.OU00t。 1却场肠6012308奕饭圈1一2,分布的双翻分位点则”的置信度为1一a的双侧置信区间为(叉一t。 /训万,X+。 s/亿万),也即解的双钡呼置信限为“;=X一。 s/亿万,拼。 =叉+。 a s/了下(14一21)而p一的置信度为l一a的单侧置信下限为此=X一气声/斌万,l(4一12)单侧置信上限为-”乡=X+:.5/、寿.(14一23)t分布的双侧分位点。 也有专门的数在查分布表时耍特别注意自由度了,因为自由度不同,分位点(数)的数值也不同。 对固定的a,j愈小,。 (f)的值愈大.而当f,o o时,t。 (j),“。 ,“。 比所有的礼(f)都耍小。 因为置信区间的长度为2札s/了矶因此对固定的n,已知。 时的置信区间长度比“情形的长度耍小.而对不同的九,当然n愈大,置信区间的长度愈小,也即估计愈精确。 这不仅是因为。 (j)值随f=”一1增大而减小,更因为l/了n随。 的增大而咸小。 例14一2在例13一1中,若强力的总体标准差,求拼的置信度为0.95及0.99的双侧置信区间。 解根据计算,X=2206伏夕),s=1.773(切),而了二。 一1二7.于是对a=0.05,查表得.0. (7)=2.37,忿.。 (7)s/训。 =1.48,从而根据(14,11),拼的置信度为1一0.05=0.95的置信区l旬为(2204.52七口,2207.45初);对a=Q.01,查表得t.石l (7)=3.50,最后得泌饭汇认编者按从本期起连载的方差今析是刘肆温同志于197导年前后为北京清河毛纷织厂工程技术人员编写的一个讲稿。 后来,这个摘子先后街北京开关厂、上海市第一机电工业局科技情报研完所、中国科协科技咨询服务部、北京统筹法研完会、中国并学咤应用数学研完所概率统计咨询服务部以及第二汽车制造厂(正在格印排版之中)等单位翻印,作为各种学习半的教材,颇受欢迎。 现经作者同意,将其基本内容令4次在本列上连载。 在连载之际,作者做了一些小的删改。 方差分析(I)刘璋温基础概念1.1引言实验设计法包括实验的安排和实验数据的统计分析这两个部分,后者吟做方差分析,这是用来分析实验数据中必然因素和偶然因素的影响有多大的一种统计方法.方差分析的任务是要从偶然性中揭示出必然性,又善于利用误差这个偶然因素,是判断实验结果所必须的误差估计的一种方便而且有效的方法.在方差分析中,人们把实验数据的总的波动分解为反映必然性的各个因素所引起的波动和反映偶然性的误差波动,并把两者加以比较,以便找出对实验数据起决定性影响的因素,作为人们行动的指导。 方差分析的类型,由实验设计而定,通常遇到的有下列几种:一因素设计:单因素实验的情形。 二因素设计:双因素实验的情形。 这又分为: (1)不带重复(同一个实验组合(条件)重复二次以上的)情形; (2)带有重复情形。 多因素设计:多于三个因素实验的情形。 拉丁方设计,利用拉丁方的实验设计。 正交设计;利用正交(阵列)表安排的补的置信度为1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出租车行业服务质量提升-洞察及研究
- 房屋买卖合同范例及律师审核参考意见
- 2025年汽车维修保养配件采购合同协议
- LED道路照明灯具采购安装合同(含安全防护与智能化升级)
- 河南省通许县丽星中学高中地理 2.4 全球气候变化说课稿 新人教版必修1
- 3.1列代数式 第4课时 列代数式表示数量关系-反比例关系 说课稿-2024-2025学年人教版(2024)数学七年级上册
- 2025餐厅租赁合同范本下载
- 2025【合同范本】信息技术服务合同范本
- 贵州省遵义市务川自治县大坪中学2016年九年级化学上册 第4章 认识化学变化说课稿 (5份打包)
- 2025金融服务咨询合同
- 学生休学证明模板
- 机电安装工程技术标书(模板)
- 部编版小学一年级上册语文带拼音阅读练习题26篇
- 无机及分析化学第2章-化学热力学基础1
- GB/T 2930.1-2017草种子检验规程扦样
- 会计学原理模拟试题一套
- 第一章-宗教社会学的发展和主要理论范式课件
- 国内外新能源现状及发展趋势课件
- 临床常见护理技术操作常见并发症的预防与处理课件
- 高速公路改扩建桥梁拼宽施工技术及质量控制
- 双台110kV主变短路电流计算书
评论
0/150
提交评论