




免费预览已结束,剩余33页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Ch1 数理统计的基本概念1.1数理统计的基本问题1.1.1数理统计的任务例1 实验:随机在一大批产品中抽取产品进行检验。(1)一旦查出废品即停止试验,认为该批产品不合格;(2)若到第件还未查出废品也停止试验,认为该批产品合格。设为检查件数,则z的概率分布为若p已知,可解决概率问题: (2)若未知,则需解决统计问题: 有实验结果推断出:()估计;()检验pp0;()设计n0=?数理统计的基本思想:从全体研究对数中抽取一部分实验,由实验结果推断全体的数理规律。1.1.2总体与样本总体研究对象(数量指标)的全体(统计规律)。z或其分布F(x)样本独立同分布的个随机变量X1, X2, Xn,记X1, X2, Xn F(x)样本观察值x1,xn样本的一次实现(n个实数)1.1.3经验分布与直方图(非高数统计)经验分布函数Fn(x)=其中 x1,xn,-=x(1)x(n)x(n+1)= 格列文科定理, 直方图 a=a0a1.am=b 频率fj=nj/nx1,.,xn中溶入aj-1,aj的比例aaj-1ajb作(aj-aj-1)*fj/(aj-aj-1)的矩形大数定律 ,其中pj=P(aj-11时有,故比有效定理(Rao-Cramer不等式)设总体密度函数可得(1)(2)求知参数有无偏估计满足则 C.R下界特别时,有*证:由设,得例2.11 设属于,试求和的无偏估计的方差下界解:即的无偏估计有说明是的UMVUE即对s2/n0无偏值计有优数值计,渐近优数值计,例2.11说明对正态总体N(m,s2),是m 的优数值计即即S2是s 2 的渐近优数值计(可以证明S2是s 2 的UMVUE)例2.12设Z1,Z2,Zn,及N(m,s2),试确定a使时达到最小解: 显然时,,说明优于。2.2.3相合性和渐近正态性(大样本性质)q的相合估计 例2.13样本均值是总体期望E(z)的相合估计由大数定理即得例2.14对正态总体S2是s2的相合估计由,知ES2=s2,再由切比雪夫不等式即得例2.15设Z1,Z2,Zn 为取自U(0,q)的样本,证明q的极大似然估计是q的相合估计。q的渐近正态估计一般对极大似然估计有 2.3 区间估计问题 估计量本身能否表明估计的优良(精度)性?方案 由样本构造置信上限(X1,Xn) 和置信下限(X1,Xn) 使 P() = 1- a 称,为未知参数的置信度(水平)为1-a 的置信区间 = - 或 = + 时称为单侧置信区间,否则称双侧置信区间含义:,包含的概率1-a精度 :(1) 1-a 大 (2) - 小2.3.1 单总体 N(,)参数的置信区间(1) 已知时,的置信区间 N(0,1)P() = 1-aP() = 1-a例2.16 ( P560,例1) 铁水含碳量(%)X N ( ,0.122),X炉铁水:4.28,4.40,4.42,4.36 .求的0.95置信区间.解: = 4.365 , =0.12 , n=4 , a=0.05 , =1.96() = (4.3650.1176) = (4.2474 , 4.4826)注:区间长度L = 2(a) 与成反比(b) 与a成正比(c) 1-a a L (2) 未知时,的置信区间 T = t(n-1)由P()=1-a得得P () = 1-a例2.17(续前例)若未知,S2 =3.833, = 3.1824得 注:此例中L2 = 0.098 若已知,和有什么变化?(2) 的置信区间由抽样定理推论3 =例2.19(P572例6)甲灯泡寿命 n=5, 乙灯泡寿命 n=7, , 求和的置信区间 95%解(10)若 (2) =2.3.3 大样本下得置信区间【结论】设总体z的样本均值和样本方差为和,期望 则当n时的极限分布为N(0.1),从而有即例2.20(p573例8)100件产品有4件不合格品,求不合格品p的95%单侧置信上限的近似值。解当n充分大时故 取n=100,=0.04,=1.645 得2.3.4构造置信区间的一般方法(归纳)(1) 求的一个优良估计量,通常取的极大似然估计。(2) 以为核心,构造枢轴量T(),使其有确定分布。(3) 对给定的置信水平1-,确定a,b使,且b-a尽量小(4) 由解出。CH3 检验假设3.1基本概念3.1.1问题的提出1早稻亩产量310kg,x320,H0: 310,H1:3102产品的次品率中是否达标?x4/50,H0:p0.05,H1:p0.053两种电钻噪音的比较,H0:12,H1:124一周的空气质量是否均匀?H0:Z1.Z7同分布5睡眠时间Z与考试成绩y 有关吗?H0:EZyEZEy假设检验用样本检验对总体的“断言”(假设)参数假设检验已知总体分布类型F(x;),对未知参数做假设检验。如13非参数假设检验未知总体分布类型,对总体的统计特性进行假设检验。如453.1.2基本原理小概率原则小概率事件在一次试验中不该发生例3.1 自动包装机包装一带葡萄糖的重量Z,N(,0.0152),抽验9袋:0.497,0.506,0.518.0.515,0.512。x=0.509问题:这天包装机是否工作正常?解:提出假设,H0:0.5(正常)H1:0.5(不正常)若H0为真,则P(|z-|k)应该很小故如果|z-|k 发生,则应拒绝H03.1.3实施步骤1根据实际问题,提出统计假设:原(零)假设H0,被择假设H12建立检验统计量T(Z1,.Zn),(通常以被检验参数的优良估计为基础构造T),仅当H0为真时,T有确定的分布3对给定的显著水平(小概率),构造H0的拒绝域W,使P(Z1,.Zn)W)通常W=(Z1,.Zn);|T|或T4若(Z1,.Zn)W,则拒绝H0,否则不拒绝H0,即认为“实际”和“假设”差异不显著3.1.4两类错误第一类(弃真)错误H0为真,但(Z1,.Zn)WH0被拒绝P(Z1,.Zn)W| H0)第类风险第一类(弃真)错误H0为真,但(Z1,.Zn)WH0被拒绝P(Z1,.Zn)W| H0)第类风险最优水平的检测在0下,使min3.2 正态总体参数的假设检验3.2.1单总体N(,2)下检验H0:=0 H1:0若2=02已知,则在H0下,故H0的拒绝域若2未知,则在H0下, 故H0的拒绝域例3.2(续例3.1)一袋葡萄糖重量ZN(,2),n=9,=0.519,在水平a=0.05下检验 H0:=0.5,H1:0.5(1)若2=0.0152, ,故不拒绝H0,即认为包装机工作正常。(2)若2未知,计算S2= 0.0108972,由故拒绝H0,即认为包装机工作不正常。3.2.2单总体N(,2)下检验2H0:2=02 H1:202若=0已知,则在H0下, 故H0的拒绝域若未知,则在H0下, 故H0的拒绝域例3.3维尼纶纤度ZN(,2),生产稳定时2=0.0482,检测n=5件:1.32,1.55,1.36,1.40,1.44。试在显著水平a=0.10下检验有无显著变化。解:H0;2=0.0482 H1:20.0482 故拒绝H0,即认为有显著变化。3.2.3单侧检验问题例3.4(P587例2)设灯泡寿命ZN(,2),抽取n=70做寿命试验,得=1960(小时),s=200(小时)。在显著水平a=0.05下,能否认为这批灯泡的平均寿命达到国家标准2000小时?解:H0:2000 H1:2000,如何建立统计假设的两原则。3.2.4 双总体的均值比较检验X1,X2 iid N(m1, s12 ) , S12Y1,Y2 iid N(m2, s22 ) , S22 H0:m1 - m2 = d , H1:m1 - m2 d (通常 d = 0)若s12, s22已知,则在H0下 故H0的拒绝域W=(X1,Xn):|U| ua/2 若s12 = s22 =s2未知,则在H0下 其中 故H0的拒绝域W=(X1,Xn):|T| ta/2(n1+n2-2) 例3.5(P626习题5)两机床加工的零件外径 X甲 N(m1, s2 ) Y乙 N(m2, s2 )甲机床加工零件的外径20.5 19.8 19.7 20.4 20.1 20.0 19.0 19.5乙机床加工零件的外径19.7 20.8 20.5 19.8 19.4 20.6 19.2 问在显著水平a = 0.05下,两机床加工零件的外径有无显著差异? 解: n1 = 8 = 19.925 S12 = 0.2164 N2 = 7 = 19.925 S12 = 0.2164 Sw = 0.54737 H0 : m1 = m2 H1 : m1 m2 故不拒绝H0,即认为两外径无显著差异3.2.5 两总体方差的比较检验H0:s12 = s22, H1:s12 s22在H0下 F = S12/S22 F( n1-1, n2-1 )故H0的拒绝域W=(X1,Xn):F Fa/2 ( n1-1, n2-1 ) 思考:若已知m1 , m2能否提高检验的绩效?例3.6(P592 例4)改进工艺本炉炼钢的得率提高?a = 0.05 标准工艺下的 X N(m1, s12 ):78.1,72.4,77.3 = 76.23 S12 = 3.325改进工艺下的 Y N(m2, s22 ):79.1,81.0,82.1 = 79.43 S22 = 2.225 解:(1)H10:s12 = s22, H11:s12 s22 F = 3.325/2.225 = 1.494 4.03 = F0.025 (9,9) 故不拒绝H0,即可以认为s12 = s22 (2)H20:m1 m2 (未提高), H21:m1 k)a=0.05取p0=0.01,本题,故不拒绝H0,即可以出厂。3.3.2 大样本情形由中心极限定理,z1,z2,znF(x,q)则H0,Ez=u0的拒绝域例3.8 在前例中检查发现3件次品,是否可以出厂(a=0.05)?解: H0:p0.01 H1:p0.01 (zB(1,p),Ez=p),故不拒绝H0,即可以出厂。注:对zi B(1, p),对两个非正态总体,检验:H0:Ez=ED H1:EzED在H0下有:故H0的拒绝域:例3.9 (p598例4) 除虫剂的效果检验,p为长势良好率,未用除虫剂:用除虫剂:在a=0.01下,检验:H0:p1p2 H1:p1 实际频数与理论频数的相对相异定理(K.Pearson)设总体X的分布为P(X=xi) = pi, i=1,2,k. X1,Xn iidX, Ni为X1,Xn中取值为的个数(频数),则统计量于是可得H0:P(X=xi) = pi, i=1,2,k的a水平拒绝域为 W = (x1,xn):c2 c2a(k-1) 在例3.10中,故不拒绝H0注1:由于定理结论是n的极限分布,即为大样本问题,一般要求n50.当n=2时由中心极限定理知W在n服从标准正态分布,从而W2在n服从 c2(1)注2:定理的(Fisher)推广:若H0中总体有r个未知参数q1,qr,由样本得其极大似然估计1,r从而求出, i=1,2,k.,则H0为其时 注3:当X的取值过多时应分组,使理论频数npi相对均匀;npi太小 = 加权1/(npi) = H0易被否定 并组 一般要求npi5npi太大 = 区域太粗 = 未真正拟合 拆分 例3.11(P613例3)电话总机在午夜0-1时电话接错的次数X,抽取200天记录:接错次数012345频数(天)1086522401问在显著水平a = 0.10下,能否认为X服从poisson分布?解:H0 : XP(l) (l未知) 首先求0123450.53260.33550.10570.02220.00350.0005106.51867.10721.1394.4390.6995.2370.0980.02060.06610.03570.0107若不并组x2 拟合优度检验H0:F(X)=F0(X)的一般步骤10 对总体Z的值域进行划分(分组)(a0,a1),(a1,a2).(ak-1,ak)一般取5k16,先等分再调整使npi均分;20 计算理论频数npi,其中n为样本容量 pi=p(ai-1 x2(k-1),其中为F0(x)中未知参数的个数。例3.12(p614例4)维尼纶纤度Z是否服从正态分布?(a=0.05)X的组别频数nnpi(ni-npi)2npi(-,1.29511.0620.4292( 1.32543.576( 1.35579.856 1.3852218.6550.5999 1.4152324.2590.0653 1.445 2521.6760.5097 1.4751013.3070.8220 1.50565.6520.0202 1.53511.625 +)10.371100100x2=2.4463 Dn,a 例3.1-2 续 用纤度数据做K 检验 H0 Z N (1.406,0.0482)X(i)X(i)F0-00.00431.400.570.45030.1103,0.11971.280.010.00430.0043, 0.00571.430.820.69150.1215,0.12851.310.050.02280.0128, 0.02731.460.920.86970.0497,0.05031.340.120.08460.0346, 0.03541.490.980.95990.0399,0.02011.370.340.22660.1066, 0.11341.520.990.99120.0112,0.00121.5510.99870.0087,0.0014Dn = 0.1285 Dn1, n2,a3.5.3 正态性检验:H0:ZN(m,s2)(1)正态概率纸QQ图表在H0数据点(X(i),Fn(x(i))在正态坐标系下“呈直线”(2)W检验对次序统计量Z(1)Z(2)Z(3)Z(n-1)Z(n)构造 L=,其中ak有表,l=n2 n=2l(n-1)2,n=2l-1W= 0W1当H0为真时,W有确定分布且1,故H0的拒绝域3.5.4 独立性检验(1)相关系数检验(Z,Y)N(m1, m2,s12,s22,r) H0:r=0 H1:r0r的矩估计 于是H0的拒绝域W=xi,yi rc (r10,表八给出c的直) 例3.13(p624 例8)在a=0.01下检验降雨量Z与河流量Y的相关性降雨量xi11018414512216514378 12962 130168径流量yi2581363370542044144175解:若(Z、Y)N(m1, m2,s12,s22,r) ,则本题欲检验H0:r=0 H1:r0故拒绝H0,既Z与Y相关显著。(2)列联表检验H0:Z与Y相互独立 H1:Z与Y不独立理论分布:ZY1 spi1rp11 p1spr1 prsp1prp.jp.1p.s1观测频数(列联表)ZY1 sni=1rn11 n1snr1 nrsn1nrn.jn.1 n.s1H0:Z与Y相互独立本项大似然估计:自由度 由Pearson定理,故H0拒绝域例3.14(p256例9)在下检验吸烟与患慢性气管炎是否独立XY患病数未患病合计吸烟数43162205不吸烟13121134合计56283339故拒绝H0:即吸烟与患病明显不独立。3.5.5 符合检验设X1, ,Xm, F1(x), y1, ,yn, F2(x) H0:F1(x)=F2(x), H1:F1(x) F2(x)若F1(x)=F2(x)=F(x)连续,则P(xy)=1/2(两样本独立)记 zi= 则H0成为zi B(1,1/2) i=1,2, ,n 独立 N+= zi B(m,1/2),N_=n-N+ b/2=maxb:P(N+b)=Cmk()m 即在H0下P(N+ba/2或N+n-ba/2)a于是H0的拒绝域:w=(xi,yi):n+ba/2 or n+ n-ba/2 =(xi,yi): n+ ba/2 or n- ba/2 =(xi,yi): S =min(n+,n-) ba/2当n 90时,可通过试算定出临界值,也有表可查,当n 90 时,由中心极限定理:U= N(0,1) 可得H0的拒绝域w=(xi,yi), Ua/2 例 3.15 在 a =0.05下,检验甲,乙两人分析CO2 含量是否有显著差异。甲147 15.0 15.2 15.0 14.7 15.4 15.3乙14.6 15.1 15.4 15.0 14.9 15.2 15.0符号 + - - 0 - + + S=min(12,7)=74=b0.025 H0:F甲(x)=F乙(x)故不拒绝H0,即甲,乙两人分析结果无显著差异。356 秩和检验 x1, ,xn1 F1(x), y1, yn2 F2(x) n1 n2 H0: F1(x) =F2(x) H1: F1(x)F2(x)排序 x3 y1 x1 y4 y3 x2 y2 若 (3+4)! 种记 y1 y2 y3 y4 y5 y6 y7xi的秩si xi=siX的秩和T= siH0的拒绝域w=(xi,yi):TT2其中在下有P(TT2)=(可查表获得T1,T2)例3.16 在a=0.05 下检验两种材料制造的灯泡,寿命的差异材料 1610 1650 1680 1700 1720 1750 1800 N2=7材料 1580 1600 1630 1640 1700 N1=5秩1 2 3 4 5 6 7 8.5 10 11 12解 H0,F(x)= F(x) H1: F(x)= F(x)T=1+2+4+5+8.5=20.5又a=0.05, n1=5,n2=7 查得T1=22,T2=43 T0(-)/N(0,1)Q/(n-2)且与独立=T=(-) t(n-2)故的拒绝域w=(,):T(n-2)对:=0 t检验 F检验,事实上=F4.4 置信区间与预测4.4.1 回归系数的区间估计由T=(-)得P(T(n-2)=1-即的1-a 置信区间为(n-2)同理,的1-置信区间为(n-2)例4.1中有(67.5082.84*=(67.5081.43618)(0.870642.84*=(0.870.04278)4.4.2 预测对E/估计N(+,),E=+,则【结论一】=+是E的无偏估计-N(0,1+)由=+N(+,,())得E的1-置信区间为E=+()其中()=(n-2)如例4.1中若温度=30,则可预测:=67.508+0.87*30=93.627则置信水平0.95有E(93.6272.8783)4.5几点推广4.5.1 多元线性回归=+.+ + ,i=1ny=Z+,y=(. ) ,Z=()则最小二乘估计=Z y为的无偏估计4.5.1 非线性回归(1)y=+x+.+ +, 多项式回归(2)取=lny,则y=+取=,则y=+P641 例2=+=即=19.822-0.567+1.7674.6单因子方差分析4.6.1问题的提出例1 四种肥料对农作物产量的影响显著性肥料品种亩产量xijA1198196190166187.50651A2160169167150161.50221A3179164181170173.50189A4190170179188181.75252.75=176.0625SSe=1313.75组间差异SSA=,组内差异SSe=1313.75 .肥料对产量有显著影响 =SSA /SSe太大指标:zij N(i , 2) i=1,2,3k, j=1,2,3ni假设:H0: 1 =2 =k,H1,1,k不全相等.因子影响指标的因素(如肥料品种A,B,)水平因子所处的不同状态(如A1,A2,Ak)4.6.2统计模型zij=+(-)+( zij -)= +i+ij其中ij N(0,2), i=1,2,3k; j=1,2,n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营销咨询方案(3篇)
- 木质素复合材料生态友好性评估
- 药抗生素使用课件
- 市场对绿色包装接受度分析报告
- 建筑方案设计与总图审批
- 2025版司法局《财产保全反担保申请书》(空白模板)
- 高徽浆灌浆施工方案
- 药品经营监督检查课件
- 中式建筑方案设计图
- 惠农区网络推广营销方案
- GB/T 19227-2008煤中氮的测定方法
- 《鱼》 一种提高士气和改善业绩的奇妙方法
- 民航安全检查员(四级)理论考试题库(浓缩500题)
- 临床护理实践指南全本
- 拆墙协议书范本
- 下肢深静脉血栓及肺栓塞
- 河南省地图含市县地图矢量分层地图行政区划市县概况ppt模板
- 绩效管理全套ppt课件(完整版)
- 钢筋锈蚀原理及应对措施案例分析(54页图文丰富)
- 核电站安全ppt
- 计算机科学技术专业毕业论文--展会管理信息系统设计
评论
0/150
提交评论