




已阅读5页,还剩79页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Ch6 统计推断 统计学原理 n6.1 总体参数估计(new) n6.2 总体参数检验(new) n6.3 非参数检验(new) 主要介绍: 统计推断的理论与方法。 Ch6 主要内容 Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new) Ch6 学习目的 1,掌握统计估计的基本理论与方法 2,掌握统计检验的理论与方法 3,掌握非参数检验的理论与方法 Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new) Ch6 统计推断 统计学原理 n6.1 总体参数估计(new) n6.2 总体参数检验(new) n6.3 非参数检验(new) 6.1 总体参数估计 6.1.1 参数估计的基本概念 6.1.2 点估计 6.1.3 优良估计量的标准 6.1.4 总体参数的区间估计 6.1.5 总体平均数的估计 6.1.6 总体成数的估计 6.1.7 总体方差的估计 Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new) 返回 6.1.1 参数估计的基本概念 Ch6 统计推断 6.1 总体参数估计(new) n统计推断,就是利用样本的数据,对总体的数量特征,做 出具有一定可靠程度的估计和判断。统计推断的基本内容 ,有参数估计和假设检验两方面。 n参数估计,就是研究一个随机变量X,推断它具有什么样的 数量特征,以及按什么样的方式变动; n假设检验,则是推测随机变量的数量特征和变动模式,是 否符合我们事先所作的假设,如果不符合假设,那么它的 数量特征可能是什么。 n本节先研究总体参数的估计。 6.1.1 参数估计的基本概念 Ch6 统计推断 6.1 总体参数估计(new) n总体参数估计 总体参数估计,是以样本统计量,作为未知总体参数的估计量,并通过观 察取得样本数据,计算样本统计量的取值,作为被估计参数的估计值。通常, 设F(X;)为总体X的分布函数, 为待估计的总体参数,对参数所做的估计记 为 。 n参数估计,通常又可分为点估计和区间估计两种。 n估计置信度。 又称估计推断的概率保证程度,或者说是估计的可信程度。通常记为1- 。 其中,称为风险概率。 n抽样极限误差。 又称允许误差范围。是指在某种概率条件下,估计参数真值与估计值的离差绝对 值,记为 (6.1.1) 愈小,表明抽样估计的准确度愈高,反之,准确度愈低。如果=0,则表明估计 无偏误。 设估计置信度为1- ,则 与估计置信度的关系为: (6.1.2) 6.1.1 参数估计的基本概念 Ch6 统计推断 6.1 总体参数估计(new) n抽样平均误差 n就是抽样估计量的标准差。记为 。 n (6.1.3) n由于在无偏条件下, n (6.1.4) n有 n (6.1.5) n因此, 又是抽样极限误差 在各种概率条件下的标准差。 n当然,要计算 ,必须知道 的分布。 返回 6.1.2 点估计 Ch6 统计推断 6.1 总体参数估计(new) n当总体X的分布函数形式F(X; )为已知时,但它的参数为未 知,若从总体中抽取一个样本X1,X2,X3, Xn ,并直接以样本 统计量,作为相应总体参数的估计量,则用该样本统计量, 对所作的一个数值点的估计,就称为点估计。点估计记为 比如,用样本平均数估计总体平均数,用样本的方差估计 总体方差,等等,都是点估计。点估计又叫定值估计。 n未知参数与样本统计量Zn=Z(X1,X2,X3, Xn)之间,一般都存 在某种变换关系 =f (Zn). (6.1.2) 6.1.2 点估计 Ch6 统计推断 6.1 总体参数估计(new) n【例6-1】设某灯泡的寿命X N(2), 2 为未知,今随机 取的4只灯泡,测得寿命数据为1502,1453,1367,1650。试 估计和 。 n解:因为是全体灯泡的平均寿命,为样本的平均寿命,因此 ,可用样本平均数估计总体平均数,用样本的方差S2估计总 体方差2 。 n于是, 和 的估计值分别为1493和118.61。 返回 6.1.3 优良估计量的标准 Ch6 统计推断 6.1 总体参数估计(new) n一般地,作为优良的估计量,至少应该满足以下三个标准: n一致性。 n如果估计 是一致的,那么对于任意小的数0,有 n (6.1.3) n无偏性。 n如果有关系式 (6.1.4) n成立,那么,称 是的无偏估计。 n如果有关系式 (6.1.5) n成立,那么,则称 是渐近无偏的。 n有效性。 n如果 和 都是的无偏估计量,但如果 n (6.1.9) n则称 相对于 是更有效的估计量。 6.1.3 优良估计量的标准 Ch6 统计推断 6.1 总体参数估计(new) n【例6-2】如果X1,X2,X3, Xn1来自同一总体X,且是相互独立,若总体X的k阶原点矩 E(Xk)k存在,且总体X的k阶中心矩D(Xk) 2k - k2=mk也存在,按照随机收敛的定义 ,当n时,有 n因此,样本k阶原点矩Ak,是总体k阶原点矩k的一致估计;样本k阶中心矩Bk,是总体 k阶中心矩mk的一致估计。 n于是,样本平均数是总体平均数的一致估计,样本方差是总体方差的一致估计。 n【例6-3】设总体X的k阶矩k =E(Xk),k1存在,又设X1,X2,X3, Xn是X的样本。试证明 ,不论X服从什么分布,k阶样本矩 是k阶总体矩 k的无偏估计。 n证明:X1,X2,X3, Xn1与X同分布,故有 n E(Xik) = E(Xk) = k,.i=1,2,n n即有 n (6.1.6) n特别的,不论X服从什么分布,只要它的数学期望存在, 总是总体X的数学期望1 =E(X)的无偏估计量。 6.1.3 优良估计量的标准 Ch6 统计推断 6.1 总体参数估计(new) n【例6-4】对于均值,方差2都存在的总体,若, 2 均未知,则 2的估计量 (6.1.7) n是有偏误的(即不是无偏估计)。 n 证明: n由(6.1.6),有 E(A2) = 2 = 2+ 2,. n又 n故 n所以 是有偏的。 n相反,可证样本方差(p144) (6.1.8) n是 2的无偏估计。因此,一般都取S2作为方差 2的估计量。 返回 6.1.4 总体参数的区间估计 Ch6 统计推断 6.1 总体参数估计(new) n置信区间 n设总体X的分布函数F(X; ),含有一个未知参数 。对于给定的030为大样 本。根据中心极限定理,有 n取Z为估计统计量,于是,总体均值 的置信度为1- 的置信区间为 n由1- =0.95, =0.05,Z/2=1.96, =26,得全体学生平均每天参 加体育锻炼的时间 n即为(24.824, 27.176)。 6.1.5 总体平均数的估计 Ch6 统计推断 6.1 总体参数估计(new) n【例6-7】某大学从该校中随机抽取100人,调查到他们平均每天参 加体育锻炼的时间为26分钟。假定总体X N(2),总体方差 2未 知,但已知样本方差S2=34。试以95%的置信水平,估计该大学全体 学生平均每天参加体育锻炼的时间。 n解:因为总体X N(2),不知2 ,但已知样本方差S2=34。根据抽 样定理,有 n取t 为估计统计量,于是,总体均值的置信度为1- 的置信区间为 n由1- =0.95, =0.05,t /2(n-1)=1.984, =26,得全体学生平均 每天参加体育锻炼的时间 n即为(24.84, 27.16)。 返回 6.1.6 总体成数的估计 Ch6 统计推断 6.1 总体参数估计(new) n总体成数估计和总体平均数估计相类似。 n设有一容量n50的大样本,它来自(0, 1)分布的总体X,X的均值为P ,方差为P(1-P),其中P就是总体成数,是一个未知参数。求P的置 信度为1- 的置信区间。 n解:已知(0, 1)分布均值和方差为 n =P, 2 =P (1-P)。 (6.1.32) n设X1,X2,X3, Xn是来自X的样本,因为样本容量较大,由中心极限定 理,有 n (6.1.33) n近似地服从N(0, 1)分布,Z是不依赖于任何未知参数的。于是有 n (6.1.34) 6.1.6 总体成数的估计 Ch6 统计推断 6.1 总体参数估计(new) n而不等式 n (6.1.35) n等价于 n (6.1.36) n记 n (6.1.37) n则 n (6.1.38) n于是,我们就得到了P的近似的、置信度为1- 的置信区间(P1, P2) 。其中 为样本成数。 6.1.6 总体成数的估计 Ch6 统计推断 6.1 总体参数估计(new) n【例6-8】设自一大批产品的100个样品中,得一级品60个,求这批产品的 一级品率P的置信度为0.95的置信区间。 n解:一级品率P是(0, 1)分布的参数,此处n=100, =60/100=0.6,1- =0.95, /2=0.025,Z /2=1.96,则有 n n于是,P1=0.50,P2=0.69。故得P的置信度为0.95的近似置信区间(0.50, 0.69)。 返回 6.1.7 总体方差的估计 Ch6 统计推断 6.1 总体参数估计(new) n总体方差也是表明总体数量特征的重要指标。很多情况,需要 利用抽样的方法,来估计总体方差。通常是,以样本方差S2来 估计总体方差 2,即 n 。 n但这只是点估计,更多的是求它的区间估计。 n设总体X N(2), 2 均为未知,X1,X2,X3, Xn是来自X的 样本,S2是样本方差。求2 的置信度为1- 的置信区间。 n解: 2 的无偏估计为S2,由抽样定理,有 n (6.1.39) n 2所服从的分布2(n-1),是不依赖于任何未知参数的。 6.1.7 总体方差的估计 Ch6 统计推断 6.1 总体参数估计(new) n故有 n (6.1.40) n即 n (6.1.41) n这样,就得到了2 的一个置信度为1- 的置信区间 n (6.1.42) n其中, 2/2和 21- /2自由度为n-1的 2分布的 /2分位点和1- /2分位点,并且 21- /2 *,或者H1: *, f() 0 *0 f() * 临界值 2*临界值 1* 可接受域可接受域拒绝域拒绝域 1- 1- Ch6 统计推断 6.2 总体参数检验(new) 6.2.1 总体参数假设检验 n右单侧检验: n如果在显著性水平下,需要检验的假设是 nH0: *,H1: *, (6.2.5) n则这种检验就是右单侧检验。 n右单侧检验有 nPro 2* = . (6.2.6) n如果 2*,就拒绝原假设H0,而接受备择假设H1;如果 1*,就接受H0是真实的 。 Ch6 统计推断 6.2 总体参数检验(new) 6.2.1 总体参数假设检验 n参数假设检验的实质 n 总体参数假设检验,是在某种概率条件下,利用样本的实际 资料计算参数估值,来检验事先对总体参数特征所作的假设, 是否可信。比如,我们可以,把过去长期观察的平均水平和变 异情况当成一个标准,来判断当前股票价格水平是否正常。如 果现在的价格变化与过去基本保持一致,则可以认为,过去拟 定的标准是有效的,是基本正确的;如果现在的价格变化与过 去长期背离,则可以认为,过去拟定的标准是有问题的,理论 假设有可能是错误的。所以,参数假设检验假设的实质,是理 论假设与实际抽样的一个对比。 Ch6 统计推断 6.2 总体参数检验(new) 6.2.1 总体参数假设检验 n总体参数检验的步骤: n第一步,根据实际问题的要求,建立原假设H0和备择假设H1 。原假设,总是假定总体没有显著性差异,所有差异都是由随 机原因引起的。备择假设,是原假设的对立事件。 n第二步,给定检验的显著性水平和样本容量n。在H0假设成 立的条件下,由被检验的统计量分布,求出相应的临界值 1*, 2*,该临界值即为H0的拒绝域与接受域的分界线。 n第三步,确定检验统计量,并依据样本资料计算检验参数估计 值 。 n第四步,将 值与临界值进行比较。如果 值超过临界值,说明 抽样落入拒绝域中,可以拒绝接受H0;若 值小于临界值,抽 样落入接受域中,我们就不能拒绝H0,而必须接受原假设或 作进一步的检验。 Ch6 统计推断 6.2 总体参数检验(new) 返回 6.2.2 正态总体均值的检验 n正态总体均值的检验: n总体均值的假设检验,就是检验当前的总体均值与假设的总体 均值,是否存在显著性差异。可以根据研究问题的要求和样本 资料的条件,灵活运用各种检验方法。 nZ检验。又称正态分布检验。 nt检验。又称t分布检验。 n在假设检验中,由于样本容量和样本资料的限制,使样本 统计量有不同的概率分布,是形成Z检验和t检验两种方法 的主要原因。 Ch6 统计推断 6.2 总体参数检验(new) 6.2.2 正态总体均值的检验 nZ检验。又称正态分布检验。 n设X N(2), X1,X2,X3, Xn是来自X的样本,已知2,检验 假设H0: = 0。其中, 0为已知数。其检验的步骤: n第一步,根据实际问题的要求,建立原假设H0,和备择假设 H1。例如, nH0: = 0,H1: 0, (6.2.9) n或者H1: 0,或者H1: 0或 0,或者H1: 0或 P0,或者H1: P0或 02,或者H1: 2 02, (6.2.25) n的拒绝H0条件2 2(n-1),接受H0条件2 21- (n-1)。 Ch6 统计推断 6.2 总体参数检验(new) 6.2.4 总体方差的检验 n【例6-14】根据过去的实验,某产品的某质量指标服从正态分布,其标准差 =7.5。现在,在这种产品中随机地抽取25件,测得S=6.5。试判别产品质量 变异程度有无变动。 n解:设 H0: 2= 02=7.52,H1: 27.52, n由于总体X N(2), X1,X2,X3, Xn是来自X的样本, 2均未知,S2是2 的无偏估计, 02为假设参数,在H0为真的条件下,由抽样定理,有 n在显著性水平的条件下,有 nPro 21- /2(n-1) 22。 (6.2.27) n这是个右单侧检验。 n其检验的步骤: n第一步,由于S12, S22的独立性,及(ni-1)Si2/ i2 2(ni-1),i=1,2,由抽样定理,有 n (6.2.28) n故在H0: 12= 22为真时,有 n (6.2.29) Ch6 统计推断 6.2 总体参数检验(new) 6.2.4 总体方差的检验 nF检验(续) n取F为检验的统计量,则当H0为真时,有E(S12)= 12= 22=E(S22);而当H1为真时,有 E(S12)= 12 22=E(S22),故F= S12/ S22有偏大的趋势,它的临界值由 nPro F F (n1-1,n2-1) = . (6.2.30) n查表求得。 n第二步,根据样本X1,X2,X3, Xn1和Y1,Y2,Y3, Yn2,计算检验统计量的F值。 n第三步,检验比较。如果F F (n1-1,n2-1),就说明抽样落入拒绝域中,可以拒绝H0 而接受H1;若F F1- (n1-1,n2-1)。 n双侧检验 nH0: 12= 22,H1: 12 22, (6.2.32) n的拒绝H0条件F F /2(n1-1,n2-1)或F F1- /2(n1-1,n2-1),接受H0条件F1- /2(n1-1,n2-1) F /2(n1-1,n2-1) = /2. nPro F 13,落入舍弃域,所以舍弃H0,即结论为总体中位 数Me160。 Ch6 统计推断 6.3 非参数检验(new) 6.3.2 符号检验 n配对样本的符号检验 n 许多科学试验或社会经济调查中,常常需要比较两个总体 的差异情况,但是总体的分布往往也不清楚,甚至调查的结 果都很难从数量上进行测度。例如让消费者品尝评判不同品 牌啤酒的质量。评判者只能判别较好、较差或给出质量等级 分,在这个场合,配对样本的符号检验便是最适合的方法。 Ch6 统计推断 6.3 非参数检验(new) 6.3.2 符号检验 n配对样本的符号检验(原理) n设n1=n2为大小相同的两个样本,分别来自不同总体,现在 将两个样本的数据一一配对,得系列配对值(X1, X1),(X2, X2),(Xn, Xn )。然后将各配对组的数值相减,并记录 其差数(Xi - Xi)的符号, n (6.3.2) n计算“+”个数n+和“-”个数n。如果两个样本所选自的总体不 存在显著的差异,则n+与n出现的概率应该一致,各为0.5 ,反之则认为两个总体存在本质的差异。 Ch6 统计推断 6.3 非参数检验(new) + 当XiXi - 当Xi Me2,T将靠近它的最 大可能值;如果总体1分布于总体2的左边,即Me1 =0.05,故没有理由拒绝H0,即结论是:该样本为 一个随机样本。 6.3.4 游程检验 Ch6 统计推断 6.3 非参数检验(new) n大样本场合: n 当n1,n2都较大(即n120,n2 20)时,游程总数R的 概率分布接近于正态分布,其数学期望值和方差分别为: n (6.3.8) n 因此,Z统计量 n (6.3.9) n近似于标准正态分布,对于大样本,我们可以利用正态分 布表,找到ZR观察值相应的概率,用以确定R的显著性。 6.3.4 游程检验 Ch6 统计推断 6.3 非参数检验(new) n大样本场合(续): n由于在游程检验中,我们是将一个样本各单位,归属于两种 类别之中,因而,样本各单位的分布,成为二项分布。在n足 够大时,R的分布接近于正态分布。但是,在n=n1+n2并不太 大时,应当作连续性校正。校正办法是,将观察频数R视为占 有一定区间的量,该区间的下限比观察频数小1/2,其上限比 观察频数大1/2。因此,在校正时,当该观察值处于估计区间 的下限时,应减去0.5,而处于估计区间上限时,则应加上0.5 。这时,Z统计量公式成为: n (6.3.10) n 需要作这种校正的原因是,R的经验值分布是离散的,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年临沂市农业学校公开招聘教师(8名)模拟试卷有答案详解
- 2025金华市教育局所属金华教育学院公开招聘教师6人模拟试卷及答案详解(各地真题)
- 2025贵州黔东南州台江县民族中医院第二次长期招聘备案制专业技术人员1人考前自测高频考点模拟试题有完整答案详解
- 2025贵州罗甸县第一医共体板庚分院招聘合同制专业技术人员考前自测高频考点模拟试题及一套答案详解
- 2025河南洛阳市洛宁县招聘看护队伍工作人员45人考前自测高频考点模拟试题完整参考答案详解
- 2025江苏盐城市中心血站招聘编外专业技术人员3人考前自测高频考点模拟试题及答案详解(新)
- 2025湖南邵阳市洞口县教育局所属事业单位招聘39人模拟试卷附答案详解(突破训练)
- 2025年耐蚀热交换器铜合金管材合作协议书
- 安全培训教室装饰图画课件
- 2025电子工业出版社有限公司招聘应届高校毕业生15人考前自测高频考点模拟试题及答案详解参考
- 2025贵州毕节威宁自治县面向社会招聘城市社区工作者17人考试参考试题及答案解析
- 建筑工地垃圾清理与处理方案
- 婴儿奶粉合同(标准版)
- 中医执业医师考试针灸推拿知识点试题及答案
- 卓望公司安全风控培训课件
- 修井现场安全培训内容课件
- 做更好的自己课件-2025-2026学年统编版道德与法治七年级上册
- 2023年贵州贵州贵安发展集团有限公司招聘考试真题及答案详解(夺冠)
- 2025年大宗商品贸易业务流程优化计划
- 情感表达+课件+2025-2026学年人教版(2024)初中美术七年级上册
- 2025年小升初数学考试试题(附答案)
评论
0/150
提交评论