




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 样本及抽样分析,总体与样本 在实际问题中,往往并不知道是什么样分布,或者分布中的参数值是什么,这需要用数理统计的办法来解决。从全体研究对象中抽取部分个体(有限)进行试验,尽可能从中获取对研究对象统计规律 作出精确可靠的推测 -统计推断。,统计学最关心的是: 如何抽取数据 如何从数据中提取信息 所得结论的可靠性,-抽样问题 -参数估计问题 -假设检验问题,统计学的研究对象: 客观事物总体的数量特征和数量关系等。,统计推断问题,学生身高的变化 中国的经济发展使得人民生活得到了很大的提高,孩子这一代的身高比上一代有了很大的变化,下面是在一个城市中学和一个农村中学收集到的17岁学生身高数据。
2、(1)试对目前17岁城市男生的平均身高做出估计? (2)查到20年前该校同龄男生平均身高为168cm,20年来城市男生的身高是否发生了变化? (3)收集到100名农村男生的平均身高和标准差分别为168.9cm和5.4cm,问与城市同龄男生的身高有否差距?,50名17岁城市男生身高(单位:cm) 163.3 179.0 176.5 178.4 165.1 179.4 176.3 179.0 173.9 173.7 173.2 172.3 169.3 172.8 176.4 163.7 177.0 165.6 167.4 166.6 174.0 174.3 184.5 171.9 181.4 16
3、4.6 176.4 172.4 180.3 160.5 166.2 173.5 171.7 167.9 168.7 175.6 179.6 171.6 168.1 172.2 179.0 171.5 173.1 174.1 177.2 170.3 176.2 163.7 175.4 170.1,47名17岁农村男生身高(单位:cm) 171.2 163.7 173.1 171.9 164.4 167.4 162.4 157.0 174.2 166.0 170.6 170.1 169.0 163.4 163.7 166.8 162.4 163.1 176.8 169.2 162.3 168.6
4、162.8 161.6 167.4 174.0 169.5 172.4 162.5 166.4 167.4 162.3 161.7 173.9 168.9 165.4 173.2 170.1 163.5 176.1 170.4 176.8 175.0 165.2 161.9 168.5 167.1,第六章 样本及抽样分析,总体与样本,抽样 总体中抽取一部分个体的过程; 样本 抽样得到 X 的一组数据; 样本容量(大小) 样本中的个体数量,第六章 样本及抽样分析,总体与样本,从总体抽取容量为 n 的样本,即对随机变量 X 随机地、独立地进行 n 次观测,每个结果也看成一个随机变量: 它们互相独立
5、,且与总体 X 服从相同的分布。 一次观测的结果:,样本可看成 n 维随机变量(), 则有,或,独立同分布,例1 某电话交换台一小时内呼入次数 X P(), 0。求来自这一总体 的简单随机样本的样本分布律。 解:,第六章 样本及抽样分析,总体与样本,第六章 样本及抽样分析,总体与样本,例2 某批灯泡寿命 X E(),求样本 的联合概率密度。 解:,例3 样本来自均匀分布U(0,1),求联合概率密度。,178.4 161.5 174.9 182.7 171.0 165.3 172.8 182.1 180.2 176.8 181.7 175.7 177.3 180.0 179.4 177.0 18
6、1.3 176.5 176.0 175.7 168.1 184.6 169.1 177.8 175.1 161.8 174.3 176.0 163.7 176.8 177.3 175.3 180.2 176.8 181.9 178.4 181.5 177.6 179.9 178.2 174.7 176.0 175.7 180.3 166.2 177.2 171.9 182.9 176.8 179.5 167.0 174.8 182.7 174.9 178.1 179.9 175.4 184.4 175.1 179.4 173.2 176.1 177.6 180.5 164.3 170.5 17
7、7.5 168.3 173.0 176.8 173.9 180.7 166.5 180.0 165.6 179.4 182.2 176.3 177.4 183.4 167.9 176.1 177.4 183.4 176.9 168.0 179.0 178.8 173.1 173.2 162.2 179.9 178.2 183.0 174.0 180.8 173.1 173.2 176.8 171.1 169.0 178.3 171.6 181.2 167.6 161.1 166.0 190.2 180.3 166.2 174.9 175.8 176.5 164.2 173.0 176.8 17
8、0.5 180.5 177.3 175.3 163.7 176.8 171.1 168.5 171.2 170.2 177.1 169.4 175.7 177.3 183.2 168.6 175.1 179.4 169.1 169.9 168.5 180.2 174.9 171.0 171.0 168.8 177.7 168.6 176.6 175.9 176.8 179.5 174.3 176.0,身高总体,第六章 样本及抽样分析,统计量 - 是样本的函数,用来对总体的未知参数进行推断,故其中不含有未知的总体参数。 常用的统计量,其观测值用小写表示。,统计量也是随机变量,样本均值 样本方差
9、k 阶原点矩 k 阶中心矩 标准差,第六章 样本及抽样分析,例 有一组样本观测值为 (5,4,6,5),计算其样本均值、样本方差、2 阶原点矩和 3 阶中心矩。,第六章 样本及抽样分析,统计量直方图,100次刀具故障记录(完成的零件数),1 2 4 6 15 22 22 14 8 4 2,100个数分类放在等间隔的小格中,统计落在小格中的频数:,画出频率图:,第六章 样本及抽样分析,1.设 X1, X2, X3 是总体 X 的一个样本,那么当N(0,1) 时,样本的联合密度函数 f(x1, x2, x3) = ;当(1, p)时,样本的联合分布律 PX1 = k1, X2 = k2, X3 =
10、 k3 =。,练习,第六章 样本及抽样分析,2.设总体N(a, b),其中 a 已知,b 未知。再设X1, X2, X3 是取自总体 X 的一个样本。那么,函数(1)X1 + X2 + X3;(2)X2 + 2a;(3)X1; (4)maxX1, X2, X3;(5)Xi2 / b 中哪些是统计量?,练习,第六章 样本及抽样分析,3.设总体 P(a),X1, X2, Xn 取自总体 X 的样本,那么,E( ) = , D( ) = , E( ) = 。,练习,第六章 样本及抽样分析,练习,第六章 样本及抽样分析,4.设(1, p),X 的一组观察值为 0,1,0,1,1,那么样本均值的观察值=
11、 ,样本方差的观测值= 。,练习,第六章 样本及抽样分析,抽样分布,统计量是不含未知量的样本函数,也是随机变量。 统计量的分布称抽样分布。 当总体分布已知时,抽样分布也确定了,但这些分布很难求出。,总体,样本,统计量,估计/推断,抽样,性质: 可加性: 期望与方差:E(Y) = n, D(Y) = 2n,第六章 样本及抽样分析,几种常用的统计量分布,(一) 分布 设 来自总体 XN(0,1) 的样本,则称统计量 为服从自由度 n 的 分布。(自由度乃独立的随机变量的个数)即,第六章 样本及抽样分析,抽样分布,期望与方差:E(Y) = n, D(Y) = 2n,X1, X2, Xn 来自标准正态
12、总体 X 的样本,那么,是否服从卡方分布?若 kY 2( n ),求 k,n,第六章 样本及抽样分析,抽样分布,(二)t-分布 相互独立, 则称随机变量 服从自由度为 n 的 t-分布 T t(n)。,第六章 样本及抽样分析,抽样分布,性质: 对称性: n ,密度函数趋向标准正态分布;,1-,第六章 样本及抽样分析,抽样分布,相互独立,则称随机变量 服从自由度为 的 F 分布。,性质:,(三)F - 分布:,证明:,分位点查表,抽样分布往往由制成上分位点表,分位点(01)指将密度曲线下面的面积按比例划分的点,有左(侧)分位点和右(侧)分位点,后者也称上分位点。,对给定的(概率值),若 则称 为
13、 f (x) 的 上分位点。,自由度,右侧尾部概率,上分位点,如:查找自由度为 12 的卡方分布,关于右侧尾部概率 0.05 的上分位点?,查表练习: 求下列各式中的 C 值,第六章 样本及抽样分析,正态总体统计量的分布,来自正态总体 的样本,其样本均值和样本方差 的分布性质:,第六章 样本及抽样分析,正态总体统计量的分布,关于统计量样本均值的分布,正态总体统计量的分布,第六章 样本及抽样分析,只有 n1 个独立的随机变量,第六章 样本及抽样分析,正态总体统计量的分布,第六章 样本及抽样分析,1.设正态分布 N (100,100) 的有一个容量为 10 的样本,其样本均值服从_,样本方差乘以_
14、后服从 分布。 2. 已知来自正态总体 的样本均值和样本方差, (1)查什么分布表可以确定 的值? (2) 服从什么分布? 3. 设总体 有两个容量分别为10和15的两个样本均值 比较两个概率大小。 4. X B(1, p),求 5. X N(15, 2),有两个容量为 10 和 15 的两个样本,求其样本均值差的绝对值小于 0.2 的概率。,第六章 样本及抽样分析,正态总体统计量的分布,例1 110kV 电网的电压波动值 V(单位:kV) 服从正态分布 N(110, 5.52)。随机测试 16 次电压值,试问其样本均值与总体均值的偏差小于 4kV 的概率?,第六章 样本及抽样分析,正态总体统
15、计量的分布,例2 110kV 电网的电压波动值 V(单位:kV) 服从正态分布。随机测试 16 次电压值,试问其样本均值与总体均值的偏差小于 4kV 的概率?,若样本标准差 S = 5.5,第六章 样本及抽样分析,正态总体统计量的分布,例3 已知一批螺栓的直径 D (单位:cm) 服从正态分布 N(20, 0.052)。从中任取36个,问其平均直径落在区间(19.98,20.02)内的概率?,第六章 样本及抽样分析,正态总体统计量的分布,例4 求证,证明:,第六章 样本及抽样分析,正态总体统计量的分布,例5 求证,证明:,第七章 参数估计,参数估计,区间估计,点估计,极大似然估计,矩估计,参数
16、估计是对已知分布类型的总体,利用样本对其未知参数作出估计,点估计 用样本的统计量 来估计总体的未知参数,就是点估计。 (一)矩估计法 用样本矩估计总体矩的方法,第七章 参数估计,点估计 例1 ,求参数的矩估计。 解:,例2 已知总体的 存在,求这两个参数。 解:,由大数定律,这说明了把样本均值作为总体期望的一个估计的合理性.,样本均值,用样本均值 估计 . 即,点估计,矩估计法 步骤: (1)用未知参数列出总体矩(EX, EX2 ) (2)从中解出未知参数 (1, 2) (3)用样本矩( A1, A2 )代替总体矩(EX, EX2 ),第七章 参数估计,点估计 例3 ,求1,2的矩估计量。 解
17、:,第七章 参数估计,点估计,第七章 参数估计,点估计 例4 ,取自此总体一组样本观测值为 0,2,2,3,3。 求的矩估计量。 解:,第七章 参数估计,点估计 例4 设总体 X 的密度 求的矩估计量。 解:,第七章 参数估计,点估计,(二)极大似然估计法 根据发生的结果 A,对最有利于 A 的发生作出参数估计,即概率大的事件发生的可能性也大。,所谓结果 A 发生的可能性,指样本取到观测值 X1 = x1, X2 = x2, , Xn = xn 的概率(或密度函数),第七章 参数估计,点估计,例1X P(),求的极大似然估计。 解:,已知分布律,对数的似然方程,样本的似然函数(出现可能性),取
18、对数,第七章 参数估计,例2 的极大似然估计。,解: 样本的似然函数(样本观察值被取到的概率) 取对数 对数的 似然方程组 解方程组,第七章 参数估计,点估计,极大似然估计 步骤: 建立样本的似然函数 L(x,),包含有未知参数 ,表示样本发生的可能性; 取对数; 求未知参数的导数,并置零; 解对数似然方程,得参数的极大似然估计 。,例2 设离散总体 X 的概率分布为 试由一个样本观测值X1 = 1, X2 = 2, X3 = 1,求的矩估计和极大似然估计。,第七章 参数估计,练习,例1 设总体 X 的概率密度为 X1, X2, , Xn 为来自总体的样本,试求矩估计和极大似然估计。,例4 设
19、每升自来水中含有大肠菌的个数服从泊松分布 P(),为检查自来水消毒设备效果,抽样化验 问每升中大肠菌多少时,才能上述情况出现概率最大,第七章 参数估计,练习,例3 设某种电子设备的寿命 T 服从参数为的指数分布,今随机抽取 8 件做寿命试验,结果为:1050 1100 1080 1120 1200 1040 1300 1200 求的矩估计和极大似然估计值; 估计其寿命超过 1000 小时的概率。,第七章 参数估计,估计量的评选标准,无偏性 设 为未知参数的估计量,随着样本的不同,估计值可能不同,会有误差。因而估计量本身也是随机变量。若 ,就称估计量是无偏的。有偏估计的 称系统误差。,例1. 设
20、 来自总体 X 的样本,下列总体的均值的估计无偏的吗?,第七章 参数估计,估计量的评选标准,可见,一个未知参数可有不同的无偏估计量。,证明:独立同分布,故有,第七章 参数估计,估计量的评选标准,例2. S 2 和 B2 是 D(X) 是无偏估计吗? 证明:,第七章 参数估计,估计量的评选标准,例3. 设 为其一个样本,试问 估计是无偏的吗? 证明:,第七章 参数估计,估计量的评选标准,有效性 在多个无偏估计中,以密集在真值附近的为好。设的两个无偏估计量中, 且至少存在一个估计值使上式成为严格不等式,则称前者更有效。,第七章 参数估计,估计量的评选标准,例1. 均值估计哪个更有效?,T1 最有效
21、,,解:,第七章 参数估计,估计量的评选标准,例2. 比较无偏估计的有效性:,练习: 1. 如果 是 的无偏估计,且 (1)那么 是 的无偏估计; (2)那么 是 的无偏估计。,设X1, X2, , Xn 是总体 X 的一个样本,问 k 为何值时,估计量 为总体方差 DX 的无偏估计。,第七章 参数估计,估计量的评选标准,一致性 对于有偏估计,随样本容量增加,其偏差愈来愈小。设参数的估计量当容量趋向无穷时,依概率收敛于,则称之为一致估计量。,例,样本方差 是总体方差 的一致估计量。,第七章 参数估计,区间估计,第七章 参数估计,区间估计,例1. 设总体 为一样本,已知方差,求总体均值的置信区间
22、。,则置信度为 1-的置信区间,第七章 参数估计,区间估计,例 某厂生产的滚珠直径 ,随机测得 6 个直径为(mm) 14.6, 15.1, 14.9, 14.8, 15.2, 15.1。求期望的置信度为 0.95 的置信区间。,解:,第七章 参数估计,设总体 为一样本,方差未知, 求总体均值的置信区间。,例2.,第七章 参数估计,区间估计,例 某厂生产的滚珠直径 ,随机测得6个直径为(mm) 14.6, 15.1, 14.9, 14.8, 15.2, 15.1。求期望的置信度为 0.95 的置信区间。,解:,第七章 参数估计,区间估计,设总体 为一样本, 求总体方差的置信区间。,例3.,第七章 参数估计,区间估计,例 某厂生产的滚珠直径 ,随机测得6个直径为(mm) 14.6, 15.1, 14.9, 14.8, 15.2, 15.1。求方差的置信度为 0.95 的置信区间。,解:,第八章 假设检验,基本问题 在实际问题中,往往并不知道是什么样分布,或者分布中的参数值是什么,这需要用数理统计的办法来解决。从全体研究对象中抽取部分个体(有限)进行试验,尽可能从中获取对研究对象统计规律作出精确可靠的推测-统计推断。,中学男生身高问题,设中学生的身高 20 年来没有变化,即 =
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 弹簧研发助理岗位面试问题及答案
- 餐饮储备干部岗位面试问题及答案
- 江苏省宿迁市宿迁中学2025届化学高一下期末学业质量监测模拟试题含解析
- 大连育明中学2025年化学高一下期末统考试题含解析
- 河南省南阳市第三高级中学校2025年高二下化学期末监测试题含解析
- 河北省衡水市深州贾城西中学2025届高一化学第二学期期末复习检测试题含解析
- 国企采购成本管理办法
- 国农以工代赈管理办法
- 河南永州河道管理办法
- 河堤流动摊贩管理办法
- 2025CSCO胆道恶性肿瘤诊疗指南解读
- 人民调解文书规范制作
- 教育督导考试试题及答案
- 红十字救护员培训
- 肩颈腰椎护理
- 2025-2030中国手工皂行业市场发展趋势与前景展望战略研究报告
- 眼科医院感染制度与规程
- 透析病人营养不良的护理
- T-CPUMT 025-2024 工业互联网平台 服务通.用要求
- 2025年度地质勘探监理服务合同范本
- 2025年上半年北京市西城区教委事业单位公开招聘考试笔试易考易错模拟试题(共500题)试卷后附参考答案
评论
0/150
提交评论