版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数理统计大数据时代,数理统计的重要性不言而喻概率论和数理统计尽管两者有密切的联系,但本质上是两门不同的课程。概率论是理论基础课,解决理论问题;数理统计是应用专业课,解决实际问题。概率论更注重逻辑和体系的严密,是一门真正的数学课。数理统计则对同一个具体问题也没有一个最佳的答案,我们往往需要凭经验选择“较优”的方法,不是纯粹的数学。学习方法也不同。概率论注重逻辑推导,而数理统计则是以解决问题为导向,黑猫白猫,捉住老鼠就是好猫;以案例为中心。从某种意义上讲,数理统计比概率论简单,因为大部分题目只要能记住公式套公式就能解决;但从更深层次讲,数理统计又要比概率论难,因为要想把整个推导的机理完全理解,不但要有概率论的基础,还要对数理统计的思想有所把握。舌尖上的中国仅仅想要吃饱,大米或者面粉足以;要吃到绝世美味,定要艰苦的努力和长期的坚持。希望大家能花功夫领会数理统计的精髓,而非泛泛了解皮毛数理统计的基本概念这一部分内容本质上是为第7、8章服务的,较繁杂,等7、8章学完之后返回来复习才能完全体会到引入这些概念的用意引言
概率论的许多问题中,随机变量的概率分布通常是已知的,
随机变量及其所伴随的概率分布全面描述了随机现象的统计性规律,而一切计算与推理都是在这已知的基础上得出来的。
但实际中,情况往往并非如此,一个随机现象所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。例如:某公路上行驶车辆的速度服从什么分布是未知的;电视机的使用寿命服从指数分布,但参数λ是未知的;产品是否合格服从两点分布,但参数——合格率p是未知的;
数理统计的任务则是以概率论为基础,根据试验所得到的数据,对研究对象的客观统计规律性做出合理的推断。一言蔽之:数理统计方法具有“用局部推断整体”的特征.
在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断,最终进行预测为生产生活服务。实际生活中的问题:长期的生产经验告诉我们,水泥厂成品打包机装袋的重量X服从正态分布。如何得到该正态分布的具体形式,即两参数确切的值?把打包机使用周期内所有的数据全部记录下来,可近似看做一个连续的密度函数抽取50包水泥,重量分别记为:X1,X2,……X50因为已知:E[X]=μ,Var[X]=σ2考虑:希望和μσ2比较接近总体样本统计量总体、样本和统计量总体与样本在数理统计中,把研究对象的全体称为总体,而把组成总体的每个单元称为个体。总体可以认为是一个随机变量。因为我们在抽样之前无法预测个体或样本的取值,或者每次抽取的值并不相同,所以每个个体也是一个随机变量,而样本是n维随机向量。若干个体构成的集合称为样本。若样本中包含n个个体,则n
称为这个样本的容量.
一旦取定一组样本X1,…,Xn,得到n个具体的数(x1,x2,…,xn),称为样本的一次观测值,简称样本值.随机抽样方法的基本要求独立性——每次抽样的结果既不影响其余各次抽
样的结果,也不受其它各次抽样结果的影响。
满足上述两点要求的样本称为简单随机样本.获得简单随机样本的抽样方法叫简单随机抽样.代表性——样本()的每个分量
与总体具有相同的分布。
从简单随机样本的含义可知,样本
是来自总体
、与总体
具有相同分布的,相互独立的随机变量.
简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,…,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.若总体的分布函数为F(x)、分布密度函数为f(x)。由于简单随机抽样中对每个样本的观测相互独立,故简单随机样本视为随机向量,其联合分布函数为其简单随机样本的联合分布密度函数为=F(x1)F(x2)…F(xn)=f(x1)f(x2)…f(xn)简单随机抽样的例子
例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。统计量(最核心)希望用统计量来反映总体的分布,特别是参数的信息
定义设()为总体X的一个样本,为不含任何未知参数的连续函数,则称为样本()的一个统计量。则例如:设是从正态总体中抽取的一个样本,其中为已知参数,为未知参数,是统计量不是统计量每个样本都是一个随机变量,而统计量是样本的函数,也是随机变量。注意统计量是随机变量!定义:每次抽取或者检测所得到的统计量的值也称为统计量的观测值。每次所得样本值是不同的,统计量的观测值也不同故统计量一定要视为随机变量例:水泥厂成品打包机装袋的重量X服从正态分布。抽取50包水泥,重量分别记为:X1,X2,……X50因为已知:E[X]=μ,Var[X]=σ2考虑:希望和μ和σ2比较接近统计量最常用的统计量样本均值:设是总体的一个样本,样本方差:用概率方法来探讨一个统计量在推断总体时,往往要知道统计量分布的一些信息。样本均值与样本方差的数字特征证明:(1)利用期望的性质及独立性(2)修正样本方差设是总体的一个样本,修正样本方差:即:于是有样本k阶原点矩:样本k阶中心矩:注意:统计量的函数仍然是统计量。比如:当μ已知时:当σ2已知时:其他常用统计量顺序统计量:样本极差:样本中位数:命题6.3.5设总体X的分布函数为FX,分布密度函数为fX,则Xn按大小顺序排列,第k个随机变量X(k)的密度函数为顺序统计量的分布证明:故有经验分布函数绝大多数统计问题的背景是已经知道分布的类型,但是不确定分布的参数。但是有些情况下分布的类型也不清楚,此时就需要引入经验分布函数。设总体X的分布函数为FX,利用伯努利大数定律可以证明,对于任意ε>0,有即当样本容量n足够大时,经验分布函数与总体的分布函数差距很小。因此只要样本容量足够大,就可以近似推断总体的分布。如何证明?
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机械使用安全生产制度培训
- 氧气瓶与乙炔瓶使用安全技术规定培训
- 2025《答司马谏议书》新旧势力的较量课件
- 2026年高端厨电设备制造合同协议
- 2026执业兽医考试预防科目速记100条口诀
- 幼儿园炊事员工作制度与安全管理培训
- 2026年广东生态工程职业学院单招职业技能考试题库附参考答案详解(典型题)
- 焊工安全责任培训课件
- 2026年广东科贸职业学院单招职业技能测试题库附答案详解(a卷)
- 2026年平顶山工业职业技术学院单招职业倾向性考试题库及答案详解(真题汇编)
- 2025年公开选拔副科级领导干部面试题及答案
- 2026年春季学期升旗仪式安排表及讲话稿(18周):春风作序开新卷步步生花向远方
- 2025年智慧消防工程师专业技能实操考核要求试题及真题
- (2025年)胎心监护判读及处理试题及答案
- 公共卫生足浴管理制度
- 2026年黑龙江能源职业学院单招职业适应性测试题库及答案1套
- 2026 年初中英语《名词》专项练习与答案 (100 题)
- 2025年NCCN肝细胞癌临床实践指南解读课件
- 广铁集团校园招聘机考题库
- 雷达基础知识教学课件
- 2025年印刷行业质量控制与标准操作
评论
0/150
提交评论