版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,概率论与数理统计,前几章我们学习了概率论的基本知识,从本章开始将学习数理统计的基本知识、理论和方法数理统计是以对随机现象观测所取得的资料(数据)为出发点,以概率论为基础来研究随机现象的一门学科 概率论中,往往是在已知随机变量分布的条件下,去研究它的性质、特点和规律性,比如求随机变量取某些特定值的概率、求随机变量的数字特征、研究多个随机变量之间的关系等,第6章 数理统计基础,在数理统计中,我们所研究的随机变量的分布往往是未知的,通过对随机变量进行多次独立重复的试验和观测,获取数据,利用实际观测数据研究随机变量的分布,对其分布函数、数字特征等进行估计和推断 本章作为数理统计基础,学习总体、样本
2、、统计量与抽样分布等有关概念,以及有关正态总体的重要的抽样分布定理,数理统计学是一门应用性很强的学科。它研究怎样以有效的方式收集、 整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。,数理统计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。,4,第6章 数理统计基础,【数理统计简史】 相对于其它许多数学分支而言,数理统计是一个比较年轻的数学分支多数人认为20世纪40年代克拉美(H.Carmer)的著作统计学的数学方法,使得1945年以前25年间英、美统计学家在统计学方面的工作与法、俄数学家在概率论方面的
3、工作结合起来,从而形成数理统计这门学科数理统计有很多分支,但其基本内容为采集样本和统计推断两大部分发展到今天的现代数理统计学,已经历了各种历史变迁,1. 近代统计学时期 18世纪末到19世纪,是近代统计学时期这一时期的重大成就是大数定律和概率论被引入统计学之后最小二乘法、误差理论和正态分布理论等相继成为统计学的重要内容这一时期有两大学派:数理统计学派和社会统计学派,【数理统计简史】,【数理统计简史】,数理统计学派始于19世纪中叶,代表人物是比利时的凯特莱(A.Quetelet,1796-1874),著有概率论书简社会物理学等,他主张用研究自然科学的方法研究社会现象,正式把概率论引入统计学,并最
4、先用大数定律证明了社会生活中随机现象的规律性,提出了误差理论凯特莱的贡献,使统计学的发展进入个了一个新的阶段,社会统计学派始于19世纪末,首创人物是德国的克尼斯(K. G. A. Knies),他认为统计学是一个社会科学,是研究社会现象变动原因和规律性的实质性科学各国专家学者在社会经济统计指标的设定与计算、指数的编制、统计调查的组织和实施、经济社会发展评价和预测等方面取得了一系列的重要成果德国统计学家恩格尔(C.L.E.Engel,1821-1896)提出的“恩格尔”系数,美国经济学家库兹涅茨和英国经济学家斯通等人研究的国民收入和国内生产总值的核算方法等,都是伟大的贡献,【数理统计简史】,18
5、世纪到19世纪初期,高斯从描述天文观测的误差而引进正态分布,并使用最小二乘法作为估计方法,是近代数理统计学发展初期的重大事件,对社会发展有很大的影响,【数理统计简史】,用正态分布描述观测数据的应用是如此普遍,以至在19世纪相当长的时期内,包括高尔顿(Galton)在内的一些学者,认为这个分布可用于描述几乎是一切常见的数据直到现在,有关正态分布的统计方法,仍占据着常用统计方法中很重要的一部分最小二乘法方面的工作,在20世纪初以来,经过一些学者的发展,如今成了数理统计学中的主要方法,【数理统计简史】,2. 现代统计学时期 从19世纪末到现在,是现代统计学时期这一时期的显著特点是数理统计学由于同自然
6、科学、工程技术科学紧密结合并被广泛应用于各个领域而获得迅速发展各种新的统计理论和方法、尤其是推断统计理论与方法得以大量涌现,【数理统计简史】,例如英国统计学家卡尔.皮尔逊(K.Pearson,1857-1936)的2分布理论,统计学家戈赛特(W.S.Gosset,1876-1937)的小样本t分布理论,统计学家费歇尔(R.A.Fisher,1890-1962)的F分布理论和试验设计方法,波兰统计学家尼曼(J.Neyman)和英国统计学家皮尔逊(E.S.Pearson,1895-1980)的置信区间理论和假设检验理论,以及非参数统计法、序贯抽样法、多元统计分析法、时间序列跟踪预测法都应运而生,并
7、逐步成为现代统计学的主要内容,【数理统计简史】,现代统计学时期是数理统计发展的辉煌时期,数理统计不仅在理论上取得重大进展,其方法在生物、农业、医学、社会、经济、工业和科技等方面得到愈来愈广泛的应用另外,计算机的应用对统计学的产生了巨大的影响,需要大量计算的统计方法,有了计算机,这一切都不成问题,【数理统计简史】,第6章 数理统计基础,【质量控制问题】 某食盐厂用包装机包装的食盐,每袋重量500g,通常在包装机正常的情况下,袋装食盐的重量X服从正态分布,均值为500g,标准差为25g为进行生产质量控制,他们每天从当天的产品中随机抽出30袋进行严格称重,以检验包装机工作是否正常某日,该厂随机抽取3
8、0袋盐的重量分别为: 从这些数据看,包装机的工作正常吗?,6.1 总体和样本 6.1.1 总体与个体 总体或母体指我们研究对象的全体构成的集合,个体指总体中包含的每个成员 例如,在研究某高校学生生活消费状况时,该校全体学生就是一个总体,其中每一个学生是一个个体;在人口普查中,总体是某地区的全体人口,个体就是该地区的每一个人,第6章 数理统计基础,6.1.1 总体与个体,我们研究总体时,所关心的往往是总体某方面的特性,这些特性又常常可以用一个或多个数量指标来反映 例如,在研究某高校学生生活消费状况时,关心的可能是学生们每月的生活消费额,在研究某厂生产的灯泡的质量时,关心的可能是这些灯泡的寿命和光
9、亮度等 这时总体指一个或多个数量指标,这些数量指标对我们来说是不了解或者说是未知的,我们可以用一个或多个随机变量来表示它们,因此,总体可以是一维随机变量,也可以是多维随机变量 例如,在研究某高校学生生活消费状况时,可以用X表示月生活消费额,在研究某厂生产的灯泡的质量时,可以分别用X,Y表示灯泡的寿命和光亮度,那么,对上面两个问题的研究就转化为对总体X和总体(X,Y)的研究了,6.1.1 总体与个体,根据总体中包含个体的数量,可以将总体分为有限总体和无限总体,当总体中包含个体的数量很大时,我们可以把有限总体看成是无限总体 例如,某厂某天生产的灯泡可以看作是有限总体,而该厂生产的全部灯泡就可以看作
10、为无限总体,因为它包含过去和将来生产的灯泡的全部,6.1.1 总体与个体,6.1.2 样本与抽样 实际应用中,为了研究总体的特性,总是从总体中抽出部分个体进行观察和试验,根据观察或试验得到的数据推断总体的性质 我们把从总体中抽出的部分个体称为样本, 把样本中包含个体的数量称为样本容量, 把对样本的观察或试验的过程称为抽样, 把观察或试验得到的数据称为样本观测值(观测数据),简称样本值,例如,在质量检验中,随机抽出n件产品,测得的数据x1,x2,.,xn,就称它们是样本观测值 在抽样前,不知道样本观测值究竟取何值,应该把它们看作为随机变量,记作X1,X2,.,Xn,称其为容量为n的样本. (在不
11、会混淆的情况下,有时我们也将观测数据x1,x2,.,xn称为样本,如“质量控制问题”中的30个数据,也可以说成是一个容量为30的样本),6.1.2 样本与抽样,在应用中,我们从总体中抽出的个体必须具有代表性,样本中个体之间要具有相互独立性,为保证这两点,一般采用简单随机抽样 定义6.1 一种抽样方法若满足下面两点,称其为简单随机抽样: (1) 总体中每个个体被抽到的机会是均等的; (2) 样本中的个体相互独立 由简单随机抽样得到的样本称为简单随机样本 如果没有特殊说明,以后所说样本均指简单随机样本,6.1.2 样本与抽样,设X1,X2,.,Xn是从总体X中抽出的简单随机样本,由定义可知,X1,
12、X2,.,Xn有下面两个特性: (1) 代表性:X1,X2,.,Xn均与X同分布,即若X F(x),则对每一个Xi都有 Xi F(xi),i = 1,2,n (2) 独立性:X1,X2,.,Xn相互独立. 由这两个特性可知,若X的分布函数为F(x),则X1,X2,.,Xn的联合分布函数为 F(x1,x2,xn) = F(x1)F(x2)F(xn) 若X具有概率密度为f(x),则X1,X2,.,Xn的联合概率密度为 f(x1,x2,xn) = f(x1) f(x2)f(xn),6.1.2 样本与抽样,往往是未知或不完全知道的,是需要通过样本来进行研究和推断的,【例6.1】设总体X服从均值为1/2
13、的指数分布,X1,X2,X3,X4为来自X的样本,求X1,X2,X3,X4的联合概率密度和联合分布函数 解:X的概率密度为 其分布函数为 则X1,X2,X3,X4的联合概率密度为:,6.1.2 样本与抽样,6.1.2 样本与抽样,由于X的分布函数为 X1,X2,X3,X4的联合分布函数为,【例6.2】已知总体X的分布为PX = i = 1/4, i = 0,1,2,3,抽取n=36的简单随机样本X1,X2,.,X36, 求 大于50.4小于64.8的概率 解:总体X的均值和方差分别为,6.1.2 样本与抽样,由于X1,X2,.,X36均与总体X同分布,且相互独立,所以,Y的均值和方差分别为 又
14、因为n = 36较大,依中心极限定理, 近似服从正态分布 ,所以,6.1.2 样本与抽样,6.1 总体和样本,6.1.3 直方图与经验分布函数 如前所述,数理统计所研究的实际问题(总体)的分布一般来说是未知的,需要通过样本来推断但如果对总体一无所知,那么,做出推断的可信度一般也极为有限在很多情况下,我们往往可以通过具体的应用背景或以往的经验,再通过观察样本观测值的分布情况,对总体的分布形式有个大致了解观察样本观测值的分布规律,了解总体X的概率密度和分布函数,常用直方图和经验分布函数.,1. 直方图 直方图是对一组数据x1,x2,.,xn的分布情况的图形描述 将数据的取值范围分成若干区间(一般是
15、等间隔的),在等间隔的情况,每个区间的长度称为组距考察这些数据落入每一个小区间的频数和频率,在每一个区间上画一个矩形,它的宽度是组距,高度可以是频数、频率 或频率/组距,所得直方图分 别称为频数直方图、频率直 方图和密度直方图,6.1.3 直方图与经验分布函数,图6-1 密度直方图,如果数据x1,x2,.,xn是来自连续总体X的样本观测值,其密度直方图中,每一个矩形的面积恰好是观测数据落入对应区间的频率,这种密度直方图可以用来估计总体的概率密度(用密度直方图的顶部折线估计X的概率密度曲线)组距对直方图的形态有很大的影响,组距太小或太大,直方图反映概率密度的形态就不够准确,6.1.3 直方图与经
16、验分布函数,6.1.3 直方图与经验分布函数,一个合适的分组是希望密度直方图的形态接近总体的概率密度函数的形态手工计算常取组数等于 左右,一些统计软件会根据样本容量和样本的取值范围自动确定一个合适的分组方式,画出各种漂亮的直方图,【实验6-1】从某高校一年学生的“高等数学”课程考试成绩中,随机抽取60名学生的成绩如下: 试利用Excel的“数据分析”功能作学生成绩的密度直方图,并通过直方图了解学生成绩的分布情况,6.1.3 直方图与经验分布函数,实验步骤: (1) 确定分组个数:因为 ,取分组个数为8数据的最小值为51,最大值为95,为分组方便起见,考虑范围从50到100,分为8个组,组距取5
17、0 / 8 = 6.25,分点分别为:50,56.25,62.5,68.75,75,81.25,87.5,93.75,100。整理学生成绩数据,在“组上限”栏中填入各组的上限值,如图6-2左所示,图6-2 数据整理与“直方图”对话框,(2)在Excel主菜单中选择“工具”“数据分析”,打开“数据分析”对话框,在“分析工具”列表中选择“直方图”选项,单击“确定”按钮 (3) 在打开的“直方图”对话框中,依次输入(或用鼠标拖动选择)“输入区域”、“接收区域”和“输出区域”,如图6-2右所示,单击“确定”按钮 得到频率分布的结果如图6-3左所示,图6-3 计算各组频率与密度,(4) 计算密度:在单元
18、格区域J2:J9中依次输入组域名:50-56.25、56.25-62.5、62.5-68.75、68.75-75、75-81.25、81.25-87.5、87.5-93.75、93.75-100,然后在“密度”列的单元格K2中输入公式:=I2/60/6.25,并将公式复制到K3K9中,如图6-3右所示,(5) 画密度直方图:选中单元格区域J1:K9,单击“图表向导”按钮,打开“图表向导”对话框在“图表类型”选择中,取默认的“柱形图”向导,直接单击“完成”按钮,即可得到密度柱形图,如图6-4所示,图6-4 密度柱形图,右键单击图中条形,在快捷菜单中选择“数据系列格式”,打开“数据系列格式”对话框,在其中的“选项”选项卡中,修改“分类间距”为0,如图6-5(左)所示,单击“确定”按钮,即可加宽条形,得到密度直方图,进一步修改图形,得到密度直方图,如图6-5(右)所示,图6-5 密度直方图,从学生成绩的密度直方图可以看到,学生成绩在平均分附近比较密集,较低或较高分数学生比较少,学生成绩的分布呈近似“钟形”对称,即成绩分布近似正态分布,类似的方法可以画出学生成绩的频数直方图和频率直方图,由于三种直方图只是高度相差一定的倍数,所以在研究总体分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 视频备份布线系统优化
- 2026年3月广东广州市白云区太和镇人民政府补录政府雇员1人备考题库及答案详解【典优】
- 2026浙江宁波逸东豪生大酒店招聘7人备考题库【学生专用】附答案详解
- 重症医学科心肌梗死护理要点
- 精神病患者的健康教育
- 2026山东青岛澳西智能科技有限公司招聘2人备考题库(基础题)附答案详解
- 2026湖南省中南林业科技大学涉外学院人才招聘备考题库及参考答案详解【综合题】
- 2026春季中国工商银行黑龙江省分行校园招聘178人备考题库含答案详解(黄金题型)
- 2026江西赣州市就业创业服务中心招募青年见习1人备考题库必考附答案详解
- 中国人民解放军第五七一八工厂 2026届校园招聘备考题库含完整答案详解【典优】
- 道路绿化养护投标方案(技术方案)
- 学生心理问题转介处置制度
- 科室医院感染管理架构图
- 贵州源鑫矿业有限公司煤矸石洗选综合利用项目环评报告
- 八年级下册音乐复习题及答案(湘艺版)
- 高中地理(湘教版2019版)必修二 全册知识点
- 2023年北京市各区(海淀朝阳丰台东西城等)高三下语文高考一模汇编7 基础运用含详解
- 2022年中国石油大学《化工原理二》完整答案详解
- RC512-FE(A)-用户使用手册202307
- GB/T 5153-2003变形镁及镁合金牌号和化学成分
- GB/T 4357-2022冷拉碳素弹簧钢丝
评论
0/150
提交评论