版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计(第三版)1第六章抽样分布2总体与样本统计图形统计量与抽样分布3§6.1总体与样本一、总体与个体4定义1
试验中所有可能的观察值的全体称为总体,总体中的每个元素称为个体。总体中包含的个体的个数称为总体的容量。
例如,检验某家工厂某天生产的10000只灯泡是正品还是次品,
总体:10000只灯泡的检验结果的全体
个体:每个产品的检验结果有限总体无限总体总体5说明:总体本质上就是指随机变量。(1)对总体的研究,就是对相应的随机变量
X的研究。(2)随机变量
X
的分布函数和数字特征称为总体的分布函数和数字特征。6二、样本与样本联合分布从总体中抽取若干个个体,称这些个体为总体的一个样本。1、简单随机样本(以下简称样本)则称X1,X2,…,Xn为来自总体X的容量为n
的简单随机样本。(1)X1,X2,…,Xn是相互独立的随机变量;(2)每一个Xi都与总体X具有相同的分布;定义2
设随机变量X的分布函数为F(x),若在抽样后,记样本观察值为(x1,x2,…,xn).72、样本联合分布联合概率密度为样本
X1,X2,…,Xn
的联合分布函数为:若总体
X是连续型随机变量,分布函数为F(x),概率密度为f(x),则同理对于离散型随机变量也可写出联合分布函数及联合分布律8例(教材例6.3.1)解9谢谢!10中国人民大学出版社概率论与数理统计(第三版)11刘强郭文英孙阳陈江荣第六章抽样分布12总体与样本统计图形统计量与抽样分布13§6.2统计图形14
为了研究总体的分布,常常会通过抽样得到许多观察值,在利用这些数据进行统计分析之前,需将它们加以整理,借助表格或图形对数据加以描述。
本节将介绍种展示数据的图形:直方图、茎叶图、箱线图。一、直方图15例1(教材例6.2.1)50名4岁男孩身高数据见教材,试画出这些数据的频率直方图.解具体解题过程如下:1、首先将数据进行整理,按从小到大的顺序排列,并找到最小值a和最大值b(a=87,b=118)2、选取一个区间将[a,b]覆盖,并等分为k个小区间,小区间的长度为,称为组距.(取区间[84.5,119.5],k=7,)163、计算出落在每个小区间内数据的个数,计算出频率4、从左至右依次在各个小区间上作出高为的小矩形,即得频率直方图.2、直方图的外廓曲线接近于总体的概率密度曲线3、直方图可以用来估计落在某个区间上的概率说明:1、小矩形的面积等于数据落在该区域的频率
当时,当时,4、分组时,尽量避免某些小区间频数为0的情况,一般18二、茎叶图例2绘制例6.2.1中数据的茎叶图.解
先将数据按从小到大的顺序排列,所有数据位于80~119之间,将高位数字作为茎,放在竖线左侧,个位数字作为叶,放在竖线右侧,则可绘制出茎叶图。19说明
此例中,若以5为组距,则可得到扩展的茎叶图。20三、箱线图
箱线图是由箱子和直线组成的图形,它是基于以下5个数的图形概括:数据的最小值、第一四分位点、中位数、第三四分位点、最大值.(1)至少有个观测值小于或等于;(2)至少有个观测值大于或等于;定义
设有样本观测值,给定,若满足样本p分位点.样本中位数;第一四分位数;第三四分位数.21说明:样本p分位数可以按照如下法则定义
首先将样本值按从小到大的次序排列,不妨设排序后的样本值为当np不是整数当np是整数22例3有一组容量为8的样本观测值(已经排序)12,14,15,16,20,22,24,25求解因为,所以
因为,所以同理23)2422(2175.0=+=x23箱线图的绘制步骤:(2)在箱体上对应于中位数M的位置画一条垂线.(3)在箱体左侧引一条水平线直至最小值Min,在同一高度自箱子右侧引一条水平线直至最大值Max.箱线图主要反映了数据的如下三个特征:中心位置,离散程度,对称性24例4绘制例6.2.1中数据的箱线图.解易知,分别由从而可绘得箱线图为25在数据集中,某个观测值不寻常地大于或小于该数据集中的其他数据,称为疑似异常值.若数据小于或大于,则认为是疑似异常值.
称为四分位数间距.在箱线图中标记出疑似异常值,对箱线图进行修正可更直观、更准确地描述数据集的分布特征。说明:箱线图特别适合于比较两个或两个以上数据集的性质.26绘制修正箱线图步骤:(2)在箱体上对应于中位数M的位置画一条垂线.(4)确定除异常值之外的其他数据的最小值Min及最大值Max,从箱体左侧引一条水平线直至新的最小值,在同一高度自箱子右侧引一条水平线直至新的最大值.
(3)检查异常值点,并用*标记.谢谢!27中国人民大学出版社概率论与数理统计(第三版)28刘强郭文英孙阳陈江荣第六章抽样分布29总体与样本统计图形统计量与抽样分布30§6.3统计量与抽样分布一、基本概念定义1
统计量.说明:(1)
g为连续函数,或分段连续函数;(2)
g是样本的函数,故统计量仍是一个随机变量。32二、常用统计量1、
样本均值定理1
证332、样本方差定理2
证343、样本标准差4、样本k阶(原点)矩说明5、
样本k阶中心矩356、总体分布函数F(x)的统计量——经验分布函数定理3
36三、常用抽样分布
统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的抽样分布。
数理统计中常用到来自正态总体的如下三个分布:
2分布、
t分布和F分布371.
2分布定义2
为服从自由度为n的
2分布,记为(1)2分布的概率密度为:3839例1
解4041(2)2分布具有下面的性质:性质1(分布可加性)
性质242(3)
2分布的分位点:定义3
2分布的上分位点.说明432、t分布(学生氏分布)定义4
为服从自由度为n的t分布,记为(1)
t分布的概率密度为:44t分布的概率密度函数h(t)的图形:45(2)t分布的性质:46例2
解47(3)
t分布的分位点:定义5
t分布的上分位点.说明483、F分布定义6
为服从自由度为m,n的
F分布,记为(1)
F分布的概率密度为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026.4.6 纸箱自动拆垛机器人
- 2026乐清电厂考编笔试冲刺提分卷附全题型答案详解
- 刷完直接上岸2024直招军官计算机面试专属题库合集
- 2022年汾酒厂质检岗招聘笔试题库及答案解析
- 2021招飞民航英语测试题及答案直接刷题就提分
- 2023烟草送货员面试必考30题看完通过率提升90%
- 2026年农机安全测试题库及答案
- 等腰三角形课件2025-2026学年北师大版数学八年级下册
- 购买墓地协议书遗失
- 抵押贷款放弃还款协议书
- 2026年济南历下区九年级中考数学一模考试试题(含答案)
- 2026新质生产力人才发展报告-
- 大脑卒中急救处理方案
- 广东省化工(危险化学品)企业安全隐患排查指导手册(精细化工企业专篇)
- 地铁工程扬尘防治专项施工方案
- 2026吉林大学第二医院合同制护士招聘50人考试参考试题及答案解析
- 2026年课件湘少版四年级英语下册全套测试卷-合集
- 急危重症患者的病情评估和护理
- (2025年版)儿科血液科护理实践指南
- 麻醉科常用药品稀释标准说明
- 2026中国牛肉干行业销售动态及消费趋势预测报告
评论
0/150
提交评论