版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,第六 章 数理统计的基本概念,总体与样本 直方图与经验分布函数 统计量及抽样分布,2,数理统计: 是一门具有广泛应用的学科.它以概率论为理论基础,根据试验或观察得到的数据来研究随机现象,对所研究的对象的客观规律性作出合理的估计和推断. 数理统计的内容: 数据的收集,整理 统计推断,3,6.1 总体与样本,1. 总体:研究对象的全体。 通常指研究对象的某项数量指标(如:某种灯泡的寿命, 某种产品的合格率等) 。更多的情况下,我们把全部可能的研究对象的数量指标的所有观察值称为总体. 组成总体的元素称为个体。 对总体的研究就是对某项数量指标(随机变量)的研究,实际上就是对该随机变量的概率分布进行
2、研究,从本质上讲,总体就是所研究的随机变量或随机变量的分布。所以,我们一般用随机变量表示总体,4,2. 样本:来自总体的部分个体X1, ,Xn 如果满足:,(1)同分布性: Xi,i=1,n与总体同分布. (2)独立性: X1, ,Xn 相互独立; 则称为容量为n 的简单随机样本,简称样本。 而称X1, ,Xn 的一次实现为样本观察值,记为x1, ,xn,5,来自总体X的随机样本X1, ,Xn可记为,显然,样本联合分布函数或密度函数为,或,6,3.总体、样本、样本观察值的关系,总体,样本,样本观察值,?,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布。样本是联系两者的桥梁
3、。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体,7,直方图,设来自总体的一个样本为,样本观察值为,6.2 直方图与经验分布函数,8,(1) 对样本进行排序分组:作为一般性的原则,组数通常在520个,对容量较小的样本;,(2) 确定每组组距:近似公式为 组距t = (最大观测值 最小观测值)/组数;,(3) 确定每组组限: 各组区间端点为 t0, t1=t0+d, t2=t0+2d, , tk=a0+kd, 形成如下的分组区间 (t0 , t1 , (t1, t2, , (tk-1 , tk,具体步骤如下:,其中t0 略小于最小观测值, tk
4、略大于最大观测值.,9,()统计落在每个小区间的频数,()作频率直方图,()近似得概率密度曲线图,例 为研究某厂工人生产某种产品的能力, 我们随机调查了20位工人某天生产的该种产品 的数量,数据如下,10,列出其频数频率分布表。,组序 分组区间 组中值 频数 频率 累计频率(%) 1 (147,157 152 4 0.20 20 2 (157,167 162 8 0.40 60 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100 合计 20 1,11,直方图是频数分布的图形表示,它的横坐标表示所
5、关心变量的取值区间,纵坐标是频率/组距,它可使得诸长条矩形面积和为1。,将直方图中每个长方形的“顶边”的中点用一条光滑的曲线连接起来,即得的分布密度函数的近似曲线,12,经验分布函数,设 X1, X2, , Xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1), x(2), , x(n),则称 x(1), x(2), , x(n) 为有序样本, 用有序样本定义如下函数,13,则Fn(x)是一非减右连续函数,且满足,Fn() = 0 和 Fn() = 1,由此可见,Fn(x)是一个分布函数, 并称Fn(x)为经验分布函数。,14,例1 某食品厂生产听装饮料,现从
6、生产线上 随机抽取5听饮料,称得其净重(单位:克) 351 347 355 344 354,x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 354, x(5)= 355,这是一个容量为5的样本,经排序可得有序样本:,15,其经验分布函数为,由贝努里大数定律: 只要 n 相当大,Fn(x)依概率收敛于F(x) 。,16,6.3,一、 2分布,数理统计中常用到如下三个分布: 2分布、 t 分布和F分布。,17,2.2分布的密度函数f(x),18,3. 分位点 设X 2(n),若对于:01, 存在,满足,则称,为,分布的上侧分位数。,19,4.性质 a.分布可加性 若X
7、 2(n),Y 2(m ), X, Y独立,则 X + Y 2(n+m ) b.期望与方差 若X 2(n),则 E(X)= n,D(X)=2n,1.构造 若XN(0, 1), Y2(n), X与Y独立,则,的分布称为自由度为n的t分布。 记为Tt(n),二、t分布,20,t(n) 的概率密度为,21,2.基本性质: (1) f(t)关于t=0(纵轴)对称。 (2) f(t)的极限为N(0,1)的密度函数,即,3.分位点 设Tt(n),若对 :00, 满足PTt(n)=, 则称t(n)为 t(n)的上侧分位点,22,注:,23,三、F分布,1.构造 若X 2(n1), Y2(n2),X, Y独立,则,称为第一自由度为n1 ,第二自由度为n2的F分布,其概率密度为,24,2. F分布的分位点 对于:00, 满足 PFF(n1, n2)=, 则称F(n1, n2)为 F(n1, n2)的 上侧分位点;,25,证明:设FF(n1,n2),则,注:,得证!,26,6.4、统计量及抽样分布1.统计量,定义:称样本X1, ,Xn 的函数g(X1, ,Xn ) 是 总体X的一个统计量,如果g(X1,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学02(广东卷)(考试版及全解全析)-2026年高考考前预测卷
- 热处理温度曲线复核规范程序
- 驾驶员通勤安排审批流程细则
- 冷冲压线故障应急处置方案
- 传染病预检分诊工作规范
- 加工中心刀具寿命优化制度
- 年度核心产品战略规划与路线图方案
- 医院不良事件上报整改方案
- 冲压线模具更换前后测温制度
- 化学品废液回收处理管理办法
- 2025年陕西、山西、青海、宁夏高考物理试卷真题(含答案解析)
- 北京大学2022年强基计划笔试数学试题(解析版)
- 2024-2025学年清华大学版(2024)A版初中信息科技八年级下册(全册)知识点复习要点归纳
- 五年级下册数学期中必考易错题应用题六大类
- 密闭式静脉输血操作流程
- 审计案例第2章审计风险评估案例
- 2025年中国菠菜种植行业市场全景评估及发展战略规划报告
- 中国食物成分表标准版第6版
- QB-T1022-2021制浆造纸企业综合能耗计算细则
- 2024年江西省中考生物·地理合卷试卷真题(含答案)
- 医院科研诚信课件
评论
0/150
提交评论