已阅读5页,还剩27页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四讲 样本分布Sample Distribution1第一节样本平均数的分布2一、定义 简单随机样本 (simple random sample):从总体大小为 N的总体中抽取 n个样本,每个样本为 n的样本都有相同的概率被抽取。 大样本 : 可以无放回抽样 小样本 : 必须大样本抽样 样本变异性 (sampling variability): 简单随机样本平均数间存在差别。或抽样误差(sampling error) 样本分布 (sampling distribution): 指样本的概率分布。3二、样本平均数的分布 从 N个总体中随机抽取样本含量为 n的样本,共抽 m次,求样本平均数的分布 (sample distribution for the mean)。 计算每个样本的平均数 列出每次抽样的平均数,并列出每个平均数的频率直观观察4例题 1 一个骰子掷两次算一次抽样,求所有样本的样本平均数和方差1 2 3 4 5 61 1,1 1,2 1,3 1,4 1,5 1,62 2,1 2,2 2,3 2,4 2,5 2,63 3,1 3,2 3,3 3,4 3,5 3,64 4,1 4,2 4,3 4,4 4,5 4,65 5,1 5,2 5,3 5,4 5,5 5,66 6,1 6,2 6,3 6,4 6,5 6,65样本数为 2的可能样本6平均数 频 率 相 对频 率1.0 1 0.0281.5 2 0.0562.0 3 0.0832.5 4 0.1113.0 5 0.1393.5 6 0.1674.0 5 0.1394.5 4 0.1115.0 3 0.0835.5 2 0.0566.0 1 0.028总 和 36 1.000平均数的抽样分布7样本平均数的分布1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.08Solution:样本平均数和样本方差(平均数的 )标准误 9总体的分布 掷骰子,其样本空间为 1,2,3,4,5,6,则有:10假定总体服从二项分布,样本数为 N抽取样本的样本含量为 n。 样本分布的推导11样本分布:标准误 standard error, 度量 精确性:样本分布正态分布12定理 情况 1. 如果样本来自正态分布,平均数为 ,方差为 2,样本含量为 n, 则样本平均数 : 服从正态分布 分布的平均数等于 ,即总体平均数 分布的方差等于 , 称为总体标准误(population standard error),或者为平均数的标准误(standard error of the mean)13定理 情况 2:当总体 不是 服从正态分布,平均数为 ,方差为 2,样本含量为 n, 则样本平均数: 近似服从正态分布,随样本越大,近似越好。一般地,样本大小需要量与总体分布的形状有关。一般地,样本数 30或者 30以上,近似会比较好( 中心极限定理 , Central Limit Theorem, CLT)。 样本平均数分布的平均数等于 样本平均数分布的方差等于 2/n, SQRT( 2/n)称为总体标准误 population standard error或者为平均数的标准误standard error of the mean14总体平均数的期望15样本平均数的方差16标准化样本平均数的分布标准化的样本平均数据服从标准正态分布17Example 成年男性 (5060岁 )血液中胆固醇平均含量为 200 mg/dl, 标准差 20 mg/dl。 这一群体的人血液中胆固醇含量低于 250 mg/dl 的人的比例? 平均高于 225 mg/dl 人的比例?18Example 从总体中抽取 100个男人,血液中胆固醇含量低于 204 mg/dl 的概率?首先,根据 CLT, 样本服从正态分布,期望为 200 mg/dl,标准差为:19Example 如果有 25个人严格吃素,他们血液中胆固醇含量为 188 mg/dl, 请问可以说他们血液中胆固醇含量显著低吗?20t 分布 一般我们不知道总体标准差 ,要用样本标准差 S代替。is called “t statistic(统计量 )”21例题 已知某种植树株高的标准差为 16 cm2。 现在有 25个样本,其平均株高是 15 cm。 计算总体平均数的 95%和 99%置信区间。22置信区间 Confidence intervall 从样本计算出来的、在某个概率水平的、包含真正参数的区间。区间的两端规定了置信范围 (confidence limits )。概率大小称为置信水平 (confidence level)。通常的置信水平为 95%2324 假定总体方差未知,计算总体均数的 95%和99%置信区间2595%C.I. 99%C.I.利用 Z和 13.432,16.568 12.940,17.060利用 t和 s 13.349,16.651 12.762,17.238总体方差已知和未知结果的比较当 未知时 , 估计出的置信区间较宽26概念总体标准误:样本平均数抽样误差样本标准误:样本平均数抽样误差的估计值样本标准差:样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025煤炭矿山工程设计与施工合同
- 铁路毕业考试题目及答案
- 2025综合演出经纪合同
- 2025年合同续约洽谈通知
- 2025年财产保险合同范本
- 2025年高速公路沥青铺设工程分包施工合同
- 2025年农村土地流转合同范本解析
- 2025年房屋安全检测合同协议
- 文化背景影响评估-洞察与解读
- 2025年房产抵押借款合同协议
- 2025年江苏省行政执法证考试题库附答案
- 2025年国考税务面试真题及答案
- 用火用电安全培训资料课件
- 城市沟槽开挖安全监测方案
- 基坑外架专项施工方案(单立杆双排脚手架)
- 本科护理系毕业论文
- (贵州)贵阳市、铜仁市2026届高三年级9月摸底考试化学(含答案)
- 外研版(三起)(2024)四年级上册英语 Unit 5 Lets go!单元整体教学设计(共5课时)
- GPS的课件教学课件
- 检验科标本接收与处理操作规程
- GB/T 43683.3-2025水轮发电机组安装程序与公差导则第3部分:立式混流式水轮机或水泵水轮机
评论
0/150
提交评论