




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,抽样误差与抽样分布,-抽样分布,2,抽样误差,从脉搏总体均数为72.5次,标准差为6.3次的正态分布总体中随机抽样。样本个数为10,样本量为9.,n=10,.,3,例4-1样本量为9,从N(72.5,6.32)中共随机抽取10个样本,4,计算样本均数的均数:,计算样本均数的标准差:,5,例4-2P51随机重复抽样共抽10个样本,样本量为25。计算样本均数的均数和标准差.,6,表4-2样本量为25从N(72.5,6.32)共随机抽取10个样本,7,8,抽样误差,结果:各样本均数不一定等于总体均数样本均数间存在差异样本均数的分布规律:围绕总体均数上下波动样本均数的变异:由样本均数的标准差描述,样本均数的波动幅度远小于原始资料的波动幅度抽样误差基本上在0附近近似对称地随机波动在同一总体进行随机抽样,随着样本例数的增加,样本均数的波动幅度在减小。,9,抽样误差,抽样误差Samplingerror由抽样引起的样本统计量与总体参数间的差异来源:个体变异抽样表现样本统计量与总体参数间的差异样本统计量间的差异,10,样本均数的规律性随机的在概率意义下是有规律的-抽样分布通过大量重复抽样,借助频数表描述样本均数的变异规律(抽样分布)与个体观察值变异规律有关即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均数的变异规律,抽样分布,11,正态总体样本均数的分布,例4-3按样本量为9和样本量为25在上述总体中N(72.5,6.3)进行随机抽样每次抽取10000个样本并计算各自的样本均数以10000个样本均数作为一个新的样本制作频率密度分布图,12,抽样1,样本含量n=9的平均数=72.54的标准差=2.14,样本均数的分布,原始资料的分布,理论值,13,抽样2,样本含量n=25的平均数=72.50的标准差=1.27,理论值,14,抽样3,样本含量n=36的平均数=72.50的标准差=1.06,理论值,15,从正态分布的总体中随机抽取样本含量为n的样本X1,X2,Xn,其样本均数服从正态分布,总体均数为;样本均数的总体标准差若,则其中任意一个随机样本Xn的均数,正态总体样本均数的分布,16,样本均数的标准差,称为样本均数的标准误(standarderrorofmean,SE),简称均数标准误它反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。误差大小,实质是要估计的分布特征,正态总体样本均数的分布,17,由于实际往往未知,需要用样本来估计,样本均数标准误的估计式为注意区别:证明:,正态总体样本均数的分布,18,非正态总体样本均数的分布,例4-4从总体均数为1,总体方差为2的卡方分布中抽样,样本大小分别为4,9,200。每次抽10000个样本制作频率密度分布图,19,20,样本含量n=4的平均数=1.0111的标准差=0.7084的中位数=0.8531,21,样本含量n=9的平均数=1.0078的标准差=0.4771的中位数=0.9280,22,样本含量n=200的平均数=1.0078的标准差=0.1004的中位数=0.9973,23,从非正态卡方分布总体中随机抽样所得样本均数:在样本含量较小时呈偏态样本含量较大时接近正态分布均数始终在总体均数附近均数的标准差,非正态总体样本均数的分布,24,中心极限定理及其应用,样本均数总体标准差是个体资料X的总体标准差的;即理论标准误理论标准误的样本估计值为样本均数与个体资料X的集中位置相同,即样本均数的总体均数与个体资料X的总体均数相同,25,中心极限定理及其应用,若个体资料X服从正态总体,则样本均数也服从正态分布;个体资料X服从偏态分布,当样本量n较大时,样本均数近似服从正态分布,26,例4-5大规模普查得某地健康成年男子血红蛋白总体均数为.随机抽样,样本量为100,理论标准误和样本均数的估计标准误。,27,二、率的抽样误差和抽样分布,总体率由样本率估计例如,设样本的个体数(即样本含量)为n,若x为样本的某指标阳性个体数,则可用样本阳性率估计研究人群的阳性率(总体阳性率);由于个体差异和偶然性的影响,样本率也存在抽样误差-由抽样造成样本率与总体率(研究人群的率)的差异样本率是随机的,但在概率意义下也是有规律的-样本率的分布。,28,随机抽样试验,分别在总体率=0.25,0.5,的总体中随机抽样,其总体率和样本含量n每种情况分别随机抽10000个样本,每个样本计算其样本率,把同一种情况的10000个样本率视为一个新的样本资料作频率图,样本率的分布,29,抽样1,30,抽样1,31,抽样3,32,抽样4,33,34,35,结果总体率相同时,样本含量越大,样本率的分布越趋向对称。样本含量n相同时,越偏离0.5,样本率的分布越偏态分布。总体率0.5时,任意样本含量的样本率都呈对称分布。样本率p的样本标准差。,样本率的分布,36,中心极限定理及其推论,若样本中的个体个数(即样本含量)为n,总体率为,样本率为p,则样本率的总体均数等于总体率样本率的总体标准差(即率的标准误)由于总体率通常是未知的,因而用样本率p来估计,故率的标准误的估计值常表示为,37,对于大量重复随机抽样而言,样本率p围绕着总体率波动样本含量n越大,这种波动越小。当n的值充分大时,p的分布就近似于均数为,标准差为的正态分布。这里样本含量n“充分大”指、且n40。当总体率0.5时,则样本率p的分布为对称分布当样本含量n为定值时,总体率越接近0.5,样本率p近似正态分布的程度就越好,中心极限定理及其推论,38,STATA命令,模拟各种分布模拟正态分布的样本均数分布Simumean样本量均数标准差模拟类似卡方分布的均数分布Simuchis样本量均数模拟指数分布的均数分布Simuexp样本量均数,39,t分布,标准正态分布与t统计量实际研究中未知,用样本的标准差S作为的一个近似值(估计值)代替,得到变换后的统计量并记为,40,如在正态总体N(168.18,62)中随机抽样,样本量分别取n=5,n=100,均抽10000个样本,分别计算t值和U值并作相应t的频数图,t分布,41,t分布,样本含量n=5,样本含量n=100,t统计量的频率密度图,42,结果小样本时,t统计量和U统计量的分布有明显差别大样本时,t统计量和U统计量的分布非常接近。频率密度图当样本量较大时,统计量t的频率密度图与标准正态分布曲线非常接近样本含量较小时,t统计量的峰值比标准正态分布的峰值略小,双侧尾部的值则较标准正态分布略大,t分布,43,英国统计学家W.S.Gosset(1908)设并给出了统计量t的分布规律,并称统计量t的分布规律为t分布,自由度为v,记为t(v)分布。每个自由度v对应一个分布,因此t分布是一簇分布t分布仅与总体均数有关,与总体标准差无关,t分布,44,STATA命令,模拟各种分布模拟双峰分布的均数分布Simubpeak样本量均数模拟三角形分布的均数分布Simutrang样本量均数,45,三条t分布密度曲线,t分布,46,t分布的图形特征,分布特征t分布曲线是单峰的关于t=0对称自由度越大,t值越小t分布与正态分布的关系自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年安徽省宿州市医疗三严三基理论考试题库及答案
- 2025年药品注册审评员考核试题及答案
- 摊破浣溪沙李清照课件
- 摄影姿态基础知识培训课件
- 数据技术考试题及答案
- 2025设备租赁合同纠纷案
- 2025年春季部编版初中数学教学设计八年级下册第1课时 变量
- 2025关于中国农业银行购车贷款合同书范本
- 2025市区形象设计店合伙经营合同示例
- 搪瓷行业知识培训总结课件
- 对外汉语课件教学课件
- 三年内无重大违法记录声明
- 2024-秋季新版人教版三年级上册英语单词
- DB32T-高粱属品种鉴定 InDel分子标记法
- 江西省教师进城选调考试教育理论综合知识考点知识点归纳背诵总结
- 智能审计实训平台需求说明
- DL∕T 5782-2018 20kV及以下配电网工程后评价导则
- CJT 526-2018 软土固化剂 标准
- 《交通事故车辆及财物损失价格鉴证评估技术规范》
- 我和我的祖国混声四部合唱简谱
- 生物药制造工艺经济与成本分析
评论
0/150
提交评论