




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学,抽样误差和抽样分布SamplingErrorandSamplingDistribution,主要内容,抽样误差抽样误差的重要性抽样误差的定义抽样误差的规律性标准误标准误的定义标准误的计算标准误的意义标准误的作用,t分布t分布的演化t分布的图形t分布的性质F分布2分布,1.1抽样误差的重要性,既然有误差,为什么还要抽样?无限总体的客观存在试验研究的成本效益问题(costeffect),抽样误差的重要性,总体同质个体、个体变异,总体参数未知,样本代表性、抽样误差,随机抽样,样本统计量已知,统计推断,风险,1.2抽样误差的定义,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了五次。,抽样误差的定义,五次抽样得到了不同的结果,原因何在?,抽样误差的定义,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(samplingerror)。各种参数都有抽样误差,这里我们以均数为研究对象,抽样误差的表现,抽样误差,定义。只要有个体变异和随机抽样研究,抽样误差就是不可避免的。抽样误差有自己的客观规律,统计学就是拨开抽样误差之雾来洞察客观规律的利器。,1.3抽样误差的规律性,既然抽样误差是有规律的,那么到底它的分布规律到底是怎样的?LetsEnjoyOurExperiments!,中心极限定理(centrallimittheorem)的表现,从正态总体中随机抽样,其样本均数服从正态分布;从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布;样本均数之均数的位置始终在总体均数的附近;随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,2.1标准误的定义,样本统计量(如均数)也服从一定的分布;与描述观测值离散趋势的指标类似,我们使用样本统计量的标准差来反映抽样误差的大小。又称标准误(standarderror)。,标准误(standarderror),样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。样本均数的标准误表示样本均数的变异度。,2.2标准误的计算,计算公式为其中,为总体标准差,n为抽样的样本例数在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计,标准误的计算,【例】根据7岁男童的身高资料,在已知总体标准差时,标准误为4.38/10=0.438cm而若以第一次抽样的样本标准差来代替总体标准差,则标准误为4.45/10=0.445cm,2.3标准误的意义,标准误的意义反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,2.4标准误的作用,标准误的用途衡量样本统计量代表总体参数的可靠性;估计总体参数的可信区间;进行假设检验。,2.5标准差和标准误的联系与区别,2019/12/13,19,可编辑,3.1样本均数的抽样分布规律,中心极限定理从均数为,标准差为的正态总体中随机抽样,样本均数服从均数为,标准差为的正态分布。从均数为,标准差为的任意总体中随机抽样,当样本含量足够大时,样本均数近似服从均数为,标准差为的正态分布。,3.2t分布的演化,根据中心极限定理的内容,当样本含量足够大时,对从均数为,标准差为的任意总体中随机抽样所得的样本均数进行标准化变换,有,t分布的演化,由于总体标准差往往是未知的,此时往往用样本标准差代替总体标准差,这里,为自由度(degreeoffreedom,df),取值为n-1由W.S.Gosset提出,自由度分别为1、5、时的t分布,3.3t分布的图形,由Gosset提出,3.4t分布的性质,t分布为一簇单峰分布曲线。t分布以0为中心,左右对称。分布的高峰位置比u分布低,尾部高。即相同的尾部面积对应的界值,比u分布大。例如:P=0.05,u=1.64,而自由度为10的t分布界值,t=1.812。t分布与自由度有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。每一自由度下的t分布曲线都有其自身分布规律。t界值表。,t界值表,单侧:P(t=t,)=双侧:P(t=t,)=即:P(-t,tt,)=1-例查t界值表得t值表达式t0.05,10=2.228(双侧)t0.05,10=1.812(单侧),42分布,设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为和s,设:则2值服从自由度为n-1的2分布(2-distribution),是小写希腊字母,读作chi。可见,2分布是方差的抽样分布。,2分布的特征,2分布为一簇单峰正偏态分布曲线,自由度为的2分布,其均数为,方差为2。1时2分布实际上是标准正态分布变量之平方。自由度为的2分布实际上是个标准正态分布变量之平方和。可表示为:2=u12+u22+uv2每一自由度下的2分布曲线都有其自身分布规律,2分布的作用,方差的抽样分布研究样本分布与理论分布的拟合优度检验率或构成比的比较,5F分布,设从两个方差相等的正态分布N(1,2)和N(2,2)总体中随机抽取含量分别为n1和n2的样本,样本均数和标准差分别为、s1和、s2。设:则F值服从自由度为(n1-1,n2-1)的F分布(F-distribution)。,F分布的特征,F分布为一簇单峰正偏态分布曲线,与两个自由度有关。若F服从自由度为(1,2)的F分布,则其倒数1/F服从自由度为(2,1)的F分布。自由度为(1,2)的F分布,其均数为2/(2-2),与第一自由度无关。第一自由度11时,F分布实际上是t分布之平方;第二自由度2时,F分布实际上等于2分布。每一对自由度下的F分布曲线下的面积分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《小学教师招聘》模拟题库及答案详解【名校卷】
- 2025年教师招聘之《幼儿教师招聘》考前冲刺模拟题库含答案详解【综合卷】
- 教师招聘之《小学教师招聘》综合提升练习试题及答案详解(必刷)
- 2025年九江市八里湖新区各中小学(幼儿园)面向全市公开招聘顶岗教师笔试备考试题及答案解析
- 经济考试题库及答案详解
- 节能知识培训活动情况课件
- 人民法院法官及司法辅助人员招聘合同
- 教师招聘之《幼儿教师招聘》检测卷讲解附答案详解(能力提升)
- 2025廉政教育中心警示教育心得体会(模板)
- 校园防欺凌教师培训制度及流程
- (高清版)DB11∕T 593-2025 高速公路清扫保洁质量与作业要求
- 河北省医疗卫生机构医疗废物管理规范2023版
- 2025年海南省高考物理试卷(含答案解析)
- 4输变电工程施工质量验收统一表式(电缆工程电气专业)-2024年版
- 2025至2030中国内蒙古粮食仓储行业项目调研及市场前景预测评估报告
- 资金岗位笔试题目及答案
- 虹口区2024-2025学年六年级上学期期中考试数学试卷及答案(上海新教材)
- 测量安全培训实施要点
- 诊所负责人聘用合同9篇
- 四轮定位外协协议合同
- 主持人个人礼仪规范
评论
0/150
提交评论