




已阅读5页,还剩84页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章抽样分布及总体平均数的推断,抽样分布;总体平均数的参数估计假设检验总体平均数显著性检验,6.1抽样分布6.1.1抽样分布的含义总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。,135134129133131131131134125128135127127133130132132129124132122124127131137132133134124128135133131123115132134138124132128136127120125131136127124129129132138125131120121144128133128127130120121122127121125130140121126130122128127125127131,师大附小二年级80个学生的身高,师大附小二年级80个学生的身高,总体分布:总体内个体数值的频率分布,135134129133131131131134124132122124127131137132134138124132128136127120131120121144128133128127126130122128127125127131135127127133130132132129,师大附小二年级中48个学生的身高,容量=48平均数=129.5625标准差=4.8942,师大附小二年级中48个学生的身高,样本分布:样本内个体数值的频数分布,所抽取的各样本的平均数如下:129.825126.55128.575129.5128.52130.72129.55129.45129.68129.385129.95130.27128.57128.9125.65,容量=50平均数=129.00标准差=1.34,容量=50平均数=129.00标准差=1.34,根据抽样平均数频率分布表制作的多边图,上海市初中一年级末数学水平的调查研究,在该研究中假定上海市共有初中一年级学生为150000人(N人),如果对上海所有初中一年级学生进行统一的标准化的数学成就测验,其测验的平均成绩为80分(),测验的标准差为9分()。,例1,例2,某一调查研究者甲为了节省调查研究的成本,现从上海市初中一年级学生中随机抽取500人(n人)进行统一的标准化的数学成就测验,试图通过这500人的测验结果来推断全上海初中一年级学生的数学水平,其测验的平均成绩为82分(),测验的标准差为8分(x)。,1分析上述实例区分总体和样本区分参数与统计量及不同的表达方式,如果我们用上海初一年级150000个学生的成绩做图,则构成一个总体分布图:,概率密度或百分比,成绩,如果我们只用其中抽取的500个个学生的成绩做图,则构成一个样本分布图:,概率密度或百分比,成绩,2、抽样分析假定该研究者第一次抽取500人做完调查研究后,又重新从上海初中一年级学生中(150000人)抽取500人(n2)进行调查研究,其平均数为:标准差为:x2(抽取学生的过程中,前面抽到的学生在后面抽取中也可能抽到,但不重复测验)。如果上述过程不断重复操作,则可以得到更多的样本平均数和标准差,如下表:,如果我们用k(k趋近于无穷大)个样本平均数做频数分布图,则构成一个由样本平均数组成的抽样分布(平均数抽样分布)图:,概率密度或百分比,抽样的平均成绩,由这些抽样平均数组成分布的标准差称为平均数的标准误用来表示。,标准误(STANDARDERRORS):某种统计量的标准差称为该统计量的标准误。,抽样分布是某一种统计量的概率分布。,6.1.2平均数抽样分布的几个定理,3、正态总体中,平均数的抽样分布呈正态,1、,2、,4、偏态总体中,当抽样容量较大时,平均数的抽样分布也呈正态,6.1.3样本平均数与总体平均数的离差统计量,离差统计量是以标准差为单位来来度量某一个个案值与平均数间的差异。Z分数就是一种离差统计量,当总体标准差已知时,平均数的离差统计量的计算:,当总体标准差未知时,平均数的离差统计量的计算:首先根据样本标准差(x)来估计总体标准差()其估计值用S来表示。,因此,平均数的标准误为:,离差统计量的表达形式为:,练习1:某校二年级学生的英语平均成绩为78,从中随机抽取50人,其平均成绩为82,标准差为12。试估计该校二年级学生英语成绩的标准差,并计算50人平均成绩的离差统计量。,关于T分布:关于Z分布与T分布的区别:当总体方差已知时,Z只随样本平均数而变化;当总体方差未知时,T不仅随样本平均数而变化,而且还随S而变化。,T分布的特点:T分布的形态随自由度的变化呈一簇分布形态(即自由度不同的T分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限大,T分布接近正态分布;自由度df:指总体参数估计量中变量值自由变化的个数。,6.2总体平均数的参数估计根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。,6.2.1点估计,(1)点估计的定义用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。,6.2总体平均数的参数估计,(2)点估计的评价标准:无偏性:用统计量估计总体参数一定会有误差,不可能恰恰相同。因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的的平均值为0。有效性:当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。,6.2总体平均数的参数估计,(2)点估计的评价标准:一致性:当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,估计值越来越精确,逐渐趋近于真值。充分性:一个容量为的样本统计量,是否充分地反映了全部个数据所反映总体的信息。,6.2.2区间估计,(1)区间估计的定义区间估计是指以样本统计量的样本分布为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围。,6.2.2区间估计,(2)置信区间与显著性水平置信区间是指在某一置信度时,总体参数所在的区域距离或区域长度。显著性水平是指估计总体参数落在某一区间时,可能犯错误的概率,用表示。1为置信度或置信水平。,6.2.2区间估计,(2)区间估计的原理区间估计的原理是样本分布理论。在计算区间估计值、解释估计的正确概率时,依据是该样本统计量的分布规律及样本分布的标准误(SE)。下面以平均数的区间估计为例,说明如何根据平均数的样本分布及平均数分布的标准误(SE),计算置信区间和解释成功估计的概率。,6.2.2区间估计,(2)区间估计的原理当总体方差2为已知时,样本平均数的分布为正态分布或渐近正态分布,此时样本平均数分布的平均数,标准误。根据正态分布,可以说:有95%的落在之间,之间,或者说:之间包含所有的的95%,即,6.2.2区间估计,(2)区间估计的原理但是,在实际研究中,只能得到一个样本平均数,我们可以将这个样本平均数看做是无限多个样本平均数之中的一个。于是将上式经过移项写成这意味着有95%的落在之间,或者说,估计落在之间的正确的概率为95%。,6.2.2区间估计,练习2某一个正态总体,其平均数为130,标准差为10。以平均数为中心,95%学生的成绩的分布范围;其成绩在128到132间的人数的比例;排名在班级前5%的学生成绩的分布范围。,从总体中抽取25人,计算其平均成绩,该平均成绩在128到132间的概率有多大;从总体中抽取25人,计算其平均成绩,该平均成绩以总体平均数为中心,95%概率下的分布范围从总体中抽取25人,计算其平均成绩,该平均成绩由高到低95%概率下的分布范围;,从总体中抽取25人,计算其平均成绩,最高5%的平均成绩的范围。从总体中抽取25人,计算其平均成绩,该平均成绩大于135的概率是多少。,练习3某小学10岁儿童身高的标准差为6.25厘米,现从该校随机抽出27名10岁儿童,其平均身高为134.2厘米,试估计该校10岁儿童身高的95%和99%置信区间。,6.2.3总体平均数的估计,(1)估计总体平均数的步骤1根据实得样本的数据,计算样本平均数与标准差。2计算标准误。(已知)或(未知)3确定置信区间或显著性水平。,6.2.3总体平均数的估计,4根据样本平均数的抽样分布,确定查何种统计表。5计算置信区间。(正态分布)或(分布)6解释总体平均数的置信区间。,6.2.3总体平均数的估计,(2)总体方差2已知时1当总体分布为正态时当总体分布为正态,总体方差()已知时,样本平均数的分布为正态分布,这时可用下式计算其置信区间:(其中),6.2.3总体平均数的估计,(2)总体方差2已知时2当总体分布为非正态时总体分布非正态,总体方差()已知,这时只有当样本容量时,其样本平均数的分布为渐近正态分布,这时可用下式计算其置信区间:(其中),6.2.3总体平均数的估计,(2)总体方差2未知时1当总体分布为正态时当总体分布为正态,总体方差()未知时,样本平均数的分布为分布,这时可用下式计算其置信区间:(其中),6.2.3总体平均数的估计,(2)总体方差2未知时2当总体分布为非正态时总体分布非正态,总体方差()未知,这时只有当样本容量时,其样本平均数的分布为渐近分布,这时可用下式计算其置信区间:(其中),练习5从某次考试中随机抽取102名学生的成绩,其平均成绩为26,标准差为1.5。试估计总体平均成绩95%和99%的置信区间。,练习4从某小学三年级学生中随机抽取12名学生,其平均成绩为29.917,标准差为3.926。试估计该校三年级学生总体平均成绩95%和99%的置信区间。,6.3假设检验6.3.1假设检验的原理,假设是根据已知理论与事实对研究对象所做的假定性说明,统计学中的假设一般专指用统计学术语对总体参数所做的假定性说明。在进行任何一项研究时,都需要根据已有的理论和经验对研究结果作出一种预想的希望证实的假设,这种假设叫科学假设,用统计术语表示时叫研究假设(备择假设),记作H1。,6.3假设检验6.3.1假设检验的原理,在统计学中不能对H1的真实性直接检验,需要建立与之对立的假设,称做虚无假设(零假设,无差假设,原假设),记作H0。假设检验的问题,就是要判断虚无假设H0是否正确,决定接受还是拒绝虚无假设H0,若拒绝虚无假设H0,则接受备择假设H1。,6.3假设检验6.3.1假设检验的原理,假设检验是从零假设出发,视其被拒绝的机会,如果根据样本信息,不得不否定零假设的真实性时,就不得不承认备择假设的真实性,这时,就要拒绝零假设而接受备择假设;如果根据样本的信息不能否定零假设的真实性时,就要保留零假设而拒绝备择假设。,6.3假设检验6.3.1假设检验的原理,假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真。在虚无假设为真的前提下,如果导致违反逻辑或违反人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不难接受虚无假设。若没有导致不合理的现象出现,那就认为“虚无假设为真”的假定是正确的,也就是接受了虚无假设。,6.3假设检验6.3.1假设检验的原理,这种“反证法”思想不同于数学中的反证法,后者是在假设某一条件下导致逻辑上的矛盾从而否定原来的假设。假设检验中“不合理现象”是指小概率事件在一次试验中发生了,它是基于人们在实践中广泛采用的小概率事件原理。(小概率事件原理是指“小概率事件在一次试验中几乎不可能发生”。通常情况下,将概率不超过0.05或0.01的事件当做“小概率事件”。),6.3假设检验,6.3假设检验6.3.2单侧检验与双侧检验,只强调差异而不强调方向性的检验叫双侧检验;强调某一方向的检验叫单侧检验。,6.3假设检验6.3.2单侧检验与双侧检验,某市全体7岁男童体重平均数为21.61千克,标准差为2.21千克,某小学70个7岁男童体重的平均数为22.9,问该校7岁男童体重与该市是否一样。某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平?,6.3假设检验6.3.2单侧检验与双侧检验,双侧检验,单侧检验,6.3假设检验6.3.3假设检验的步骤,1根据问题要求,提出虚无假设和备择假设。2选择适当的检验统计量并计算其值。3规定显著性水平。4选择检验的方式(单侧还是双侧)。5做出统计决策。,假设检验这种反证法与一般的数学反证法有什么不同?,思考题,(1)数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假设的决策无论是决策逻辑还是从决策内容看都是百分之百正确的。而假设检验的反证法最终推翻零假设的依据是一个小概率事件,从决策逻辑角度看是百分之百正确的,但其决策的内容却是有可能出错的。(2)数学中使用反证法,其最终结果一定是推翻原假设,而假设检验这种反证法的最终结果却有可能无充分理由推翻零假设。,答:,6.3假设检验6.3.4假设检验中的两类错误,统计学中将这类拒绝H0时所犯的错误称做错误,即假设是真而被拒绝所犯的错误,其大小与假设检验的显著性水平相等。接受H0时所犯的错误为错误,即假设是伪而被接受。,例A韦氏智力测验的总体平均数为100,标准差为15。现从某实验学校抽取64人,其平均智商为103,问该校的智力水平与总体水平是否有显著差异(=.05)。,=100,例A假设检验的示意图,例B从现从某实验学校抽取64人,其平均智商为103。问该校学生的智力水平是否是来自于平均智商为105,标准差为15的总体(=.05)。,=105,例B假设检验的示意图,例A假设检验中所犯错误,=.24,例B假设检验中所犯错误,=.24,6.3假设检验6.3.4假设检验中的两类错误,两类错误的关系:(1)不一定等于1;(2)与不可能同时减小或增大;(3)1-反映着正确辨认真实差异的能力。,6.3假设检验6.3.4假设检验中的两类错误,6.3假设检验6.3.4假设检验中的两类错误控制错误:可以由研究者通过选择适当的显著性水平加以主动控制。控制错误的概率有以下两种方法:利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置;增大样本的容量。,样本容量的扩大引起的变化是什么?,检验功效(POWER),1、什么是检验功效,Power=1-,功效:正确拒绝虚无假设的概率,2、影响功效的因素,Power=1-,检验的形式,样本的容量,鉴别力(EFFECTSIZE,d值),3、依据功效的要求,确定样本的大小,例A中,如果要求功效为.80,其样本应为多少?,N=71.91,6.4总体平均数显著性检验6.4.1平均数显著性检验的概念,平均数的显著性检验是指根据样本平均数与假设总体平均数的差异检验样本所在总体的平均数与假设总体的平均数的差异。,6.4总体平均数显著性检验6.4.1平均数显著性检验的概念,例3全区统一考试物理平均分为50分,标准差为10分。某校一个班41人的平均成绩为52.5,问该班成绩与全区成绩差异是否显著?,6.4总体平均数显著性检验6.4.1平均数显著性检验的方法,1总体正态分布、总体方差已知的条件下平均数的显著性检验2总体正态分布、总体方差未知条件下平均数的显著性检验,练习6有人从受过良好教育早期儿童中随机抽取70人是行韦氏智力测验(该测验的总体平均数为100,标准差为15),其结果为103.3。能否认为受过良好早期教育的儿童智力高于一般水平?,练习7某一种食品的标准重量为1000克,但在包装过程中有误差,其标准差为50克。工商部门为检验其重量是否合格,从该产品中抽出50袋样品,平均重量为9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年乡村医生考试:农村居民健康档案管理政策宣传试题集
- 2025年工程测量员(地质工程测量技师)考试试卷
- 2025年电气石项目提案报告
- 2025年门诊医疗服务项目规划申请报告
- 2025年明胶空心胶囊项目立项申请报告
- 2025年走芯车床项目立项申请报告
- 2025年电梯安装改造维修作业特种作业操作证考试试卷(电梯机械知识应用案例分析)
- 详细资金流动记录出资证明书(8篇)
- 教育行业教育行业教育行业教育游戏市场2025年发展趋势与商业模式研究报告
- 2025年农业面源污染治理农村环境治理技术应用案例报告
- 2025年浙江宁波宁海县第一医院招考聘用紧缺专业编外医师笔试历年典型考题解题思路附带答案详解
- 湖南2025年湖南江华瑶族自治县招聘184名事业单位工作人员笔试历年参考题库附带答案详解
- 盘古java面试题及答案
- 3D打印食品安全标准-洞察及研究
- 2024中储粮考试题库与答案
- 江西省赣州市章贡区2022-2023学年五年级下学期数学素质评价试卷(含答案)
- 低空经济八大应用场景与实践案例解析方案
- 广东省深圳市福田区2023-2024学年一年级下学期语文期末试卷(含答案)
- 2025年物业管理员(中级)职业技能鉴定试卷(含物业设施设备维护案例)
- 下肢功能锻炼的护理方法
- 核电站清洁维护派遣及环境监测服务合同
评论
0/150
提交评论