教育统计学推断统计5-6章_第1页
教育统计学推断统计5-6章_第2页
教育统计学推断统计5-6章_第3页
教育统计学推断统计5-6章_第4页
教育统计学推断统计5-6章_第5页
已阅读5页,还剩142页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.5.1概率的一般概念,5.2正态分布,5章概率和概率分布,5.1概率的一般概念,1概率的定义1预概率的定义2后概率的定义2概率的特性:0P(A) 1 P(V)=0 P(U)=1 3个独立事件和互不相容事件。4概率加和乘1概率加2概率的乘,正态分布是教育研究中普遍存在正态分布的许多现象的连续随机变量的概率分布。1,正态分布,5.2正态分布5.2.1概念:在正态分布中,n是常数,在每个正态分布中,n可以导致正态分布的形态差异更大的正态曲线,即使平均值相同。标准分数(也称为z分数)作为平均基准点,以标准偏差单位的相对数量z表示。其特点是用绝对数量表示的正态分布的所有曲线函数替换为平均0,标准差1的

2、正态分布曲线函数。标准分数计算公式Z=,标准正态分布曲线分布的函数为:2,标准正态分布Z分数,标准正态分布曲线,=0,=1,为什么标准正态分布的平均值为0,标准偏差为1!3 .标准正态分布的特征:(1)已知的z值为面积的范例1,示例4,(2)已知面积的z值示例1,测试分数平均分数为72,标准差为6。在平均分数的上下左右包括95%的学生吗?平均分数包括99%的学生吗?5.2.2正态分布的应用实例1幼儿园1分比赛中,全体花园的平均分数为70分,标准分数为12.5分,甲幼儿为78分,乙幼儿为83分,乙幼儿为65分,这三个孩子的分数在院内分别处于什么位置,1。问标准点是否适用等问题。解决方案:=70

3、S=12.5甲幼儿:Z=Z=0.64乙幼儿:Z=Z=1.04丙幼儿:Z=Z=0.4,a:甲幼儿成就,b婴儿成绩花园平均分数以上1.04标准偏差;丙幼儿的成绩是花园整体平均成绩以下0.4标准偏差。表24: a,b,2儿童语言,常识,计算分数考试成绩单,实例2,a,b,2儿童语言,常识,计算活动中的考试分数如下表所示。分析一下谁的总成绩更好?使用标准分数(z)时要注意的事项:标准分数虽然反映了原始分数在组内的相对位置,但没有直接反映对象对知识的掌握程度。因此,在评价和分析目标学习情况时,必须结合原始分数和标准分数进行分析和研究。2 .标准正态分布的应用,等级考试A,B,C,D化学论文满分值150分

4、,特定地区全体学生平均分数85分,标准偏差15。如果a等占5%,b等占35%,c等占50%,D等占10%,那么相应的分数线分别是多少?一所学校有多少人考试得了a等?结论:Z1=1.65 x1=110 z2=0.25 x2=89 z3=-1.28 x3=65.8,第6章抽样分布和全部平均估计6.1抽样分布6.2全部平均估计6.3假设测试的基本原理6.4全部平均上海市中学1年级后半段的数学水平调查研究假设上海市中学1年级学生为150000人(n人),上海所有初中1年级学生进行了统一标准化的数学成绩测试,该测试的平均分数为80分,考试的标准偏差为9分示例1,6.1采样分布6.1.1研究案例,例2,一

5、位调查研究人员a为了节省调查研究费用,目前正在随机抽取上海中学一年级学生中的500名(n名),进行一致的标准化数学成就测试,并试图通过这500名测试结果推断上海中学一年级学生的数学水平,该测试的平均分数为82分,测试的标准偏差为8分(x)。,1,分析了整体和样本区分参数和统计不同的表达方法,如果用图表表示上海一年级150000名学生的成绩,则构成整体分布图:概率密度或百分比,分数,如果用图表表示从这里提取的500名学生的成绩,就构成样品分布图。概率密度或百分比,分数,2,抽样分析假设,研究人员首次挑选500人完成调查研究后,从上海中学一年级学生(150000人)中取回500人(N2人),平均标

6、准差为:x2(在学生提取过程中,前面选出的学生以后也可以提取,但不重复测试)。如果继续重复上述过程,则可以获得更多的样本平均值和标准偏差,如下表所示。k (k接近无穷大)将采样平均值用作频率分布时,由采样平均值组成的采样分布(平均采样分布)图表、概率密度或百分比、采样的平均分数、这些采样平均值组成的标准偏差称为平均标准误用。标准错误:特定统计信息的标准偏差称为该统计信息的标准错误。样本分布是统计量的概率分布,3,在正态总体中,平均样本分布为正态,1,2,4,在偏置总体中,样本容量较大时,平均样本分布也为正态,6.1.2平均样本分布的几个定理,偏差统计信息以标准偏差单位度量一个案例值和平均值之间

7、的差值。z分数是6.1.3样本平均值和总体平均偏差统计的形式,在已知总体标准差的情况下计算平均值的偏差统计值:在不知道总体标准差的情况下计算平均值的偏差统计值:基于总体标准差(x)的总体标准差估计值()的第一个估计值显示为s。因此,平均值的基准值为:偏差统计如下。例:一所学校2年级学生的英语平均成绩为78人,其中随机挑选了50人,平均成绩为82高,标准差为12()。估算一下该校2年级学生英语成绩的标准偏差,计算一下50名平均成绩的偏差统计。戈塞特(英国数学家1876-1937),戈塞特曾在牛津温彻斯特和新大学学习数学和化学,然后来到多弗林的酿酒化学工程师,从事统计和实验工作,19061907年

8、在伦敦大学生物学实验室进行研究,并有机会与菲尔森一起学习,1905年,t分布及其特性,自由度:df表达,表6.1中央区域为0.95时具有不同自由度的t的极限值。1,点估计的定义:以恒定的统计值估计了相应整体参数的值。2,点估计评估基准偏差估计有效性:Md Mo一致性: n如果样本容量无限增加,则估计6.2整体平均值的6.2.1点,1,区间估计的定义:以概率分布为理论基础,根据一定概率要求,通过样本统计值估计整个参数值范围。2,计算间隔估计(称为总体标准偏差),示例1:平均为130,标准偏差为10的常规全局。(1)平均中心,学生95%的成绩分布范围;(2)128-132人的业绩比例;(3)前5%

9、的学生成绩分布范围。6.2.2间隔估计,平均为130,标准差为10的正规全局。(1)从整体上选出25人,计算平均分数在128 132之间的概率是多少。(2)从整体上选出25人,计算其平均成绩。这个平均成绩是以整体平均为中心,95%概率下的分布范围。如果不知道整体平均值,从全体人员中选出25人,计算平均成绩129,根据一定的概率要求估计整个参数的变化范围。这一部分是示例2:例3小学10岁儿童身高的标准差估计为6.25厘米,目前该校随机抽取了27名平均身高为134.2厘米的10岁儿童。估计该校10岁儿童身高的95%和99%的置信区间,从总体标准差中未知,总体正态分布,n不管大小如何(或整体非正态分

10、布,n30),样本平均值和总体平均值的偏差统计值为t分布;t值,3,总标准差()未知条件下的区间估计原理,例1在某小学三年级学生中随机选出了12名学生,阅读能力的平均分数为29.917,s=4.100。对该校3年级学生整体平均成绩的95%和99%的信赖区间进行了测试评价。范例2 .在年度高考中随机抽取了102张作文纸,平均成绩为26,标准差为1.5。估计总平均分数的95%和99%的置信区间。1,假设检验的定义2,假设检验的原则,6.3假设检验的基本原则和过程6.3.1假设检验的原则。基本想法,小概率原则:如果整个某个假设是真的,那么不能支持或不支持这个假设的事件a(小概率事件)在一次尝试中几乎

11、是不可能的;如果在一次实验中发生a,就有理由怀疑该假设的真实性,拒绝该假设。一般(假设)、抽样、抽样(观察结果)、检验、(接受)、(拒绝)、未发生小概率事件、小概率事件发生、假设的形式:H0原始假设,H1替代假设,双方检查:H0:=0,h1: 0,单侧检查:H0: 0,h1: 0,h1: 0如果拒绝H0,则接受H1。1,两类错误的定义错误:假设为真且被拒绝,其大小等于假设测试的重要性级别。错误:假定为假,接受。6.3.2统计决策中的两类错误及其控制。2,两类错误的相互关系,在我们做决定的时候客观存在两类错误;一种错误在减少,另一种类型的错误在增加。3、控制两类错误的方法,合理布置拒绝区的位置;

12、扩展采样容量。4、取样容量是多少?由于样品容量的扩大,发生了什么变化?1。根据特定问题的要求,整个假设H0,H1,2。选择“统计信息”以确定H0为true时的抽样分布,3 .提供重要级别,如果原始H0为true,则查找阈值。4 .测试统计计算的数值与阈值比较,6.3.3是测试的基本过程,6.4.1整体标准差()已知条件整体平均值的显著性测试,示例1整体面积综合测试物理平均值除以50分,标准差除以10分。一所学校的41名平均成绩为52.5名,有人问这个班级成绩和整个地区成绩的差距是否显着。6.4整体平均值的显著性测试,1 .假设:h0:=50,h1: 50,2。选择检验统计信息并计算其值。3 .

13、确定显著性水平,查找表以查找阈值。=0.05,Z0.05=1.96,4。统计决定:z=1.601.96 0.05,没有发生小概率事件,如果接受h0:=50,那么班级成绩和地区成绩没有显著差异。例2,张老师是一所中学负责高中1年级(4)班化学讲座的青年化学老师,学期末全校化学统一考试,高5班的化学平均分数为68分,标准偏差为8.6分,其中4班与46名同学化学平均分为63分。根据考试结果,学校领导人相信张老师的教学效果低于全校平均水平。问:张老师带来的1年级(4)班化学平均低于全年级平均水平吗?1 .假设:h0: 68,h1: 68,2。选择检验统计信息,计算其值。3 .确定显著性水平,查找表以查

14、找阈值。=0.05,z 0.05=-1.65;=0.01,z 0.01=-2.33;4 .统计决策:z=3.942.33 0.01,发生小概率事件,拒绝h0: 68,接受h1: 68,那班的化学成绩低于全体年级平均值。练习题:从受过良好教育的早期儿童中随机挑选70人进行韦伯斯特智力考试(整体平均为100,标准差为15),得出103.3。受过良好早期教育的孩子的智力是否高于一般水平?例1:一个地区的初三英语统一考试平均分为65分,该地区一所学校的20个试卷分数为72,76,68,78,62,59,64,85,70,75,61,74,问这个学校三年级英语平均分数是否和地区一样?6.4.2整体标准差

15、()根据未知条件对整体平均值的显著性检查,=69.8,s=9.474,1 .假设:h0:=65,h1: 65,2。选择检验统计信息并计算其值,3 .确定显著性水平,查找表以查找阈值。=0.05,t(19)0.05=2.093;=0.01,t(19)0.01=2.861;4 .统计决定:t(19)0.05=2.093t=2.266t(19)0.01=2.861至=0.05拒绝h0:=65,h1: 65接受此学校的前三个英语平均分数与地区不同。例2:王老师在一所大学里负责5个班的英语课,为了研究英语演讲比赛中对学生英语学习成绩的影响,选出了(1)班的学生。每次她都给(1)班上课10分钟,让学生们举

16、行演讲比赛。一学期后全校期末英语考试平均分为78分(1)班15名同学考试分数:问题:在学生口才比赛中能否提高英语学习成绩?平均值:82.3,标准差(s): 7.32,1 .假设:h0: 78,h1: 78,2。选择检验统计信息,计算其值。3 .确定显著性水平,查找表以查找阈值。=0.05,t(14)0.05=1.761;=0.01,t(14)0.01=2.624;4 .统计决策:t(14)0.05=1.761t=2.275t(14)0.01=2.624在0.05拒绝h0: 78,获得h1: 78的学生速度游戏可以提高英语学习分数。整体标准差()未知。n在大的情况下,某城市的数学平均分为60,从现在参加这个考试的文科学生中随机抽取94个试卷的平均58分,标准偏差分为9.2,文科学生问城市考生的数学分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论