




已阅读5页,还剩118页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,课程名称:教育实验设计与数据分析,概率分布与参数估计,概率分布,试验实例,E1:抛一枚硬币,分别用“H”和“T”表示出正面和反面;E2:将一枚硬币连抛三次,考虑正反面出现的情况;E3:将一枚硬币连抛三次,考虑正面出现的次数;E4:掷一颗骰子,考虑可能出现的点数;E5:记录某网站一分钟内受到的点击次数;E6:在一批灯泡中任取一只,测其寿命;E7:任选一人,记录他的身高和体重。,事件发生的标志,由于事件是随机试验的每一个可能结果,可表示为样本空间的某个子集。所以,事件A的发生,当且仅当试验的结果是子集A中的元素。由此,必然事件即为一个试验中所有基本事件的集合,包含了样本空间的所有样本点;不可能事件不包含样本空间的任一样本点,为一空集。,事件关系的实质,由上可知,事件之间的关系由他们所包含的样本点所决定;由此,事件之间的这种关系也可以用集合之间的关系来描述。,偏度的意义(三级动差),表示偏度的指标实际上是z分数的三次方的算术平均数。由公式可以看出,正态分布时,由于左右对称,z分数的三次方的总和应等于0;而正偏态时,由于平均数右边的z分数值较大,故z分数三次方总和的绝对值较左边为大,故z分数三次方的总和大于0;而负偏态则相反。,峰度的意义(四级动差),表示峰度的指标实际上与z分数的四次方的算术平均数有密切关系。当两曲线的标准差相同时,曲线越高狭,两极端分数的分布次数越多,峰度值就会越大;反之,曲线越低阔,两极端分数的分布次数越少,峰度值就会越小。故,峰度值为0时,分布为正态;峰度值大于0时,分布为高狭峰;峰度值小于0时,分布为低阔峰。,二项分布的极限分布是正态分布,公式表达:式中,y为次数,N为总人数,X为测量分数。,若左式中的N取为1,便是正态分布的密度函数,即:,连续和离散型随机变量概率分布的区别,连续型随机变量1)连续型随机变量记做X;2)随机变量特殊值记做x;3)连续型概率分布(概率密度函数)记做f(x);4)P(Xx)0;5)6),离散型随机变量1)X表示离散型随机变量;2)x表示随机变量特殊值;3)离散型概率分布(概率分布函数)记做f(x);4)P(Xx)f(x);5)6),大数原则与Z分布,大数原则从公式可以看到,样本平均数的标准误与母总体的标准差成正比,而与样本容量n成反比,样本容量越大,样本平均数的标准误越小。Z分布无论母总体的分布,还是样本平均数的分布,都可以通过求标准分数Z,将各自的正态分布形式转换成标准正态分布。此时,标准正态分布的随机变量为z分数,故标准正态分布也称Z分布。,样本平均数的Z分布和t分布总结,参数估计,统计推断(statisticalinference),统计推断,如:样本均数样本标准差S,如:总体均数总体标准差,内容:1、参数估计包括:点估计区间估计2、假设检验,被估计的总体参数,第一节点估计、区间估计,一、点估计(pointestimation)从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。例如:用样本均值作为总体未知均值的估计值。注意:点估计没有给出估计值接近总体未知参数程度的信息。,二、良好估计的标准,无偏性:估计量的数学期望等于被估计的总体参数。(用多个样本的统计量作为总体的估计值,其偏差的平均数为零。)是的无偏估计,是的无偏估计。,有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量。,一致性:随着样本容量的增大,估计量越来越接近被估计的总体参数,充分性:一个样本容量为n的样本统计量,是否充分反映了全部n个数据所反映总体的信息。例如,平均数比众数、中位数的充分性高;比Q、AD的充分性高。,三、区间估计(intervalestimation),根据一个样本的观察值给出总体参数所在的区间范围,并给出总体参数落在这一区间的概率。例如:总体均值落在5070之间,置信度为95%。注意:区间估计是在点估计的基础之上进行的,并不具体指出总体参数等于什么。,决定区间边界值的因素,样本点估计值(如样本平均数)联系总体参数和样本点估计的样本统计量(如Z统计量)该统计量的抽样分布(如果样本平均数服从正态分布,则Z统计量的抽样分布是标准正态分布),落在总体均值某一区间内的样本均值,置信水平,总体未知参数落在某一区间内的概率,表示为1-。此时,为显著性水平,是总体参数未在某一区间内的概率。常用的置信水平值有0.99,0.95,0.90。相应的为0.01,0.05,0.10。,区间与置信水平,均值的抽样分布,1-的区间包含了的区间未包含,区间估计的原理,区间估计是根据样本分布理论,用样本分布的标准误(SE)计算区间长度,解释总体参数落入某置信区间可能的概率。区间估计存在成功估计的概率的大小和估计范围的大小两个问题。(二者是一对矛盾)。在保证置信度的前提下,尽可能提高精确度。,影响区间宽度的因素,1.数据的离散程度,用来测度;2.样本容量,(标准误);3.置信水平(1-),影响Z的大小。,第二节总体平均数的区间估计,一、总体平均数估计的步骤1.根据实得样本的数据,计算样本平均数与标准差2.计算标准误:(1)当总体方差已知时(2)当总体方差未知时3.确定置信水平或显著性水平,4.根据样本平均数得抽样分布,确定查何种统计表一般总体方差已知查正态分布表;当总体方差未知,样本方差已知,查t表(如果n30,可以查正态表作近似值);确定,。5.计算置信区间(1)如果查正态分布表,置信区间可以写作(2)如果查t值表,置信区间写作,6.解释总体平均数的置信区间估计总体平均数落入该区间的正确可能性概率为1,犯错误的可能性的概率为,二、总体方差已知,对总体平均数的估计,1.假定条件总体服从正态分布,且总体方差()已知如果不是正态分布,可以由正态分布来近似(n30)2.使用正态分布统计量总体均值在1-置信水平下的置信区间为,算例:见教材p205206,解:已知总体正态分布,0.15,x2.14,n=9,1-=0.95,/2=1.96总体均值的置信区间为,我们可以95的概率保证该种反应时平均长度在21.30221.498毫秒之间,【例】某种反应时服从正态分布,一次作业中9名被试的平均反应时为21.4毫秒。已知总体标准差=0.15毫秒,试建立该种反应时的置信区间,给定置信水平为0.95。,三、总体方差未知,对总体平均数的估计,1.假定条件总体方差()未知总体必须服从正态分布2.使用t分布统计量,3.总体均值在1-置信水平下的置信区间为,算例:见教材p207208,解:已知总体正态分布,x=50,s=8,n=25,1-=0.95,t/2=2.0639。,我们可以95的概率保证总体均值在46.6953.30之间,【例】从一个正态总体中抽取一个随机样本,n=25,其均值x=50,标准差s=8。建立总体均值m的95%的置信区间。,总结(总体平均数的区间估计),第三节总体方差与标准差的区间估计,一、总体方差的区间估计1、概率表达2、置信区间公式推导(精确分布),3、各种情况下总体方差的区间估计1)n2时,使用分布进行精确区间估计2)n30时,使用标准正态分布进行近似区间估计,二、总体标准差的区间估计,1、置信区间公式推导(精确分布)已知:不等式开平方,即得:,2、各种情况下总体标准差的区间估计1)n2时,使用分布进行精确区间估计2)n30时,使用标准正态分布进行近似区间估计,三、两总体方差之比的区间估计,1、如何理解两方差之比的区间估计如果S12/S22接近于1,说明两个总体方差很接近;如果S12/S22远离1,说明两个总体方差之间存在差异。2、置信区间公式推导,第四节相关系数的区间估计,一、积差相关系数的抽样分布总体相关系数等于0时;总体相关系数不等于0时。二、积差相关系数的区间估计三、等级相关系数的区间估计,第五节比率及比率差异的区间估计,一、比率的区间估计1、比率的样本分布精确分布:二项分布np大于5,且nq大于5时:近似正态分布2、比率的区间估计(np大于5,且nq大于5)3、各种情况下比率的区间估计1)np大于5,且nq大于5时(同上式)2)np小于5时(查表计算),二、比率差异的区间估计1、两样本比率差异的抽样分布时,两样本比率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东广州市增城区教育局招聘广州增城外国语实验中学教师10人(编制)模拟试卷及答案详解1套
- 2025年2月山东领取济宁市份普通话水平测试等级证书模拟试卷及答案详解(易错题)
- 2025广西石化分公司春季高校毕业生招聘20人考前自测高频考点模拟试题附答案详解(考试直接用)
- 2025广东深圳市优才人力资源有限公司招聘编外聘用人员拟聘人员模拟试卷参考答案详解
- 2025福建泉州市泉港区部分公办学校专项招聘编制内新任教师17人(二)考前自测高频考点模拟试题及答案详解(网校专用)
- 2025广西南宁上林县三里镇人民政府招聘2人考前自测高频考点模拟试题有答案详解
- 2025内蒙古自治区直属厅局某协会招聘工作人员考前自测高频考点模拟试题及参考答案详解1套
- 2025湖北恩施州巴东县农业农村局公益性岗位招聘1人考前自测高频考点模拟试题及一套答案详解
- 2025年山东师范大学第二附属中学第二批公开招聘人员(11名)模拟试卷及1套完整答案详解
- 2025河南鹤壁市市直单位第一批公益性岗位招聘26人考前自测高频考点模拟试题完整参考答案详解
- 银行理财推广营销方案
- 医院培训课件:《中医护理技术质量与安全管理》
- 历史课程中的跨学科教学与学科整合
- 移情训练法移情训练法
- 《大卫 科波菲尔(节选)》《复活》《老人与海》《百年孤独》 统编版高中语文选择性必修上册
- 展厅施工方案表
- 空调维保投标方案(技术方案)
- 深圳南山风险投资基金
- 食品安全风险“日管控、周排查、月调度”记录表
- 监护仪使用及报警设置
- 通过模拟实验探究膜的透性 说课课件
评论
0/150
提交评论