版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学4概率分布和抽样1、战鼓一响,法律无声。——英国2、任何法律的根本;不,不成文法本身就是讲道理……法律,也----即明示道理。——爱·科克3、法律是最保险的头盔。——爱·科克4、一个国家如果纲纪不正,其国风一定颓败。——塞内加5、法律不能使人人平等,但是在法律面前人人是平等的。——波洛克统计学4概率分布和抽样统计学4概率分布和抽样1、战鼓一响,法律无声。——英国2、任何法律的根本;不,不成文法本身就是讲道理……法律,也----即明示道理。——爱·科克3、法律是最保险的头盔。——爱·科克4、一个国家如果纲纪不正,其国风一定颓败。——塞内加5、法律不能使人人平等,但是在法律面前人人是平等的。——波洛克第四章概率分布与抽样从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:选民人数:每个候选人的支持率是多少?产品:不合格率是多少?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。8/16/20212主要内容4.1抽样的一般问题4.2三种不同性质的分布4.3一个总体参数推断时样本统计量的抽样分布4.4两个总体参数推断时样本统计量的抽样分布4.5其他抽样方法█8/16/20213兴趣是语言学习的关键。苏霍姆林斯基说过:“所有的智力活动都要依赖于兴趣。”兴趣是最好的老师,要把小学生学习英语的兴趣培养起来,必需遵循小学生的心理特点。小学生具有好奇、好活动、坐不住、注意力不能长时间集中的特点,所以,记忆单词对他们来说相对困难,导致大部分的学生对单词比较陌生,有些只记得拼写而忘了其意义,有些颠倒其拼写,有些只会说单词而不会拼写。另一方面,小学生年纪小,天性爱玩、爱唱、爱游戏、爱活动,作喜欢的事情时则全神贯注、长时间重复也不会累等特点,又为英语教师进行英语教学提供了很好的契机和载体。经过长时间的观察,我在教学实践中总结了小学生阶段的儿童擅长和喜欢的活动有如下几种:1.对具体直观的物体印象深刻,2.爱模仿,3.喜欢一起作游戏,4.爱玩电脑游戏,看动画片。针对这些特点,教师在单词教学中应注意运用科学的教学方法,采用听、说、读、写、画、玩、演、唱等多种手段,激发学生的学习兴趣,使学生积极主动地参与到英语单词教学中来,让学生在愉快的气氛中接受新单词,练习新单词,达到教学的最佳效果。针对小学生各种特点的娱乐式单词教学方法:一、利用实物、图像、简易绘画直观地呈现新单词图像看得见,实物更是摸得着,因而这两者往往能有力地表明一个新概念,给学生具体直观的深刻印象。例如在教学“peach”一词时,可以直接向学生呈现桃子或其模型,然后向学生示范读音。学生就可以很直观地感受到老师所讲的单词就是桃子,耳朵听到的单词读音和老师所呈现的事物是想对应的,从而可以吸引学生跟着老师一起发“peach”的读音。这样就可以不必出现中文意思而使学生明白单词的意思,有利于学生在英语的环境中进行学习。简笔画是现代英语教师的一项基本能力,也是最常用的一项技能。将简笔画与小学英语单词教学巧妙自如地相结合,通过简单明了的线条来刺激学生的大脑,不仅能提高教学质量,还能培养孩子们学习英语的兴趣,启发想象思维,增强记忆,达到良好的效果。以根据教材内容,,把不熟悉的、抽象的单词用简笔画的形式画成学生熟悉的事物,克服了学英语死记硬背的弊端,激发了学生的学习兴趣。二、让学生通过模仿学习单词心理学研究表明,小学生具有较强的模仿能力。用形体动作表现出来或画出来的表情和动作能引起孩子的注意,让复杂的东西变得简单起来;英语教学更需要丰富的面部表情和肢体动作的配合。在课堂上,让学生演一演,可以充分调动学生的学习积极性。动作类单词的教学是最生动丰富的,因为它完全可以与学生的肢体语言相联系,让学生既动嘴又动身,好玩又容易记住掌握单词,如在学“swim”时,我做出一个游泳的姿势,孩子们也一边“游泳”一边读单词,很快就学会了,又如在学“fly”时,我做出一个小鸟飞的动作,孩子们也一边“飞”一边读单词;而在教授动物类单词时,让学生模仿动物的动作并比赛谁模仿的更像,学生的学习热情一下子激发出来了,脑、口、手齐上阵,孩子们的学习效率有了很大提高。三、设计游戏来呈现某一主题的一系列单词游戏化学习是一种新型的学习方式,它借鉴游戏的设疑、挑战、自主等理念,把教学目标隐蔽于游戏活动中,根据学习者的特征以及教学内容,采取相应的游戏化教学策略,从而使学习者在放松的状态下,在游戏情境中探索和学习,从乐趣中获得知识、提高技能和陶冶情操。根据儿童爱玩的天性,可以将英语单词深入到学生游戏中,让学生在“玩中学,学中玩”,把“学”和“玩”有机地结合起来。游戏能使学生产生愉快的心情,在应用过程中应注意其娱乐性和知识性相结合。游戏的目的和形式设计都应紧密围绕教学内容。“玩”是形式,“学”是目的,学生在游戏中要有所收获。游戏的设要有其科学性和灵活性,课堂的游戏应从全员参加的角度去设计,而且知识点要渗透于其中,使学生在不知不觉中学会英语。四、充分利用信息技术,在不同阶段选择合适的教育游戏软件和动画辅助单词教学信息时代的到来,为教育带来机遇的同时,也让教育面临着巨大的挑战。小学英词教师应投身教育信息化的改革大潮,探索信息技术与课程整合之路,在更新教学观念,创新教学模式之余,利用当前电脑已在家庭普及的现实条件,小学生接触新鲜事物快,喜欢玩电子游戏的特点,对小学生玩的热情加以正确的引导,就可以将小学生吸引到教育游戏中来。根据小学生都喜欢看动画片的特点,还可以在不同的词汇学习阶段选择合适的动画片,来巩固单词。信息化教学方法更加直观,可以做到音画交融、直观形象、童趣十足、互动性强,有利于激发学生的好奇心,使得学生长时间沉醉其中,实现主动学习,往往能够达到教学的较高境界。艾滨浩斯的遗忘曲线告诉我们,在接触新信息的最初一段时间里,遗忘的速度最快,比例最大,随着时间的推移,遗忘速度减缓,比例减小。因此可以根据小学生的记忆特点合理安排词汇复习的频率。一般来说,在学习新单词的一两天时间里,复习的次数较多,往后逐渐减少,时间间隔不断加大。复习的频率从密集到疏松逐渐过渡,比如从最初学习新词后,时间上间隔一天、三天、一周、一个月、三个月等,而具体操作形式上可以制定一个单词复习计划表,将每天的单词复习任务明确的列在表中,每次的复习时间都控制在几分钟以内,对表中每个单词逐一快速识别,回忆出其中文意思后立即转向下一个单词,这样每一次单词的复习负担小,小学生精神高度集中,根据人的记忆规律,同一单词复习七次以上后将会被永久记住。这样即提高和单词学习的时间效率,又不会让学生感到厌烦。小学阶段是学生学习英语的入门阶段,英语教师要重视学生在起始阶段的英语单词教学,充分利用小学生的心理及行为特点,根据小学的兴趣和爱好,设计灵活多样的教学形式,巧招妙教,使学生学得愉快、学得扎实,实现在“玩中学,学中玩”。初中语文的教学,课堂教学是主要教学方式,但是很多从事多年初中语文教学的教师会发现,语文课堂教学,很容易失去学生的主动参与,而沦为教师一个人的独角戏。这是因为学生进入到初中学习,学习科目骤然增多,理科科目比小学时期难度增加一大级,学生疲于应付数学、物理和化学,对语文自然而然丧失学习的激情,也分散了精力。因此,要提高初中?Z文课堂的教学效果,就要借助有效的教学手段,实施针对性的教学措施,以提高学生的注意力,降低学生理解的难度,减轻学生语文学习的负担。那么,游戏元素是教育教学常采用的教学辅助工具,如何更好地将游戏元素引入初中语文课堂,使其发挥积极的教学效果,优化课堂教学的整体氛围,提高学生语文学习的效率,是广大语文教师需要研究的问题,对此,笔者也有以下几点思考。一、引入游戏,优化课堂气氛初中语文课堂教学很多时候是沉闷的、严肃的,教师成为教学主体,学生多数游离在教学环境之外。教师有时候希望和学生进行一些互动,以使课堂气氛更加活跃,但是如果方法不对,就总得不到应有的效果,教师的热情有时候只能得到少数学生的回应,久而久之,教师也就习惯这样的课堂状态,学生也逐渐失去对语文的兴趣。因此,教师要想使课堂教学的氛围更加轻松,就要在合适的时机引入简单的游戏,例如进行击鼓传声游戏,教师将当节课上一句重要的诗文作为线索,使得全班同学迅速投入游戏,并制定合适的奖惩措施,让被选中的学生背诵古诗,或者阐述课堂学习的心得体会,教师借此机会,总结这节课的教学主题,深化学生的记忆。让学生在不知不觉中,主动吸收了知识,同时对于语文课堂也不那么畏惧。游戏的使用能够让课堂的氛围更加轻松,但是教师要善于采用合适的游戏,不能为了游戏而游戏,那样只会导致学生失去参与游戏的兴趣,将课堂游戏变得了无生趣,教师要善于把握学生的心理特点,要引入形式多样、操作简单的游戏,能使学生全身心投入,并在游戏中学习到知识,事半功倍。二、引入游戏,帮助学生理解初中语文教学,很多知识的传播需要建立在学生全面、准确的理解上,如果不能帮助学生准确理解课文内容,那么教学目标自然无法达成,理解和体会是学生学习的感性基础,感性基础打好了,后面的理性学习和思考才能进行得更加顺利。那么教师也要善于采用游戏环节,帮助学生理解某些知识。例如,教师可以组织学生进行有感情的朗读,让学生凭借自己的理解朗诵文章,或者背诵古诗,然后让其他学生进行评判。教师还可以通过现代戏剧形式,让大家演绎文言文的内容,因为文言文的学习一向是初中语文的困难所在,教师可以采取这种方式让学生理解文章的主题,体会作者的意图,然后在理解的基础上,进行更深入的学习。教师还可以自创小游戏,帮助学生识记课文中的生字生词,比如制作小卡片,以小组为单位,请学生默写、解释,教师发动其他同学打分,使全班同学投入到小组学习的比拼中,形成持续饱满的学习热情。三、引入游戏,增进师生感情很多教师可能都会有这样的感受,就是教师课堂提问很少得到学生的积极回答,对课堂讨论学生也很难投入,很大一部分原因就是,初中学生还对教师存有畏惧的情绪,害怕和老师对话,害怕和老师交流,教师在学生心中就是高不可攀的存在,师生之间总是有一道鸿沟。显然,这样的师生关系是非常不利于教学的开展的。语文课堂上,教师要多举行游戏互动,并且教师本人也要积极参与到游戏中,和学生共同竞争,这样才能够拉近老师和学生之间的距离。因为在游戏中,学生的身心都处在一种非常轻松的状态下,也就是对周围的人和事都不设防,而教师在参与游戏的时候,也一改往日在讲台上一本正经的形象,在教师打破传统形象和学生身心放松的情况下,教师通过游戏的纽带,很容易和学生打成一片。在这个过程中,学生会改变对教师的一贯看法,加深对教师的了解,增进师生之间的感情,而教师也能在这个过程中,收获学生们的信任,师生之间的感情也就此加深,对以后的语文课堂教学也会产生积极的影响。师生之间良好的互动会将教学―游戏良性循环下去。综上所述,初中语文课堂教学是一种教学的艺术,也是师生互动的结果,教师需要投入饱满的热情,引入恰当、有效的游戏元素,辅助课堂教学。第四章概率分布与抽样从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:选民人数:每个候选人的支持率是多少?产品:不合格率是多少?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。7/16/20232主要内容
4.1抽样的一般问题4.2三种不同性质的分布4.3一个总体参数推断时样本统计量的抽样分布4.4两个总体参数推断时样本统计量的抽样分布4.5其他抽样方法█7/16/202334.1抽样的一般问题4.1.1一个例子4.1.2统计抽样的几个基本概念4.1.3简单随机抽样7/16/202344.1.1一个例子本例中存栏肉猪10000头组成的集合,则称为总体,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用N表示,称作总体容量。本例中所抽出的100头肉猪组成的集合,则称为样本,它是指在统计抽样中按照“随机原则”从总体N(10000)中抽出的部分单位(每个单位称作样本单位)所组成的整体,又称子样。一般样本的单位总数用n(100)表示,称作样本容量。样本不具惟一性,它的可能个数与N、n及抽样方法有关。通常n<30称为小样本,n≥30称为大样本,在抽样调查中取大或小样本会直接影响到抽样分布的特征。[例]某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均每头毛重(设为),如果将每头肉猪过称去获取数据将是不合算的。我们可以按照“随机原则”从中抽出100头称重量,计算这100头的平均每头毛重,以达到我们期望的目的。7/16/202351、总体和样本
总体:研究对象全体,又称母体。容量用N表示。具备惟一性。样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用n表示。样本不具惟一性。 当n<30时,为小样本。 当n≥30时,为大样本。4.1.2统计抽样的几个基本概念7/16/202362、总体参数和样本统计量根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总体参数。如上例中的根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。如上例中的抽出100头肉猪的平均每头毛重4.1.2统计抽样的几个基本概念7/16/202373、重复抽样与不重复抽样从总体中抽取样本有两种方法:重复抽样和不重复抽样。重复抽样,抽样安排---对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。不重复抽样,抽样安排---对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。4.1.2统计抽样的几个基本概念7/16/202384.1.3
简单随机抽样简单随机抽样也称为纯随机抽样。它是对总体单位不做任何分类或排队,直接从总体中按“随机原则”抽取样本单位的调查方式。为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签式或利用《随机数字表》进行抽取。例如:N=500n=10编码从1-500号在随机数表中随意选取二个数字,假如得到4行,43列。则选取的号码从这个被选中的数开始,由于500是个三位数,则小于500的连续三位数即为中选号码,见表中所示。7/16/202394.1.3
简单随机抽样█7/16/2023104.2三种不同性质的分布4.2.1几种常见分布4.2.2总体分布4.2.3样本分布4.2.4抽样分布4.2.5样本推断总体的理论依据这些内容与前面内容有什么关系?7/16/202311一、分布的含义1、在随机试验中,若X随着试验结果的不同而随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,则称X为一个随机变量。2、随机变量在其取值范围内,取值与取值概率间一一对应的关系,称为随机变量的概率分布(probabilitydistribution,简称分布)。3、概率分布可以用各种图或表来表示,一些也可以用公式来表示。4、概率分布的意义:描述随机变量变化的统计规律,方便地计算某一事件发生的概率。
4.2.1几种常见分布7/16/202312二、正态分布4.2.1几种常见分布定义7/16/202313正态分布的密度函数图形是一条以均值为中心的对称钟型曲线二、正态分布4.2.1几种常见分布7/16/202314正态分布密度函数的数学性质
二、正态分布4.2.1几种常见分布7/16/202315标准正态分布及其重要意义二、正态分布4.2.1几种常见分布7/16/202316标准化法二、正态分布4.2.1几种常见分布7/16/202317标准化法的几何意义
标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数,标准差。二、正态分布4.2.1几种常见分布7/16/202318正态分布表及上侧分位数二、正态分布4.2.1几种常见分布7/16/202319
准则
二、正态分布4.2.1几种常见分布7/16/202320准则示意图二、正态分布4.2.1几种常见分布7/16/202321正态分布的重要意义
在随机理论中,正态分布是最重要的一种分布,理由如下:⑴它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。⑵在一定的条件下,正态分布是其他分布的近似分布。⑶许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。二、正态分布4.2.1几种常见分布7/16/202322三、小样本(n<30)的精确分布1、2分布2、t分布3、F分布均由正态分布导出的分布4.2.1几种常见分布7/16/2023231、2分布(2
distribution)
(1)推导说明①由阿贝(Abbe)
于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来。②设,则③构造,则Yi服从自由度为1的2分布,即④当总体,从中抽取容量为n的样本,则4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/2023241、2分布
(2)性质和特点①由于2
分布变量为正态变量的平方和,故分布的变量值始终为正。②可加性:若U和V为两个独立的服从2分布的随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布。③n个独立正态变量平方和称为有n个自由度的c2-分布,记为c2(n)。c2-分布为一族分布,成员由自由度区分。④分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。⑤期望为E(2)=n,方差为D(2)=2n(n为自由度)4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/2023251、c2分布
(3)图示
选择容量为n的简单随机样本计算样本方差s2计算卡方值2=(n-1)s2/σ2计算出所有的
2值不同容量样本的抽样分布c2n=1n=4n=10n=20ms总体4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/2023261、c2分布
(4)c2分布的上分位点
分位点设X
~2(n),若对于:0<<1,存在,满足则称为分布的上分位点。4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/202327
①由统计学家哥赛特(W.S.Gosset)于1908年提出,并以其笔名命名。2、t-分布(t-distribution)
(1)t分布的构造及性质4.2.1几种常见分布三、小样本(n<30)的精确分布②构造:若~N(0,1),~2(n),与独立,则t(n)称为自由度为n的t分布。③基本性质:
(1)f(t)关于t=0(纵轴)对称。(2)f(t)的极限为N(0,1)的密度函数,即7/16/202328t(n)分布的图形为2、t-分布(t-distribution)
(2)t分布的图示4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/202329对于给定的:0<<1,称满足条件P(t>ta)=a的点ta为t(n)分布的上a分位点。2、t-分布(t-distribution)
(3)t分布的上a分位点4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/202330①由统计学家费希尔(R.A.Fisher)
提出的,以其姓氏的第一个字母来命名②构造:设若U为服从自由度为n1的2分布,即U~2(n1),V为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为3、F分布(F
distribution)
(1)F分布的构造4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/202331F分布
(图示)
不同自由度的F分布F(1,10)(5,10)(10,10)3、F分布(Fdistribution)
(2)F分布的图示4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/202332F分布的分位点:对于:0<<1,若满足条件:P{FF(n1,n2)}=,则称F(n1,n2)为F(n1,n2)的上分位点3、F分布(Fdistribution)
(3)F分布的上a分位点4.2.1几种常见分布三、小样本(n<30)的精确分布7/16/2023331)总体中各元素的观察值所形成的相对频数(频率)分布2)分布通常是未知的(因为几乎得不到总图所有观察值)3)可以根据理论分析假定它服从某种分布总体4.2.2总体分布7/16/2023341)一个样本中各观察值形成的相对频数(频率)分布2)也称经验分布3)当样本容量n逐渐增大时,样本分布逐渐接近总体的分布样本4.2.3样本分布7/16/2023351、统计量与参数1)在抽样推断中,无论是总体还是样本,都可以用均值、比例(或成数)、标准差和方差等指标来描述它们的特征。当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为总体参数。2)样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量,如样本均值,样本比例,样本方差等。4.2.4抽样分布7/16/2023362、抽样分布的含义1)含义:样本统计量的概率分布,是一种理论分布,在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。2)构造抽样分布包括以下几个步骤:(1)从容量为N的有限总体中随机抽出容量为n的所有可能样本;(2)算出每个样本的统计量数值;(3)算出与每个样本统计量数值相对应的概率,作频数分布表。4.2.4抽样分布7/16/2023373、总体分布、样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体分布、总体均值、总体方差如下。总体分布14230.1.2.3总体均值和方差4.2.4抽样分布7/16/202338
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)4.2.4抽样分布7/16/202339x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5
计算出各样本的均值,如下表,并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(
x
)4.2.4抽样分布7/16/202340样本均值的分布与总体分布的比较
(例题分析)
=2.5σ2=1.25
的分布形式与原有总体的分布和样本容量n的大小等因素有关总体分布抽样分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x4.2.4抽样分布7/16/2023414、抽样分布的意义因为样本均值是一个随机变量,因此,与其他随机变量一样,具有平均数(期望)、方差和概率分布。因为的各种可能取值是多次简单随机抽样的结果,所以的概率分布称为的抽样分布。对于这个抽样分布及其特征的了解,可以使我们能够对样本均值与总体均值的接近程度进行概率描述。4.2.4抽样分布意义:抽样分布一方面描述了样本的随机性,提供了样本统计量长远而稳定的信息即变化规律;另一方面建立了样本与总体的联系,是进行推断的理论基础,也是抽样推断科学性的重要依据。 7/16/202342一、大数定律1、是关于均值具有稳定性的一类定律。2、以切比雪夫大数定律为例。设随机变量相互独立,且具有相同的有限数学期望和方差:
则对于任意正数,都有3、若把()看作是来自期望为μ、方差为σ2总体的一个容量为n的样本,随着n的充分增大,样本均值依概率收敛于总体均值。4、大数定律为统计量估计参数提供了理论上的依据。即统计量推断参数是可行的。但大数定律没有提供统计量推断参数时误差的计算方法。4.2.5样本推断总体的理论依据7/16/202343二、中心极限定理(centrallimittheorem)当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布1.中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。一个任意分布的总体x4.2.5样本推断总体的理论依据7/16/2023442.x的分布趋于正态分布的过程4.2.5样本推断总体的理论依据7/16/2023453.中心极限定理的重要意义1)确定了正态分布在各种分布中的首要地位。也回答了正态分布是最重要、最常见的分布。2)揭示了正态分布的形成机制。如果某一个量的变化受到许多种随机因素的影响,这种影响的总后果是各个因素的迭加,而且,这些因素中没有任何一个是起主导作用的,那么,这个量就是一个服从正态分布的随机变量。3)提供了推断误差的计算思想方法,特别是大样本处理方法。但没有提供小样本下推断误差的计算方法。4.2.5样本推断总体的理论依据█7/16/2023464.3一个总体参数推断时样本统计量的抽样分布4.3.1样本均值的抽样分布4.3.2样本比例的抽样分布4.3.3样本方差的抽样分布7/16/2023471、样本均值抽样分布的含义1)在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2)一种理论概率分布3)是推断总体均值的理论基础4.3.1样本均值的抽样分布7/16/2023482、样本均值抽样分布的形式(1)总体分布为正态分布=50
=10X总体分布n=4抽样分布xn=16
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)4.3.1样本均值的抽样分布7/16/2023492、样本均值抽样分布的形式(2)总体分布为非正态分布(n≥30,大样本情形)当样本容量足够大时(n
30),样本均值的抽样分布逐渐趋于正态分布从均值为,方差为2的一个非正态分布总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体x4.3.1样本均值的抽样分布7/16/2023501、总体分布为非正态分布且为小样本(n<30)2、样本均值的分布为非正态分布2、样本均值抽样分布的形式(3)总体分布为非正态分布(n<30,小样本情形)4.3.1样本均值的抽样分布7/16/202351总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布2、样本均值抽样分布的形式(4)小结4.3.1样本均值的抽样分布7/16/202352样本均值的数学期望样本均值的方差(方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随机变量的取值越集中在期望值附近。)
重复抽样不重复抽样3、样本均值抽样分布的特征设总体共有N个元素,其均值为μ,方差为σ2,从中抽取容量为n的样本,则4.3.1样本均值的抽样分布7/16/2023531)总体(或样本)中具有某种属性的单位与全部单位总数之比①不同性别的人与全部人数之比②合格品(或不合格品)与全部产品总数之比2)总体比例可表示为3)样本比例可表示为
4.3.2样本比例(成数)的抽样分布1、比例(成数)的含义7/16/202354在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布。一种理论概率分布。当样本容量很大时(np≥5和n(1-p)≥5),样本比例的抽样分布可用正态分布近似。推断总体比例的理论基础。
4.3.2样本比例的抽样分布2、样本比例抽样分布的含义及形式7/16/202355样本比例的数学期望样本比例的方差重复抽样不重复抽样4.3.2样本比例的抽样分布3、样本比例抽样分布的特征7/16/202356调查误差登记性误差代表性误差系统性误差(偏差)抽样平均误差实际误差
抽样误差主要是指在用样本数据进行推断时所产生的随机误差。统计推断中的抽样误差通常是指抽样平均误差,它是抽样调查所固有的,是对抽样推断精确度的量度。4.3.2样本比例的抽样分布4、抽样误差(1)调查误差的分类抽样极限误差抽样误差(随机误差)7/16/2023574.3.2样本比例的抽样分布(2)统计量的标准误()定义:样本统计量的抽样分布的标准差,测度所有样本统计量的离散程度,也称标准误差或抽样平均误差。A:样本均值的抽样误差B:样本成数P的抽样误差4、抽样误差7/16/202358
样本平均数的抽样平均误差A、重复抽样4、抽样误差(3)标准误差的计算4.3.2样本比例的抽样分布7/16/202359B、不重复抽样4、抽样误差(3)标准误差的计算4.3.2样本比例的抽样分布7/16/202360不重复抽样有限总体重复抽样或无限总体有限总体中为校正因子,一般可简写为一般当抽样比小于等于5%时,校正因子可忽略不计。标准误差就是样本统计量的抽样分布的标准差,也称抽样平均误差,其计算公式如下:4.3.2样本比例的抽样分布4、抽样误差(3)标准误差的计算7/16/202361①当计算标准误时涉及的总体参数未知时,用样本统计量代替计算的标准误,称为估计的标准误。②以样本均值的抽样分布为例,当总体标准差未知时,可用样本标准差s代替,则在重复抽样条件下,样本均值的估计标准误为:标准差=标准误=估计标准误=抽样误差?4.3.2样本比例的抽样分布4、抽样误差(4)估计的标准误
(standarderrorofestimation)7/16/202362总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。4.3.2样本比例的抽样分布4、抽样误差(5)影响抽样误差的因素7/16/202363在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的2分布,即4.3.3样本方差的抽样分布█7/16/2023644.4两个总体参数推断时样本统计量的抽样分布4.4.1两个样本均值之差的抽样分布4.4.2两个样本比例之差的抽样分布4.4.3两个样本方差比的抽样分布7/16/202365两个总体都为正态分布,即,两个样本均值之差的抽样分布服从正态分布,其分布的数学期望为两个总体均值之差方差为各自的方差之和
4.4.1两个样本均值之差的抽样分布即:7/16/202366两个总体都服从二项分布分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似分布的数学期望为方差为各自的方差之和
4.4.2两个样本比例之差的抽样分布即:7/16/202367
两个总体都为正态分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)从两个总体中分别抽取容量为n1和n2的独立样本两个样本方差比的抽样分布,服从分子自由度为(n1-1),分母自由度为(n2-1)的F分布,即4.4.3两个样本方差比的抽样分布█7/16/2023684.5其他抽样方法4.5.1概率抽样1、分层抽样2、系统抽样3、整群抽样4、多阶段抽样4.5.2非概率抽样1、方便抽样2、判断抽样3、自愿样本4、滚雪球抽样5、配额抽样4.5.3概率抽样和非概率抽样的比较4.5.4抽样调查实例7/16/202369根据一个已知的概率来抽取样本单位,也称随机抽样,概率抽样有简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样等。特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率4.5.1概率抽样7/16/2023701.分层抽样(stratifiedsampling)1、定义:将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本单位,所有抽出的样本单位合起来构成样本。2、特点:先分层(对总体),后抽样(对层)3、分层要求:层间差别大,层内差别小4、抽样方法:(见下张幻灯片)5、适用:总体单位在总体内部分布不均匀且变异程度大的总体。6、优点:保证样本的结构与总体的结构比较相近,从而提高估计的精度;组织实施调查方便;既可以对总体参数进行估计,也可以对各层的目标量进行估计。7/16/202371总体N样本n等额等比例不等比例······1.分层抽样(stratifiedsampling)7/16/202372[例]10人年龄资料如下。N=10n=3,推断总体平均年龄。人:ABC
DEFG
HIJ年龄:5811
39424548
707376[简单随机抽样](B、H、I),(C、D、E
),(F、G、I)结论:总体变异较大时分层抽样。[分层抽样](B、E、I),(C、D、H
),(A、G、J)1.分层抽样(stratifiedsampling)7/16/202373······随机起点半距起点对称起点(总体单位按某一标志排序)
按无关标志排序,其抽样效果相当于简单随机抽样;按有关标志排序,其抽样效果相当于分层抽样。2、系统抽样(机械抽样或等距抽样)
(systematicsampling)——将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。7/16/202374系统抽样可以分为无关标志排序抽样和有关标志排序抽样两类。
无关标志排序抽样是指排序的标志与被研究的标志无关。如:观察学生考试成绩用姓氏笔划;观察产品质量按生产的先后顺序等。无关标志排序可以保证抽样的随机性,它实质上相当于简单随机抽样。
有关标志排序抽样是指排序的标志与被研究标志相关。在对总体各单位的变异情况有所了解的情况下,也可以采用有关标志进行总体单位排列,使各单位的排列顺序和它的变量数值大小保持密切的关系。如:农产量抽样调查,可利用各县或各乡当年估计亩产或最近三年平均亩产标志排队,抽取调查单位。由此可见,按有关标志排序实质上是运用系统抽样的一些特点,有利于提高样本的代表性,它实质上相当于分层抽样。但也必须注意到,系统抽样在排序时,第一个样本单位的位置确定后,其余单位也随之确定,因此要避免抽样间隔和现象本身的周期性节奏相重合,引起系统性的影响。2、系统抽样
(systematicsampling)7/16/2023753、整群抽样
(clustersampling)1、定义:将总体中各单位按一定标准分成若干组(群),再从总体中随机抽取一定数量的群,对抽中群的所有单位全部实施调查。2、特点:先分群(对总体),后抽样(对总体)3、群的类型:自然形成的群;人为划分的群4、分群原则:群间差别小,群内差别大5、抽样方法:(见下张幻灯片)6、适用:在大规模的抽样调查中,如果总体单位多且分布区域广,缺少进行抽样的抽样框,或者在按经济效益原则不宜编制这种抽样框的情况下,宜采用整群抽样方式。7/16/202376例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差3、整群抽样(clustersampling)7/16/202377例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)——又称多级抽样,它是将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式。4、多阶段抽样7/16/202378其优点在于:
首先,便于组织抽样。它可以按现有的行政区划或地理区域划分各阶段的抽样单元,从而简化抽样框的编制。其次,可以获得各阶段单元的调查资料,即根据最初级资料可进行逐级抽样推断,得到各级的调查资料。如农产量调查,可根据样本推断地块资料,根据地块资料可推断村的资料,然后依次推断乡、县等。第三,多阶段抽样的方式比较灵活,各阶段抽样的组织方式可以前述四种为依据进行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- EB病毒感染的中医治疗
- 连锁餐饮火锅品牌招商加盟
- 机械安全知识培训资料课件
- 机械安全培训重点课件
- 机械安全培训演讲稿课件
- 新冠康复期社交活动指导
- 陕西省2025八年级物理上册第二章光现象第三节平面镜第2课时平面镜成像的应用课件新版苏科版
- 陕西省2025八年级物理上册第一章声现象全章易错集训课件新版苏科版
- 心电图护理技能竞赛视频
- AGI全栈开发课件 第7章 AGI与软件工程融合演进
- DB34-T2328-2015-旅行社研学旅行服务规范-安徽省
- 骨科围手术期静脉血栓栓塞症预防指南
- 中药材入股合同协议书
- 智能化系统在铁路装备检修中的应用-洞察阐释
- 纳米材料考试题及答案
- TCPQSXF006-2023消防水带产品维护更换及售后服务
- QGDW12505-2025电化学储能电站安全风险评估规范
- 外贸业务流程管理指南
- DBJ50- T-445-2023建筑边坡工程监测技术标准
- 砂石场生产线承包合同
- 2013年浙大博士录取
评论
0/150
提交评论