第十四章抽样设计_第1页
第十四章抽样设计_第2页
第十四章抽样设计_第3页
第十四章抽样设计_第4页
第十四章抽样设计_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、职教学院 刘春雷E-mail:教育统计学12由样本对总体的相应特征进行统计推断。由样本对总体的相应特征进行统计推断。推断的可靠性与以下几种因素有关:推断的可靠性与以下几种因素有关:1数据的质量;数据的质量;2运用统计方法及数据处理的准确性;运用统计方法及数据处理的准确性;3样本样本对总体的代表性。对总体的代表性。样本对总体的代表性,样本对总体的代表性,既涉及到抽样的既涉及到抽样的方式方式,又涉及到样本的又涉及到样本的容量容量。第十四章 抽样设计3第十四章 抽样设计第一节第一节 抽样方法抽样方法第二节第二节 总体平均数统计推断时样本容量的确定总体平均数统计推断时样本容量的确定第三节第三节 总体比

2、率统计推断及相关系数显著性检总体比率统计推断及相关系数显著性检验时样本容量的确定验时样本容量的确定4第一节 抽样方法一、单纯随机抽样一、单纯随机抽样如果总体中每个个体被抽到的如果总体中每个个体被抽到的机会是均等机会是均等的(即抽样的的(即抽样的随机随机性),性),并且在抽取一个个体之后总体内并且在抽取一个个体之后总体内成份不变成份不变(抽样的(抽样的独立独立性性)。这种抽样方法称为单纯随机抽样。)。这种抽样方法称为单纯随机抽样。5第一节 抽样方法一、单纯随机抽样一、单纯随机抽样有限总体有限总体根据抽样独立性原则,对于根据抽样独立性原则,对于有限总体有限总体要用放回抽样方法,要用放回抽样方法,即

3、将每一个从总体中抽出的个体,记录其结果之后,再即将每一个从总体中抽出的个体,记录其结果之后,再放回放回总体总体之中,这样重复抽取之中,这样重复抽取n次就得到一组容量为次就得到一组容量为n的样本。的样本。无限总体无限总体对于对于无限总体无限总体来说,由于抽出的个体放回与不放回并不来说,由于抽出的个体放回与不放回并不改变总体的成分,因此抽样时并不要求放回。改变总体的成分,因此抽样时并不要求放回。6第一节 抽样方法一、单纯随机抽样一、单纯随机抽样在教育研究中,放回抽样往往成为不可能。在教育研究中,放回抽样往往成为不可能。因此在应用时即使是有限总体,因此在应用时即使是有限总体,如果如果总体总体的个数的

4、个数大于大于500,而且总体内的个体数是样本中个体数的而且总体内的个体数是样本中个体数的10-20倍倍,也可,也可视为接近视为接近无限总体无限总体,实行不放回抽样。,实行不放回抽样。7第一节 抽样方法二、机械抽样二、机械抽样把总体中的所有个体按一定顺序把总体中的所有个体按一定顺序编号编号,然后依然后依固定的间隔固定的间隔取样(间隔的大小视所需样本容量与取样(间隔的大小视所需样本容量与总体中个体数目的比率而定),这种抽样方法称为机械抽样。总体中个体数目的比率而定),这种抽样方法称为机械抽样。例如:为了了解某校大学一年级学生英语学习情况,拟从例如:为了了解某校大学一年级学生英语学习情况,拟从150

5、0个大一学生中抽取个大一学生中抽取1/10作为样本。先将这作为样本。先将这1500个学生个学生的英语测验分数的英语测验分数由低到高排列由低到高排列,并从,并从1至至1500编号,然后按编号,然后按1、11、21,号码的号码的顺序顺序和和间隔间隔抽取分数,并组成一个抽取分数,并组成一个样本。样本。8第一节 抽样方法二、机械抽样二、机械抽样机械抽样比单纯随机抽样能保证抽到的个体在总体中的机械抽样比单纯随机抽样能保证抽到的个体在总体中的分布比较分布比较均匀均匀,而单纯随机抽样比机械抽样的而单纯随机抽样比机械抽样的随机性强随机性强,因为单纯随机,因为单纯随机抽样可以由总体内所有的个体组成任何可能的样本

6、,而机械抽样可以由总体内所有的个体组成任何可能的样本,而机械抽样对上例来说,只有抽样对上例来说,只有10个可能样本,即:个可能样本,即:1、11、21;2、12、22;10、20、30。9第一节 抽样方法二、机械抽样二、机械抽样机械抽样和单纯随机抽样两者也可以机械抽样和单纯随机抽样两者也可以结合结合使用。使用。如,上例先按机械抽样原则在如,上例先按机械抽样原则在1、2、10中抽取一个,中抽取一个,至于抽哪一个可以用至于抽哪一个可以用单纯随机抽样单纯随机抽样的办法确定。的办法确定。既可保持分布的均匀,又扩大了各个个体随机组合的可能性。既可保持分布的均匀,又扩大了各个个体随机组合的可能性。10第一

7、节 抽样方法三、分层抽样三、分层抽样按与研究内容有关的按与研究内容有关的因素因素或或指标指标先将总体划先将总体划分成分成几部分几部分(即几个层),(即几个层),然后从各部分(即各层)中进行然后从各部分(即各层)中进行单纯随机单纯随机抽样或抽样或机械随机械随机机抽样,这种抽样方法称为抽样,这种抽样方法称为分层抽样分层抽样。总体分层的基本总体分层的基本原则原则:各:各层内层内部的差异要小,层与部的差异要小,层与层之间层之间的的差异要大。差异要大。11第一节 抽样方法三、分层抽样三、分层抽样各层分配个数的方法有:各层分配个数的方法有:1、按各层的、按各层的人数比率人数比率分配分配当总体当总体未知未知

8、时,从各层所抽的人数比率都应当等于样本的时,从各层所抽的人数比率都应当等于样本的容量容量n与总体与总体N之比。之比。例如,对某校例如,对某校800个学生的品德情况进行了解,拟取个学生的品德情况进行了解,拟取40个学个学生作为样本。那么,可先根据一定生作为样本。那么,可先根据一定标准标准将将800个学生分成优个学生分成优(160人)、良(人)、良(320人)、中(人)、中(240人)、差(人)、差(80人)四部人)四部分,然后从各部分中用单纯随机抽样或机械随机抽样的方法,分,然后从各部分中用单纯随机抽样或机械随机抽样的方法,各抽各抽40/800=1/20。12第一节 抽样方法三、分层抽样三、分层

9、抽样各层分配个数的方法有:各层分配个数的方法有:2、最优配置法、最优配置法在从各层抽取对象时,既考虑各层的在从各层抽取对象时,既考虑各层的人数比率人数比率,又考虑各层,又考虑各层标准差标准差的大小,这种从各层抽取的对象的方法称为的大小,这种从各层抽取的对象的方法称为最优配置最优配置法法。从各层所抽取人数的计算公式为:从各层所抽取人数的计算公式为:hhhhhNNnnn nh h从某一层所抽的人数从某一层所抽的人数n n 样本的容量(即各层所抽人数之和)样本的容量(即各层所抽人数之和)N Nh h某层的人数某层的人数h h某层的标准差某层的标准差13第一节 抽样方法例如,要了解某市高等教育自学考试

10、的数学成绩,拟采用例如,要了解某市高等教育自学考试的数学成绩,拟采用最优配置分层最优配置分层抽样方法。首先将考试成绩分成上中下三层,各层人数分别为抽样方法。首先将考试成绩分成上中下三层,各层人数分别为120、420、60,其总人数为,其总人数为600,各层标准差估计为,各层标准差估计为11、9、13,假如样本容量,假如样本容量n已已确定为确定为65(按理(按理n的大小也应是根据各种条件计算出来的),将有关数的大小也应是根据各种条件计算出来的),将有关数据代入上式,于是上中下各层应抽取人数分别为:据代入上式,于是上中下各层应抽取人数分别为:1558801320651360942011120111

11、20651n4258809420651n958801360651n从各层所抽的人数比率为:从各层所抽的人数比率为:125. 01201511Nn10. 04204222Nn15. 060933Nn由此可见,在标准差大的层里所抽的人数比率大由此可见,在标准差大的层里所抽的人数比率大 14第一节 抽样方法四、整群抽样四、整群抽样从总体中抽出来的研究对象,不是以个体作为单位,而从总体中抽出来的研究对象,不是以个体作为单位,而是以是以整群整群为单位的抽样方法,称为整群抽样。为单位的抽样方法,称为整群抽样。例如,要了解某市某年物理学科高考的成绩,可以以例如,要了解某市某年物理学科高考的成绩,可以以学校学

12、校为为单位进行抽样。单位进行抽样。为了增强样本对总体的代表性,弥补整群抽样的不均匀为了增强样本对总体的代表性,弥补整群抽样的不均匀性,可以性,可以与分层抽样相结合与分层抽样相结合。先按一定的标准把全市所有中学先按一定的标准把全市所有中学分成几部分分成几部分,如市重点、,如市重点、区重点、普通中学三类,区重点、普通中学三类,然后根据比率,从三类学校中然后根据比率,从三类学校中抽取若干学校抽取若干学校,组成整群,组成整群样本。样本。15第二节 总体平均数统计推断时样本容量的确定 确定样本确定样本容量容量的的基本原则基本原则在尽量节省人力、经费和时间的条件下,确保用样本推在尽量节省人力、经费和时间的

13、条件下,确保用样本推断总体达到预定的可靠度及准确性。断总体达到预定的可靠度及准确性。统计推断的可靠度及准确性的提高与样本容量的增大统计推断的可靠度及准确性的提高与样本容量的增大不呈直不呈直线关系线关系。样本容量增到一定程度,可靠度及准确性增高样本容量增到一定程度,可靠度及准确性增高的速度开始放慢。的速度开始放慢。16第二节 总体平均数统计推断时样本容量的确定 在实际教育研究中,一般样本容量不会太小,可将有限在实际教育研究中,一般样本容量不会太小,可将有限总体视为总体视为无限总体无限总体。确定样本容量的各抽样方式均由确定样本容量的各抽样方式均由单纯随机单纯随机抽样方式来代抽样方式来代替。替。以下

14、确定样本容量时即作如此处理。以下确定样本容量时即作如此处理。17第二节 总体平均数统计推断时样本容量的确定 一、由样本平均数一、由样本平均数估计总体估计总体平均数时样本容量的确定平均数时样本容量的确定1、总体、总体已知已知的情况的情况当总体标准差当总体标准差已知,样本平均数与总体平均数离差的统计已知,样本平均数与总体平均数离差的统计量呈量呈正态正态分布。分布。其统计量为:其统计量为:nXZ2/18第二节 总体平均数统计推断时样本容量的确定 若由样本平均数估计总体平均数时,要求:若由样本平均数估计总体平均数时,要求:最大允许最大允许误差误差为:为:可信度可信度为为1-,当当=0.05,双侧临界值

15、为,双侧临界值为Z0.05=1.96;当当=0.01,双侧临界值为,双侧临界值为Z0.01=2.58。于是根据上式计算样本容量的于是根据上式计算样本容量的公式公式为:为: (14.2)X22/Zn19第二节 总体平均数统计推断时样本容量的确定 例如例如拟估计上海市高校四级英语考试的总体平均分数,根据历次拟估计上海市高校四级英语考试的总体平均分数,根据历次考试成绩的考试成绩的标准差标准差为为13,这次的估计最大允许,这次的估计最大允许误差误差=2分,分,可信度可信度为为95%,问应当抽多少人?,问应当抽多少人?根据题意,是要由样本的平均数根据题意,是要由样本的平均数估计总体的平均数估计总体的平均

16、数,总体的总体的=13 ,=0.05,相应的,相应的Z0.05=1.96,=2,将其代入上式,则将其代入上式,则1623 .16221396. 12n应当抽取应当抽取162162人。人。20第二节 总体平均数统计推断时样本容量的确定 2、总体、总体未知未知的情况的情况当总体标准差当总体标准差未知,样本平均数与总体平均数未知,样本平均数与总体平均数离差离差统计量统计量呈呈t分布分布,其统计量为:,其统计量为:于是根据上式计算样本容量的于是根据上式计算样本容量的公式公式为:为: (14.3)nSXt2/22/Stn21第二节 总体平均数统计推断时样本容量的确定 2、总体、总体未知未知的情况的情况但

17、但t/2值不是一个常数,它随自由度值不是一个常数,它随自由度df=n-1的大小而变化,当的大小而变化,当样本容量未确定之前,自由度无法确定,于是值也无法查出。样本容量未确定之前,自由度无法确定,于是值也无法查出。一般采用一般采用尝试法尝试法:首先将自由度首先将自由度df=的的t/2值代入上式,求出值代入上式,求出n1,然后将然后将df=n1-1的的t/2值再代入上式求出值再代入上式求出n2,再将再将df=n2-1的的t/2值再代入上式求出值再代入上式求出n3,以此方法重复,以此方法重复下去,下去,直至先后连续两次所求得的直至先后连续两次所求得的n相等相等为止,这时为止,这时n就是所要就是所要确

18、定的样本容量。确定的样本容量。22第二节 总体平均数统计推断时样本容量的确定 例如:例如:拟对某市初中升高中入学考试语文成绩的总体平均数进行估拟对某市初中升高中入学考试语文成绩的总体平均数进行估计。根据以同等难度的试题,对同等教育水平的另一城市部计。根据以同等难度的试题,对同等教育水平的另一城市部分初中升高中入学考试语文成绩算出的分初中升高中入学考试语文成绩算出的S=11.4。若要求估计。若要求估计的最大允许的最大允许误差误差=3,可信度可信度为为99%,问样本容量应为多少?,问样本容量应为多少?因为本题总体因为本题总体未知,应用公式未知,应用公式(14.3)计算。计算。首先首先根据根据df=

19、及及=0.01(双侧),查(双侧),查t值表,寻得值表,寻得t()0.01=2.5758,并将,并将S=11.4,=3一并代入公式,于是一并代入公式,于是968 .9534 .115758. 221n23第二节 总体平均数统计推断时样本容量的确定 然后然后根据根据df=96-1=95,查,查t值表,寻得双侧值表,寻得双侧t(95)0.01=2.629,将其代入公式,则将其代入公式,则再再根据根据df=100-1=99,查,查t值表,寻得双侧值表,寻得双侧t(99)0.01=2.627,将,将其代入公式,则其代入公式,则因为因为最后最后连续两次计算出的连续两次计算出的n相等,即相等,即n2=n3

20、=100,故样本,故样本容量以容量以n=100为宜。为宜。1008 .9934 .11629. 222n1007 .9934 .11627. 223n24第二节 总体平均数统计推断时样本容量的确定 当估计计算出的样本容量当估计计算出的样本容量可能可能会会大于大于或等于或等于30时,虽然时,虽然总体总体未知未知,一般也可用,一般也可用正态正态分布的统计量公式计算,因为分布的统计量公式计算,因为此时这两个公式计算结果相差甚微。此时这两个公式计算结果相差甚微。当估计样本容量当估计样本容量可能可能会会小于小于30时,以用时,以用t分布分布统计量公统计量公式的尝试法为宜。式的尝试法为宜。25第二节 总体

21、平均数统计推断时样本容量的确定 统计学家运用统计学家运用尝试法尝试法研制了由样本平均数研制了由样本平均数估计总体估计总体平均数时平均数时所需所需样本容量表样本容量表,表的表的左侧左侧纵列表示总体标准差估计值纵列表示总体标准差估计值S与最大允许误差与最大允许误差之比之比S/的的整数整数部分,部分,上端上端横行表示横行表示S/值的一位值的一位小数小数值。可根据值。可根据S/值及值及查查表。表。26第二节 总体平均数统计推断时样本容量的确定 二、样本平均数与总体平均数二、样本平均数与总体平均数差异差异显著性显著性检验检验(要考虑(要考虑、错误)时样本容量的确定错误)时样本容量的确定1、总体、总体已知

22、已知的情况的情况根据样本平均数对总体平均数进行差异显著性检验时,其假根据样本平均数对总体平均数进行差异显著性检验时,其假设为:设为:H0:=0 ,H1:0H0是说,样本所来自的总体平均数是说,样本所来自的总体平均数就是就是0 ,H1是说,样本所来自的总体平均数是说,样本所来自的总体平均数不是不是0 。27第二节 总体平均数统计推断时样本容量的确定 若若H0为真,而遭拒绝,就会犯为真,而遭拒绝,就会犯错误,则有错误,则有2/0ZnX若若H H1为真,而遭拒绝,就会犯为真,而遭拒绝,就会犯错误,则有错误,则有ZnX28第二节 总体平均数统计推断时样本容量的确定 在假设中既要考虑在假设中既要考虑又要

23、考虑又要考虑,将以上二式,将以上二式相加相加为:为: ZZn2/0若令若令=-=-0 0 ,则,则2ZZn(单单侧)侧) (14.414.4) 22/ZZn(双双侧)侧) (14.514.5) n所需样本容量;Z值置于正态分布一端时相应的Z值Z/2值置于正态分布两端时相应的Z值Z与值相对应的正态分布Z值总体的标准差最大允许误差29第二节 总体平均数统计推断时样本容量的确定 上式中上式中及及值是由研究者值是由研究者预先预先确定的,确定的,值要确定得比值要确定得比值小。值小。值一般确定为值一般确定为0.05或或0.01。值一般确定为值一般确定为0.10、0.20、0.30。在在及及值确定后,值确定

24、后,若进行双侧检验,若进行双侧检验,值要分置于分布的两端;值要分置于分布的两端;若进行单侧检验,若进行单侧检验,值要置于分布的一端。值要置于分布的一端。于是同一个于是同一个值,其单、双侧值,其单、双侧Z的临界值是的临界值是不相同不相同的。的。而对于而对于值来说,无论进行单侧检验还是双侧检验,其值来说,无论进行单侧检验还是双侧检验,其值总值总是置于分布的是置于分布的一端一端。30第二节 总体平均数统计推断时样本容量的确定 例如:例如:某区高三学能测验某区高三学能测验CEEB标准分数的平均数标准分数的平均数0=500,标准差,标准差=100,据高中教师的经验认为,高中连续三年参加体育运,据高中教师

25、的经验认为,高中连续三年参加体育运动对的学生,学能测验比平均数动对的学生,学能测验比平均数低低23分(分()。为了检验这)。为了检验这一经验的可靠性,确定一经验的可靠性,确定=0.05,=0.20,问应从该区高中连,问应从该区高中连续三年参加运动队的高三学生中随机抽取多少人?续三年参加运动队的高三学生中随机抽取多少人?分析:分析:根据题意,是要对样本平均数与总体平均数进行根据题意,是要对样本平均数与总体平均数进行单侧单侧的的差异差异显著性检验。显著性检验。 31第二节 总体平均数统计推断时样本容量的确定 单侧单侧=0.05的的Z0.05=1.65。在寻找在寻找=0.20相应的相应的Z值(值(Z

26、0.20)时,)时,要根据要根据0.5-0.20=0.30,从正态分布表的,从正态分布表的P列中找到与列中找到与0.30最最相近的相近的Z0.20=0.84,再将总体的标准差再将总体的标准差=100,=23,一并代入公式,于是,一并代入公式,于是1172 .1172310084. 065. 12n应随机抽取应随机抽取117117名学生。名学生。32第二节 总体平均数统计推断时样本容量的确定 2、总体、总体未知未知的情况的情况当总体当总体未知,样本平均数与总体平均数的离差统计量呈未知,样本平均数与总体平均数的离差统计量呈t分分布布。当对样本平均数与总体平均数的差异进行显著性检验时,。当对样本平均

27、数与总体平均数的差异进行显著性检验时,需用下式通过需用下式通过尝试尝试来确定样本容量来确定样本容量2Sttn(单侧)(14.6) 22/Sttn(双侧) (14.7) n所需样本容量;t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值S总体的标准差的估计值最大允许误差33第二节 总体平均数统计推断时样本容量的确定 例如例如某区各校初二劳技课内容之一,就是要到区劳技中心学习纺某区各校初二劳技课内容之一,就是要到区劳技中心学习纺织一周,历届初二学生编织一只小篮子约需织一周,历届初二学生编织一只小篮子约需30分钟,总体标分钟,总体标准差估计值准差估计值S=4,为了检验

28、应届学生编织一只小篮子所用平,为了检验应届学生编织一只小篮子所用平均时间与历届学生是否相同,确定均时间与历届学生是否相同,确定=0.05,=0.10,=-0=1.6,问需从应届学生中抽取多少人?,问需从应届学生中抽取多少人?分析分析根据题意,是要对样本平均数与总体平均数进行差异显著性根据题意,是要对样本平均数与总体平均数进行差异显著性检验。由于总体标准差检验。由于总体标准差未知未知,并且没有资料说明应届比历,并且没有资料说明应届比历届平均用时是高还是低,故要用届平均用时是高还是低,故要用双侧双侧检验的公式(检验的公式(14.7)进)进行行尝试尝试以确定样本容量。以确定样本容量。34第二节 总体

29、平均数统计推断时样本容量的确定 首先首先根据根据df=,=0.05,查,查t值表值表P(2),寻得双侧,寻得双侧t()0.05=1.96,仍用仍用t值表值表P(1)寻得寻得df=,=0.10的的t()0.10=1.2816,并将并将S=4,=1.6一并代入公式(一并代入公式(14.7),则),则667 .656 . 142816. 196. 12n35第二节 总体平均数统计推断时样本容量的确定 然后然后根据根据df=66-1=65,查,查t值表值表P(2),寻得双侧,寻得双侧t(65)0.05=1.997,查,查t值表值表P(1),寻得,寻得=0.10的的t(65)0.10=1.295,仍代入

30、公式,则仍代入公式,则687 .676 . 14295. 1997. 12n再再根据根据df=68-1=67,查,查t值表值表P(2),寻得双侧,寻得双侧t(67)0.05=1.996,查查t值表值表P(1),寻得,寻得=0.10的的t(67)0.10=1.295,再代入公式,则,再代入公式,则687 .676 . 14295. 1996. 12n因为最后连续两次计算出的因为最后连续两次计算出的n n相等,即相等,即n n2=n=n3=68=68,故样本容量,故样本容量以以n=68n=68为宜。为宜。36第二节 总体平均数统计推断时样本容量的确定 该例可根据双侧该例可根据双侧=0.05,=0.

31、10,/S=1.6/4=0.4,查样本平均数与总体平均数差异显著性检验所需查样本平均数与总体平均数差异显著性检验所需样本容量表样本容量表,寻得寻得n=68,与用,与用公式尝试法公式尝试法计算结果完全相同。计算结果完全相同。(查表时注意:因为总体标准差(查表时注意:因为总体标准差未知,故用总体标准差估未知,故用总体标准差估计值计值S代替)代替)37第二节 总体平均数统计推断时样本容量的确定 三、三、两个样本两个样本平均数平均数差异差异显著性检验时样本容量的确定显著性检验时样本容量的确定1、两个、两个独立独立样本平均数差异显著性检验时样本容量的确定样本平均数差异显著性检验时样本容量的确定对两个独立

32、样本平均数差异进行显著性检验时,两个相应的对两个独立样本平均数差异进行显著性检验时,两个相应的总体标准差一般为总体标准差一般为未知未知,故确定样本容量的公式为:,故确定样本容量的公式为:2212Sttnn(单侧) (14.8) 38第二节 总体平均数统计推断时样本容量的确定 (双侧) (14.9) 22/212Sttnnn1和n2n1=n2时两个样本的容量;t值置于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值S总体的标准差的估计值(假定S1=S2=S)最大允许误差39第二节 总体平均数统计推断时样本容量的确定 例如例如拟考查重点中学在全市统一举行的计算机基础知识合

33、格证书拟考查重点中学在全市统一举行的计算机基础知识合格证书考试中平均分数是否高于一般中学考试中平均分数是否高于一般中学8分(分(),确定),确定=0.01,=0.10,根据经验,两类学校成绩的标准差相等,根据经验,两类学校成绩的标准差相等,S1=S2=9,问样本容量应为多少?问样本容量应为多少?分析分析根据题意,需对重点中学及一般中学此次考试成绩进行根据题意,需对重点中学及一般中学此次考试成绩进行单侧单侧的的独立独立样本平均数样本平均数差异差异显著性检验。显著性检验。40第二节 总体平均数统计推断时样本容量的确定 首先首先根据根据df=,=0.01,查,查t值表值表P(1),寻得单侧,寻得单侧

34、t()0.01=2.3263,仍用仍用t值表值表P(1)寻得寻得df=,=0.10的的t()0.10=1.2816,并将并将S=9,=8一并代入公式(一并代入公式(14.8),则),则339 .32892816. 13263. 222)1(2)1(1 nn41第二节 总体平均数统计推断时样本容量的确定 然后然后根据根据df=n1+n2-2=33+33-2=64,查,查t值表值表P(1),寻得单侧寻得单侧=0.01的的t(64)0.01=2.386,查,查t值表值表P(1),寻得寻得=0.10的的t(64)0.10=1.295,仍代入公式,则,仍代入公式,则343 .3489295. 1386.

35、 222)2(2)2(1 nn再根据再根据df=n1+n2-2=34+34-2=66,查,查t值表值表P(1),寻得单侧寻得单侧=0.01的的t(66)0.01=2.385,查,查t值表值表P(1),寻得寻得=0.10的的t(66)0.10=1.295,仍代入公式,则,仍代入公式,则343 .3489295. 1385. 222)3(2)3(1 nn因为最后连续两次计算出的因为最后连续两次计算出的n1(2)=n2(2)= n1(3)=n2(3) =34,所以需,所以需从重点中学及一般中学各抽从重点中学及一般中学各抽34人。人。42第二节 总体平均数统计推断时样本容量的确定 该例也可根据单侧该例

36、也可根据单侧=0.01,=0.10,/S=8/9=0.89,查两个样本平均数差异显著性检验所需样本查两个样本平均数差异显著性检验所需样本容量表容量表,寻得寻得n1=n2= 34.8,与用公式尝试法计算结果相近。,与用公式尝试法计算结果相近。(查表时注意:因为总体标准差(查表时注意:因为总体标准差未知,故用总体标准差估未知,故用总体标准差估计值计值S代替)代替)43第二节 总体平均数统计推断时样本容量的确定 2、两个、两个相关相关样本平均数样本平均数差异差异显著性检验时样本容量的确定显著性检验时样本容量的确定对于同一组对象实验前后在同一个测验上的两组分数,对于同一组对象实验前后在同一个测验上的两

37、组分数,或者对于由于各中条件基本相同的原则匹配成对的两组或者对于由于各中条件基本相同的原则匹配成对的两组对象,施以不同实验之后统一测验的两组分数,对象,施以不同实验之后统一测验的两组分数,进行平均数差异显著性检验时所需样本容量的计算公式为:进行平均数差异显著性检验时所需样本容量的计算公式为:44第二节 总体平均数统计推断时样本容量的确定 进行平均数差异显著性检验时所需样本容量的计算公式为:进行平均数差异显著性检验时所需样本容量的计算公式为:2dSttn22/dSttn(双侧) (14.11) (单侧) (14.10) n所需样本容量(即前后测所针对的同一组对象的人数或匹配成对的对子数);t值置

38、于t分布一端时相应的t值t/2值置于t分布两端时相应的t值t与值相对应的t值Sd每对数据之差的总体标准差的估计值最大允许误差45第二节 总体平均数统计推断时样本容量的确定 例如例如为了考查在一个月之内,每天进行半小时英语听力训练的效为了考查在一个月之内,每天进行半小时英语听力训练的效果,拟对随机抽取的一组学生训练前后同一听力内容的测验果,拟对随机抽取的一组学生训练前后同一听力内容的测验结果,进行平均数差异的显著性检验。根据同类实验结果表结果,进行平均数差异的显著性检验。根据同类实验结果表明,实验前后成绩之差的标准差明,实验前后成绩之差的标准差Sd=10,若确定单侧,若确定单侧=0.05,=0.

39、10,最大允许误差,最大允许误差=4.2,问应抽多少人?,问应抽多少人?分析分析根据题意,需用公式(根据题意,需用公式(14.10)对自身对照的两组分数进行)对自身对照的两组分数进行单侧单侧的的相关相关样本平均数差异显著性检验。样本平均数差异显著性检验。46第二节 总体平均数统计推断时样本容量的确定 首先首先根据根据df=,单侧,单侧=0.05,=0.10,查,查t值表值表P(1),寻得,寻得单单侧侧t()0.05=1.6449,及,及=0.10的的t()0.10=1.2816,并将,并将Sd=10,=4.2一并代入公式(一并代入公式(14.10),则),则496 .482 . 4102816

40、. 16449. 121n然后然后根据根据df=n-1=49-1=48,查,查t值表值表P(1),寻得单侧,寻得单侧=0.05的的t(48)0.05=1.678,=0.10的的t(48)0.10=1.300,代入公式,代入公式(14.10),则),则503 .502 . 410300. 1678. 122n47第二节 总体平均数统计推断时样本容量的确定 再再根据根据df=50-1=49,查,查t值表值表P(1),寻得单侧,寻得单侧=0.05的的t(49)0.05=1.677,=0.10的的t(49)0.10=1.299,再代入公式(,再代入公式(14.10),),则则502 .502 . 41

41、0299. 1677. 123n因为最后连续两次计算出的因为最后连续两次计算出的n相等,即相等,即n2=n3=50,故应以抽,故应以抽取取50人为宜。人为宜。48第三节 总体比率统计推断及相关系数著性检验时样本容量的确定一、用样本比率一、用样本比率估计总体估计总体比率时样本容量的确定比率时样本容量的确定当总体比率接近当总体比率接近0.5,随,随n的增的增大大,样本比率的抽样分布趋向,样本比率的抽样分布趋向正态正态,这时对总体比率可,这时对总体比率可近似近似用下式进行估计。用下式进行估计。ppZppZn1122/22/(14.12) n所需样本容量Z/2值置于正态分布两端时相应的Z值最大允许误差

42、p可能出现的样本比率中最靠近50%的值49第三节 总体比率统计推断及相关系数著性检验时样本容量的确定当总体比率越接近当总体比率越接近0或或1,样本比率的抽样分布就越,样本比率的抽样分布就越偏离正态偏离正态分布分布此时从理论上说,应对此时从理论上说,应对 作反正弦的转换。作反正弦的转换。而实际上转换与未转换的结果相差而实际上转换与未转换的结果相差甚微甚微,故也可以不转换,故也可以不转换,直接用公式(直接用公式(14.12)计算。)计算。p50第三节 总体比率统计推断及相关系数著性检验时样本容量的确定例如例如某县一所高中,历届高考升学率为某县一所高中,历届高考升学率为0.55,拟估计应届高考升,拟

43、估计应届高考升学率,要求误差不超过学率,要求误差不超过3%,估计的可信度为,估计的可信度为95%,问需抽,问需抽多少人?多少人?分析分析根据题意是要对该校应届高考总体升学率作估计。其根据题意是要对该校应届高考总体升学率作估计。其p=0.55,=0.03,=0.05,其,其Z/2=1.96,将之代入上式,则,将之代入上式,则10564 .105655. 0155. 003. 096. 11222/ppZn若根据若根据p=0.55,=0.03,=0.05,查由样本比率估计总体比,查由样本比率估计总体比率所需率所需样本容量表样本容量表,寻得,寻得n=1056,与计算结果完全相同。,与计算结果完全相同

44、。51第三节 总体比率统计推断及相关系数著性检验时样本容量的确定二、二、两个样本两个样本比率差异显著性检验时样本容量的确定比率差异显著性检验时样本容量的确定对两个样本比率进行差异显著性检验时,样本容量的确定对两个样本比率进行差异显著性检验时,样本容量的确定首先需要用首先需要用 的反正弦转换表将两个样本比率转换的反正弦转换表将两个样本比率转换成成然后根据下式计算样本容量。然后根据下式计算样本容量。pparcsin252第三节 总体比率统计推断及相关系数著性检验时样本容量的确定221212ZZnn2212/212ZZnn(单侧) (14.13) (双侧) (14.14) n1和n2n1=n2时两个样本的容量;Z值置于正态分布一端时相应的Z值Z/2值分置于正态分布两端时相应的Z值Z与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论