版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 根据样本统计量对相应总体参数所作根据样本统计量对相应总体参数所作的估计叫作总体参数估计。的估计叫作总体参数估计。 总体参数估计分为点估计和区间估计。总体参数估计分为点估计和区间估计。 由样本的标准差估计总体的标准差即由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。体平均数的取值范围则为区间估计。 以样本统计量的抽样分布(概率分布)为以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称计量的值估计总体参数值的所在范围,称为总
2、体参数的为总体参数的。 对总体参数值进行区间估计,就是要在一对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的定可靠度上求出总体参数的的上的上下限。下限。 要知道与所要估计的参数相对应的样要知道与所要估计的参数相对应的样本本的值,以及样本统计量的理论的值,以及样本统计量的理论分布;分布; 要求出该种统计量的要求出该种统计量的; 要确定在多大的要确定在多大的上对总体参数上对总体参数作估计,再通过某种理论概率分布表,作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴找出与某种可靠度相对应的该分布横轴上记分的上记分的,才能计算出总体参数,才能计算出总体参数的的的上下限。的
3、上下限。 置信度,即置信度,即,是作出某种推断时正确的是作出某种推断时正确的可能性(概率)。可能性(概率)。,也称置信间距(也称置信间距(confidence interval,CI)是指在某一置信度时,总体参数)是指在某一置信度时,总体参数所在的区域距离或区域长度。所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。置信区间是带有置信概率的取值区间。 对总体平均数进行区间估计时,置信对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显这种估计还是会有犯错误的可能。显著性水平著性水平(significance
4、level)就就是指估计总体参数落在某一区间时,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号可能犯错误的概率,用符号表示。表示。 P- 通过样本的平均数估计总体的平均数通过样本的平均数估计总体的平均数,首先假首先假定该样本是随机取自一个正态分布的母总体定该样本是随机取自一个正态分布的母总体(或非正态总体中的或非正态总体中的n30的样本的样本),而计算,而计算出来的实际平均数是无数容量为出来的实际平均数是无数容量为n的样本平均的样本平均数中的一个。数中的一个。 根据样本平均数的分布理论,可以对总体平均根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。数进
5、行估计,并以概率说明其正确的可能性。1总体平均数区间估计的基本步骤根据样本的数据,计算样本的平均数和标准差;根据样本的数据,计算样本的平均数和标准差;计算平均数抽样分布的标准误;计算平均数抽样分布的标准误;确定置信概率或显著性水平;确定置信概率或显著性水平;根据样本平均数的抽样分布确定查何种统计表;根据样本平均数的抽样分布确定查何种统计表;计算置信区间;计算置信区间;解释总体平均数的置信区间。解释总体平均数的置信区间。平均数离差的的抽样分布呈正态,平均平均数离差的的抽样分布呈正态,平均数的置信区间为:数的置信区间为:nZXnZX22(91) 例题例题1:某小学:某小学10岁全体女童身岁全体女童
6、身高历年来标准差为高历年来标准差为6.25厘米,现厘米,现从该校随机抽从该校随机抽27名名10岁女童,测岁女童,测得平均身高为得平均身高为134.2厘米,试估厘米,试估计该校计该校10岁全体女童平均身高的岁全体女童平均身高的95和和99置信区间。置信区间。 解:解:1010岁女童的身高假定是从正态总体中岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标准差为抽出的随机样本,并已知总体标准差为=6.25=6.25。无论样本容量大小,一切样本平。无论样本容量大小,一切样本平均数的标准分数呈正态分布。于是可用正均数的标准分数呈正态分布。于是可用正态分布来估计该校态分布来估计该校1010岁女童
7、身高总体平均岁女童身高总体平均数数9595和和9999的置信区间。的置信区间。其标准误为其标准误为2028. 12725. 6nX当当0.95时,时,1.96因此,该校因此,该校10岁女童平均身高岁女童平均身高95的置信的置信区间为:区间为:nZXnZX205. 0205. 02725.696.12 .1342725.696.12 .134558.136842.131当当0.99时,时,2.58因此,该校因此,该校10岁女童平均身高岁女童平均身高99的置信的置信区间为:区间为:nZXnZX201. 0201. 02725.658.22 .1342725.658.22 .134303.13709
8、7.131 平均数离差的抽样分布为平均数离差的抽样分布为t分布,平均数分布,平均数的置信区间为:的置信区间为:1122nStXnStXdfdf(92) 例题例题2:从某小学三年级随机抽取:从某小学三年级随机抽取12名学生,其阅读能力得分为名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试估计该校三年。试估计该校三年级学生阅读能力总体平均数级学生阅读能力总体平均数95和和99的置信区间。的置信区间。 解:解:1212名学生阅读能力的得分假定是从名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标正态总体中抽出的随机样本,而总体标准差准差未
9、知,样本的容量较小(未知,样本的容量较小(=1230=1230n=12030),),t t分布接近于正态分布,分布接近于正态分布,因此可用正态分布近似处理。因此可用正态分布近似处理。其标准误为其标准误为1369. 01205 . 1nSX当0.95时,1.96因此,该年全部考生作文成绩因此,该年全部考生作文成绩95的置信区的置信区间为:间为:nSZXnSZX205. 0205. 01205 .196.1261205 .196.126291.26709.25当0.99时,2.58因此,该年全部考生作文成绩因此,该年全部考生作文成绩99的置信区的置信区间为:间为:nSZXnSZX201. 0201
10、. 01205 .158.2261205 .158.226383.26258.26参数估计,即不能根参数估计,即不能根据样本分布对总体平均数进行据样本分布对总体平均数进行估计估计。利用样本信息,根据一定概率,利用样本信息,根据一定概率,对总体参数或分布的某一假设作对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设出拒绝或保留的决断,称为假设检验。检验。 假设检验一般有两互相对立的假设。假设检验一般有两互相对立的假设。 H0:零假设,或称原假设、虚无假设(:零假设,或称原假设、虚无假设(null hypothesis)、解消假设;是要检验的对象之)、解消假设;是要检验的对象之间没有差异的假
11、设。间没有差异的假设。 H1:备择假设(:备择假设(alternative hypothesis),),或称研究假设、对立假设;是与零假设相对立的或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。假设,即存在差异的假设。 进行假设检验时,一般是从零假设进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假假设还是拒绝零假设、接受研究假设
12、。设。 样本统计量的值在其抽样分布上样本统计量的值在其抽样分布上出现的概率小于或等于事先规定出现的概率小于或等于事先规定的水平,这时就认为小概率事件的水平,这时就认为小概率事件发生了。把发生了。把出现概率很小的随机出现概率很小的随机事件事件称为小概率事件。称为小概率事件。 当概率足够小时,可以作为从实当概率足够小时,可以作为从实际可能性上,把零假设加以否定的际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是
13、样本,可能性是极小的,实际中是罕见的,几乎是不可能的。罕见的,几乎是不可能的。 统计学中把拒绝零假设的概率称为显著统计学中把拒绝零假设的概率称为显著性水平,用性水平,用表示。表示。 显著性水平也是进行统计推断时,可能显著性水平也是进行统计推断时,可能犯错误的概率。犯错误的概率。 常用的显著性水平有两个:常用的显著性水平有两个:0.05 和和 0.01。 图图9 91 1 正态抽样分布上正态抽样分布上0.050.05的三种不同位置的三种不同位置22 对于总体参数的假设检验,有可能犯对于总体参数的假设检验,有可能犯两种类型的错误,即两种类型的错误,即错误和错误和错误。错误。表表91 假设检验中的两
14、类错误假设检验中的两类错误H0为真为真H0为假为假拒绝拒绝H0错误错误正确正确接受接受H0正确正确错误错误 为了将两种错误同时控制在相对最小为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的的程度,研究者往往通过选择适当的显著性水平而对显著性水平而对错误进行控制,如错误进行控制,如0.05或或0.01。 对对错误,则一方面使样本容量增大,错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单另一方面采用合理的检验形式(即单侧检验或双侧检验)来使侧检验或双侧检验)来使误差得到控误差得到控制。制。 在确定检验形式时,凡是检验是否与在确定检验形式时,凡是检验是否与假设的总体一致
15、的假设检验,假设的总体一致的假设检验,被分被分散在概率分布曲线的两端,因此称为散在概率分布曲线的两端,因此称为双侧检验。双侧检验。 双侧检验的假设形式为:双侧检验的假设形式为:H0:0, H1:0 凡是检验大于或小于某一特定条件的假设检验,凡是检验大于或小于某一特定条件的假设检验,是在概率分布曲线的一端,因此称为单侧检是在概率分布曲线的一端,因此称为单侧检验。验。 单侧检验的假设形式为:单侧检验的假设形式为: H0:0,H1:0或者或者 H0:0,H1:0 一个完整的假设检验过程,一般经过一个完整的假设检验过程,一般经过四个主要步骤:四个主要步骤:提出假设提出假设选择检验统计量并计算统计量的值
16、选择检验统计量并计算统计量的值确定显著性水平确定显著性水平做出统计结论做出统计结论 总体平均数的显著性检验是指对样本总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显的显著性检验。若检验的结果差异显著,可以认为该样本不是来自当前的著,可以认为该样本不是来自当前的总体,而来自另一个、与当前总体存总体,而来自另一个、与当前总体存在显著差异的总体。即,该样本与当在显著差异的总体。即,该样本与当前的总体不一致。前的总体不一致。 总体为正态,总体标准差总体为正态,总体标准差已知已知平均数的抽样分布服从正态分布,以平均数的抽样分
17、布服从正态分布,以为检验统计量,其计算公式为:为检验统计量,其计算公式为:nXXZX00 例:某小学历届毕业生汉语拼音测验平例:某小学历届毕业生汉语拼音测验平均分数为均分数为66分,标准差为分,标准差为11.7。现以同。现以同样的试题测验应届毕业生(假定应届与历样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为份试卷,算得平均分为69分,问该校分,问该校应届与历届毕业生汉语拼音测验成绩是否应届与历届毕业生汉语拼音测验成绩是否一样?一样? . . 提出假设提出假设 H0:0, H1:0或或 H0:66, H1:66
18、 . .选择检验统计量并计算统计量的值选择检验统计量并计算统计量的值学生汉语拼音成绩可以假定是从正态总学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已知,体中抽出的随机样本。总体标准差已知,样本统计量的抽样分布服从正态,以样本统计量的抽样分布服从正态,以Z为检验统计量为检验统计量 计算计算187 .116669 09. 1nXZ0 . .确定显著性水平和检验形式确定显著性水平和检验形式显著性水平为显著性水平为=0.05,双侧检验,双侧检验 . .做出统计结论做出统计结论 查表得查表得Z=1.96,而计算得到的,而计算得到的Z=1.09 |Z|,则概率,则概率P0.05 差异不
19、显著差异不显著,应在应在0.05显著性水平接受零假设显著性水平接受零假设 结论结论:该校应届毕业生与历届毕业生汉语拼音测该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。验成绩一致,没有显著差异。 Z 与临界值比与临界值比较较 P值值 显著性显著性 检验结果检验结果 Z 1.96P0.05不显著不显著保留保留H0,拒绝,拒绝H11.96 Z 2.580.05P0.01显著显著在在0.05显著性显著性水平拒绝水平拒绝H0,接受接受H1 Z 2.58P0.01极其显著极其显著在在0.01显著性显著性水平拒绝水平拒绝H0,接受接受H1 Z 与临界值比与临界值比较较 P值值 显著性显著性
20、检验结果检验结果 Z 1.65P0.05不显著不显著保留保留H0,拒绝,拒绝H11.65 Z 2.330.05P0.01显著显著在在0.05显著性显著性水平拒绝水平拒绝H0,接受接受H1 Z 2.33P0.01极其显著极其显著在在0.01显著性显著性水平拒绝水平拒绝H0,接受接受H1 平均数的抽样分布服从平均数的抽样分布服从t分布,以分布,以t为为检验统计量,计算公式为:检验统计量,计算公式为:100nSXXtX1 ndf t 与临界值比与临界值比较较 P值值 显著性显著性 检验结果检验结果 t t(df)0.05/2P0.05不显著不显著保留保留H0,拒绝,拒绝H1t(df)0.05/2 t
21、 t(df)0.01/20.05P0.01显著显著在在0.05显著性显著性水平拒绝水平拒绝H0,接受接受H1 t t(df)0.01/2P0.01极其显著极其显著在在0.01显著性显著性水平拒绝水平拒绝H0,接受接受H1 t 与临界值比与临界值比较较 P值值 显著性显著性 检验结果检验结果 t t(df)0.05P0.05不显著不显著保留保留H0,拒绝,拒绝H1t(df)0.05 t t(df)0.010.05P0.01显著显著在在0.05显著性显著性水平拒绝水平拒绝H0,接受接受H1 t t(df)0.01P0.01极其显著极其显著在在0.01显著性显著性水平拒绝水平拒绝H0,接受接受H1
22、例:某区初三英语统一测验平均例:某区初三英语统一测验平均分数为分数为65,该区某校,该区某校20份试卷的份试卷的平均分数为平均分数为69.8,标准差为,标准差为9.234。问该校初三年级英语平均。问该校初三年级英语平均分数与全区分数与全区是是否一样?否一样? 例:某校上一届初一学生自学能力平例:某校上一届初一学生自学能力平均分数为均分数为38,这一届初一,这一届初一24个学生自个学生自学能力平均分数为学能力平均分数为42,标准差为,标准差为5.7,假定这一届初一学生的学习条件与上一假定这一届初一学生的学习条件与上一届相同,试问这一届初一学生的自学能届相同,试问这一届初一学生的自学能力是否力是否
23、高于高于上一届?上一届? 平均数的抽样分布服从平均数的抽样分布服从t分布,但由分布,但由于样本容量较大,平均数的抽样分于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用布接近于正态分布,因此可以用Z代代替替t近似处理,计算公式为:近似处理,计算公式为:nSXXZX00 例例5:某年高考某市数学平均分数为:某年高考某市数学平均分数为60,现从参加此次考试的文科学生中,随机现从参加此次考试的文科学生中,随机抽取抽取94份试卷,算得平均分数为份试卷,算得平均分数为58,标准差为标准差为9.2,问文科学生的数学成绩,问文科学生的数学成绩与全市考生是否相同?与全市考生是否相同? 总体标准差已知条
24、件下,平均数之总体标准差已知条件下,平均数之差的抽样分布服从正态分布,以差的抽样分布服从正态分布,以作为检验统计量,计算公式为:作为检验统计量,计算公式为: XDSEXXZ21nrXXZ21222121222212121nnXXZ 总体标准差未知条件下,平均数之差总体标准差未知条件下,平均数之差的抽样分布服从的抽样分布服从t分布,以分布,以t作为检验作为检验统计量,计算公式为:统计量,计算公式为:XDSEXXt21(114) 还可以计算为还可以计算为1221222121nSSrSSXXt1 ndf1/2221nnnddXXt(115) (116) 1 ndf(117)2121212222112
25、12nnnnnnSnSnXXt221nndf序号序号实验组实验组X1对照组对照组X2d=X1-X212345678910937291658177898473707674805263628285647217-211131815 7-1 9-2289 4121169324225 49 1 81 4总和总和7957108512672d 还可计算为还可计算为456.31101010/851267715 .7921/2221nnnddXXt 例例3:从高二年级随机抽取两个小组,在化学从高二年级随机抽取两个小组,在化学教学中实验组采用启发探究法,对照组采用传教学中实验组采用启发探究法,对照组采用传统讲授法
26、教学。后期统一测试,结果为:实验统讲授法教学。后期统一测试,结果为:实验组组10人平均成绩为人平均成绩为59.9,标准差为标准差为6.640;对;对照组照组9人平均成绩为人平均成绩为50.3,标准差为,标准差为7.272。问两种教学方法是否有显著性差异?(根据已问两种教学方法是否有显著性差异?(根据已有的经验,启发探究法优于传统讲授法)有的经验,启发探究法优于传统讲授法) 1提出假设H0:12 H1: 12 2选择检验统计量并计算两组化学测验分数假定是从两个正态总体中随机抽两组化学测验分数假定是从两个正态总体中随机抽出的独立样本出的独立样本, 两总体标准差未知,经方差齐性两总体标准差未知,经方
27、差齐性检验两总体方差齐性,两样本容量小于检验两总体方差齐性,两样本容量小于30。因。因此平均数之差的抽样分布服从此平均数之差的抽样分布服从t分布,应以分布,应以t为检为检验统计量,计算。验统计量,计算。9109102910272. 79640. 6103 .509 .5922835.2212121222211212nnnnnnSnSnXXt 2检验(检验(chi-square test)是专门用于)是专门用于数据的统计方法。数据的统计方法。由于这类数据在整理时,常常以由于这类数据在整理时,常常以(contingency table)或交叉表)或交叉表(cross tabulation)呈现,因
28、此这种)呈现,因此这种分析方法又被称为列联表分析或交叉分析方法又被称为列联表分析或交叉表分析。表分析。 1 12 2分布分布 2分布是统计学中应用较多的一种抽样分分布是统计学中应用较多的一种抽样分布。布。 2值是从同一总体中随机抽取的无限多个值是从同一总体中随机抽取的无限多个容量为容量为 n 的样本数据的平方和或标准分数的样本数据的平方和或标准分数的平方和,即的平方和,即22X222X或或此时此时2分布的自由度为分布的自由度为dfn。此时,此时,2分布的自由度为分布的自由度为df n1。22222SnXX相相对对频频数数图图15151 1 几种不同自由度的几种不同自由度的2 2分布曲线(分布曲
29、线(0.050.05)n=1n=4n=10n=202显而易见,显而易见,2 2检验主要应用的检验主要应用的是右侧概率。是右侧概率。2分布呈分布呈,曲线的右侧无限延,曲线的右侧无限延伸,但不与基线相交。伸,但不与基线相交。2值都是值都是。2分布的分布的也是也是2分布。分布。2分布随分布随的变化而不同。自由的变化而不同。自由度越小,曲线偏斜度越大;自由度越大,度越小,曲线偏斜度越大;自由度越大,分布形态越趋于对称。分布形态越趋于对称。 2检验用于对点计而来的检验用于对点计而来的数据数据资料进行假设检验,对总体的资料进行假设检验,对总体的不不做要求,也不对总体做要求,也不对总体进行推论。进行推论。2
30、检验主要是对总体的数据分布进行检验主要是对总体的数据分布进行假设检验,因此属于自由分布的非参假设检验,因此属于自由分布的非参数检验。数检验。 这一公式是根据这一公式是根据1899年统计学家皮尔逊年统计学家皮尔逊推导的配合适度的理论公式而来。这是与推导的配合适度的理论公式而来。这是与前述前述2分布非常近似的次数分布。当分布非常近似的次数分布。当 f e 越越大时,其接近的越好。大时,其接近的越好。(151) eefff2022值具有可加性;值具有可加性;2永远是正值;永远是正值;2的大小随实际频数与理论频数差的大小随实际频数与理论频数差的大小而变化。两者之差越小,说明样的大小而变化。两者之差越小,说明样本分布与假设的理论分布越一致;两者本分布与假设的理论分布越一致;两者之差越大,说明样本分布与假设的理论之差越大,说明样本分布与假设的理论分布越不一致。分布越不一致。理论频数也理论频数也称为期望次数称为期望次数。把实得的点计数据只按一种分类标准把实得的点计数据只按一种分类标准编制成表就是单向表。对单向表的数编制成表就是单向表。对单向表的数据所进行的据所进行的2检验,称为单向表的检验,称为单向表的2检验,也称为配合度检验检验,也称为配合度检验(goodness of fit test)。)。单向表中只有一个变量,被按一定标单向表中只
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大学物理完整全套教学课件
- 2025年湖南省邵阳市八年级地生会考题库及答案
- 2025年广东湛江市初二学业水平地理生物会考真题试卷(+答案)
- 2025年湖北省十堰市八年级地理生物会考真题试卷(含答案)
- GPT-5.5官方技术文档(中文)
- 第18课《在长江源头各拉丹冬》 课件 2025-2026学年统编版语文八年级下册
- 外科护理课件制作中的智能化管理
- 2026版企业知识产权许可合同样本
- 项目合作合同关键条款解析
- 关于大学生思想动态及安全的舆情报告9月2026(2篇)
- 2026年江苏海事职业技术学院教师招聘考试备考题库及答案解析
- 2026四川泸州市泸县第一次考试选调机关事业单位工作人员53人农业笔试备考试题及答案解析
- 2026北京昌平区事业单位考试真题
- 2026北京海淀高三一模语文(含答案)
- 【招考】2025年下半年北京海淀区事业单位公开招聘笔试历年典型考题及考点剖析附带答案详解
- 2026湖北恩施州消防救援局政府专职消防员招聘38人考试参考题库及答案解析
- 建设目标责任制度
- 萤石矿采选工程初步设计
- 路灯安装安全文明施工方案
- 未来五年干燥花行业跨境出海战略分析研究报告
- YY/T 0573.2-2025一次性使用无菌注射器第2部分:动力驱动注射泵用注射器
评论
0/150
提交评论