版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学统计学单样本显著性检验第1页/共38页第10章单样本显著性检验10.1导论:平均数的抽样分布1.如何比较抽样分布的均数与样本来自的总体均数?2.当增加抽样分布的样本量时,样本平均数如何变化?例1:大学生艾滋病知识问卷测试。设总体μ=50,σ=10。有多少大学生在40分到60分之间呢?图10-1a有68%的大学生测试分数在40-60分之间第2页/共38页随机抽取一个大样本,其个体分数的分布见图10-1(a)如果抽取样本量N=3的100个个样本,计算每个样本平均数,图10-1b包含68%的样本均数,每个样本平均数会是一样吗?第3页/共38页如果抽取N=20的100个个样本,计算每个样本平均数,图10-1c样本平均数与总体平均数相差较小如果抽取样本容量N=40的100个样本,计算每个样本平均数,图10-1d样本平均数与总体平均数相差更小第4页/共38页从总体抽取一个样本的分布总面积的68%=个体分数方差
样本平均数的分布总面积的68%=样本均数的方差=样本均数的标准差第5页/共38页样本平均数的平均数的标准差,就称为均数的标准误(standarderrorofmean),如果总体标准差已知,则标准误:10-1如果总体标准差未知,则标准误:10-2无论总体标准差已知还是未知,标准误的大小取决于总体的变异与样本大小。标准误=第6页/共38页μ=50σ=2总体中个体分数小样本大样本第7页/共38页10.2统计假设检验:已知总体均数和标准差图a,知总体μ和σ,从中抽取大量样本,见图b图b,可以描述这些大量样本的平均数和标准差,可用来确定正态曲线下的概率值。图c,通过已知正态分布的概率关系,可计算任意一个样本的平均数有关的概率第8页/共38页10.2.1样本平均数落在特定区间的概率
如前述,任一正态变量都可转化为标准正态分布,可根据z分数与正态曲线下的面积关系求概率
换言之,任给一个原始分数,只要知道该分数之外的面积比例,就可以知道与此相应的z值。
同理,任给一个样本平均数,只要知道该平均数之外的面积比例,就可以知道与此相应的z值=2/2=1P(z≥1)=0.1587例2:已知μ=50,σ=10,从该总体随机抽取一个N=25的样本,问该≥52的概率为多少?P(48≤X≤52)=P(-1≤z≤1)=2×0.34=68%第9页/共38页10.2.2样本平均数的假设检验例3:一所学校对四个班的教学进行为期一年的计算机阅读教学。已知测验的常模为μ=250,σ=50,一年后进行测验,从四个班随机抽查100人,=263,试问传统教学与计算机教学有无差异?1.H0:μ=μ0=250,2.H1:μ≠2503.统计检验:因为σ已知,所以使用z检验4.显著性水平:α=0.01双尾5.抽样分布:正态概率曲线6.拒绝H0的临界区间:|z|≥2.58第10页/共38页Z面积尾部2.5800.49510.0049Z面积尾部2.330.49010.0099Z面积尾部1.9600.47500.0250Z面积尾部1.640.44950.0505第11页/共38页因为|z|>2.58,所以P<0.01,拒绝H0,差异有统计学意义。所在四个班级平均分不同于250分的总体。犯错误的风险为0.01。例3:一所学校对四个班的教学进行为期一年的计算机阅读教学。已知测验的常模为μ=250,σ=50,一年后进行测验,从四个班随机抽查100人,=263,试问传统教学与计算机教学有无差异?第12页/共38页10.3通过样本数据进行参数估计—点估计人口普查中的资料可以获得总体信息,多数情况不能获得总体信息,尽管如此,我们仍然可以采用样本统计量推测总体参数。实际工作中是抽取单一样本,利用样本统计量对总体进行的估计称为点估计。已知方差用方差描述样本的变异有没有问题?没有问题第13页/共38页再问:用方差估计总体方差有没有问题?答:有问题,一般地,样本方差估计总体方差是偏低的。如果用大样本估计总体方差,得到的是无偏估计:σ2的无偏估计:10-4σ的无偏估计:10-5因此,平均数抽样分布的总体方差估计值:10-6第14页/共38页平均数抽样分布的标准误:10-7或者如果选择有偏S2
而非无偏估计,常常采用:10-8行为科学常常采用公式10-8,我们遵循这一公式第15页/共38页表10-1温习平均数、方差和标准差的符号
Sσ标准差
S2σ2σ2方差μ,μ0平均数样本统计量(经验上的)总体参数(理论上的)平均数抽样分布的无偏总体估计(经验上的)平均数的抽样分布参数(理论上的)第16页/共38页图10-6样本数据可以用来估计总体方差(σ2)的无偏估计以及平均数的标准误,样本方差越大,总体方差的估计值和平均数的估计标准误也越大样本数据或第17页/共38页10.4参数未知时统计假设检验—t检验如果总体方差已知,用如果总体方差未知,用图10-7当自由度=3,10和∞时,t分布于标准正态分布的比较第18页/共38页注:自由度是指对一组数据进行一定的控制之后,可以自由变化的数据个数。假设有四个数:18、23、27、32,和是多少?平均数是多少?这四个数的和是100,平均数是=25(18-25)+(23-25)+(27-25)+(32-25)=(-7)+(-2)+2+7=0如果必须根据平均数计算离差,那么只有第四个固定,其他三个可以自由变化。自由度f=4-1=3第19页/共38页
推而广之:任意一个样本,我们对它只有一个限制条件,那么这个样本的自由度就是N-1,今后我们使用t
分布进行各种检验,会用各种不同的自由度。
需要说明的是,t检验是一种稳健的检验,这就意味着即使总体分布严重偏离正态分布,t检验的统计推论也是相当有效的,这个结论是由中心极限定理决定的。我们我们怀疑分布是否符合正态性,明智的做法是增加样本量。10.4.1t分布的特点t分布与标准正态分布一样,关于平均数0对称。t分布的离散程度比正态分布大第20页/共38页|z|≥1.96拒绝区域面积5%|t|≥1.96拒绝区域面积15%见图10.8当σ未知时,用z检验代替t检验,会冒很大的风险去拒绝一个真实的虚无假设,所以犯Ⅰ类错误的危险非常大。增大t值可以界定出拒绝区域,临界值为3.182。0.05的拒绝区域:|t|≥3.182第21页/共38页t分布的临界值表与正态分布不同,t分布的临界值(criticalvalue)是指与各种显著性水平相对应的临界值区域的对应值。查表时,先找到df=3,按双尾α=0.05往下找到临界值t=3.182。一旦算的的t值大于3.182,就拒绝H0.第22页/共38页10.4.2σ未知时的统计假设检验:单样本情况例4:一所学校对全校教学进行测验。如果测验的分数低于250,可获得政府部门的拨款,从全校随机随机抽查10人进行测验,结果=243.3,标准差S=5.1,试问全校平均分与250有无差异?能否获得拨款?1.H0:μ=μ0=2502.H0:μ≠2503.统计检验:因为σ未知,所以使用t检验4.显著性水平:α=0.05,双尾5.抽样分布:自由度df=10-1=9的t分布6.拒绝H0的临界区间:|t|≥2.262第23页/共38页因为t=-3.94,|t|>2.262,所以拒绝虚无假设,按照α=0.05双尾的显著性水平差别有统计学意义,可以认为该校测验平均分数低于250。可以获得政府拨款。第24页/共38页10.5参数估计:区间估计除了点估计。推论统计还包括区间估计。区间估计(intervalestimation)是指包括总体真值的范围所作的估计。例5:成都电视台8月初报道有1名13岁的肥胖儿童名叫浩浩的,体重达到230斤,假如你不知道他的真实体重,你凭什么猜测他的体重呢?你有多大把握说他的体重是230斤呢?一般是通过观察,凭借印象猜测他是200斤,这个就叫“点估计”,如果猜测体重大约在200~240斤,就称为区间估计。第25页/共38页10.6置信区间与置信限总体均数真值落入的区间,就称为置信区间。(confidenceinterval),置信界限称为置信限(confidencelimit),α=0.05的置信区间称为95%的置信区间。α=0.01的置信区间称为99%的置信区间。例5在例4中,已知,N=10,计算总体测验分数95%的置信区间。
所以μ0的下限==243.3-2.262×1.7=243.3-3.85=239.45上限=243.3+3.85=247.15第26页/共38页解释置信区间需注意的问题:在计算总体均数可能落入的区间时,我们不知道计算的样本平均数正确的概率有多大,也就不能够确定总体均数为μ的概率是95%还是99%。我们计算的概率不是针对总体均数,而是针对区间内包含总体均数的概率。从总体中重复抽取100个样本,理论上有95的区间包含总体均数,大约有5个不包含。这里的C表示总体均数的置信区间,而非概率第27页/共38页10.7Pearson相关系数r的检验:单个样本回忆下,相关系数在什么范围?|r|≤1,r=±1,完全相关,r=0,不相关对于单个样本,假设H0:ρ=0图10-9,ρ=-0.8,ρ=0,ρ=+0.8相关系数的抽样分布第28页/共38页10.7.1总体相关系数ρ=0时的假设检验10-11df=N-2,为什么?例6社会心理学家编制了一份测量人们是否服从权威的量表,对15名被试进行了测试,其得分与另外一个对少数群体歧视的调查量表得分相关。两组得分的相关系数r=0.6,即对权威服从的得分越高,对少数群体的歧视就越厉害,这个相关系数是否来自于ρ=0的总体呢?1.H0:ρ≤02.H0:ρ>03.统计检验:自由度=N-2,使用t检验第29页/共38页4.显著性水平:α=0.05,单尾检验5.抽样分布:自由度df=15-2=13的t分布6.拒绝H0的临界区间:t0.05≥1.771,如果t>1.771,拒绝H0。因为t>1.771,它落入了拒绝H0的临界区间,所以拒绝H0,这两个得分的总体相关系数大于零。10.7.2等级相关系数rS
的假设检验:单样本第30页/共38页问题:假如你是一名教师,你对“智力与领导力是相关变量”抱有质疑,没有适当的度量测量领导力,但是可以对领导力加以排序,从而组成顺序量表如下。智123456789101112131415领429171081353116121514D-30-63-2-4-1-547061-11D2903694161251649036111试问:r=0.64的相关系数是否是显著的?第31页/共38页因为r=0.64>0.521拒绝H0,智力水平与领导角色显著相关。统计表的来源:*ReporducedwithkindpermissionfromS.KokoskaandD.Zwillinger.1999.ProbabillityandStatisticsTablesandFormulae,Chapman&Hall/CRC,BocaRaton,Florida,188.查Spearman秩相关系数rs
的临界值表注意:有些表没有N=15的r,用内插法,(0.538+0.503)/2=0.521第32页/共38页10.8案例2.H0:μ≠1003.统计检验:因为σ已知,所以使用z检验4.显著性水平:α=0.01,双尾5.抽样分布:正态分布6.拒绝H0的临界区间:|z|≥2.581.H0:μ=100某公司欲招聘几百名装配工去组装高精度仪器的小型部件,这个工作要求手眼协调能力高。在例行体检中,发现有30名服用了大麻。于是对这30名进行一种手的灵敏度测验,已知测验常模为μ=100,σ=15,应聘者=92,S=10.第33页/共38页因为z=-2.92<-2.58,P<0.05,按双尾α=0.05,拒绝H0,这30名体检阳性者应聘成绩不如更大总体中随机抽取的样本中的期望成绩。注意:这个检查结果虽然支持了你的怀疑,但是实验设计并不严密,该研究没有设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 帽子厂合同范本
- 店宝宝合同协议
- 影楼承揽合同范本
- 生鲜零售 + 餐饮联营合同
- 儿科远程诊疗合同(2025年)
- 短视频版权转让合同协议
- 2025年揭阳市市直卫生健康事业单位赴外地院校公开招聘工作人员备考题库及答案详解参考
- 广西壮族自治区工业和信息化厅直属部分科研事业单位2025年度公开招聘工作人员备考题库及一套答案详解
- 2025年日喀则市人民医院关于面向社会招聘编制外医务人员的备考题库及完整答案详解1套
- 2025年池州东至县医疗保障局所属事业单位公开选调工作人员备考题库及一套参考答案详解
- 食叶草种植可行性报告
- 落叶清扫压缩机设计答辩
- 广东省建筑装饰装修工程质量评价标准
- 珍爱生命活在当下-高一上学期生命教育主题班会课件
- 湖北省武汉市洪山区2023-2024学年八年级上学期期末数学试题
- 应用写作-终结性考核-国开(SC)-参考资料
- 场地租凭转让合同协议书
- 口腔科科室建设规划
- 动物活体成像技术
- 新教科版科学四年级上册分组实验报告单
- 雷达截面与隐身技术课件
评论
0/150
提交评论