版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第六章 参数估计与假设检验Welcome第一节 参数估计了解抽样误差的重要性总体同质、个体变异总体参数未知样本代表性、抽样误差随机抽样样本统计量已知统计推断风 险抽样误差sampling error由抽样引起的样本统计量与总体参数间的差别原因:个体变异抽样表现样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是不可避免的!控制其大小的最实际的办法是:增大样本量假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律抽样分布规律正态分布总体偏三角分布总体均匀分布总体指数分布总体双峰分布总体均数的模拟试验抽样分布规律 = 5.0 = 0.5样本含
2、量n =10抽样次数m =100 =5.19 S =0.42 =5.04 S = 0.44 =5.03 S =0.52Fractionx2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3图 正态分布N(5.00,0.502)总体分布表4、1 N(5.00,0.502)总体中11个随机样本的数据(n=10)结论 1各样本均数未必等于总体均数;样本均数间存在差异;由抽样实验所得的100个样本作出其均数分布直方图如图 。曲线是对抽样得到的100个 数据拟合的分布曲线。 Fraction2.52.83.13.43.744.34.64
3、.95.25.55.86.16.46.777.37.67.90.1.2.3.4.5.6.7.8.91图从正态分布N(5.00,0.502)总体中抽样样本均数的分布 图 从正态分布N(5.00,0.502)总体中抽样样本均数的分布 Fraction4.14.44.755.35.65.90.1.2.3.4.5结论2 的分布很有规律,围绕着,中间多,两边少,左右基本对称;样本均数的变异范围较之原变量的变异范围大大缩小;中心极限定理(central limit theorem) (一)从均数为、标准差为 的正态总体中,独立随机抽取例数为n的样本,样本均数 的分布服从正态分布;样本均数的均数为 ;样本均
4、数的标准误 抽样分布 抽样分布示意图中心极限定理 (二)从非正态(non-normal)分布总体(均数为,标准差为)中随机抽样(每个样本的含量为n),可得无限多个样本,每个样本计算样本均数,则只要样本含量足够大(n50),样本均数也近似服从正态分布。样本均数的均数为 样本均数的标准误为 二、标准误(standard error)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度当总体标准差未知时,用样本标准差代替,前者称为理论标准误,后者称为样本标准误。二、标准误例 在某地随机抽查100名7岁男童,测得其身高的样本均数124cm,标准差4.6cm
5、,试估计其标准误标准误的用途反映抽样误差大小 标准误是表示样本均数变异程度反映均数的可靠性 标准误越大,样本均数抽样误差就越大,用样本均数推断总体均数的可靠性就越差; 标准误越小,样本均数抽样误差就越小,用样本均数推断总体均数的可靠性就越好。标准误可用于计算总体均数的可信区间,可用于有关总体均数的假设检验。与样本含量的关系n 越大,均数的均数就越接近总体均数;n 越大,变异越小,分布越窄;与标准差的关系1、意义上标准差描述个体值之间的变异,即观察值间的离散程度;而标准误是描述统计量的抽样误差,即样本统计量和总体参数的接近程度;2、用途上标准差常用于表现观察值的波动范围;标准误常表示抽样误差的大
6、小,误差小,样本均数与总体均数更接近。3、与样本含量标准差是随着样本含量的增多,逐渐趋于稳定。标准误是随着样本含量的增多,逐渐减少。区别与标准差的关系首先,标准差和标准误都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。其次,当样本含量不变时,标准差大,标准误亦越大,均数的标准误与标准差成正比。联系正态分布的标准化变化若 X N(,2) , 则 。 因 ,则 。 t 分布从正态分布总体中1000次抽样的 z 值的分布(n=4)Fractionz-4-3-2-1012340.05.1.15.2均数为 0.007559标准差为 1.006294 t 分布的概念实际工作中,总体
7、方差未知。所以,用样本方差代替总体方差此时 的分布如何?从正态分布总体中1000次抽样的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均数为 0.05696标准差为 1.55827 用样本方差代替总体方差,此时不服从正态分布,服从t分布1908年,W.S.Gosset (1876-1937)以笔名Student发表了著名的t分布,证明了:设从正态分布N(,2)中随机抽取含量为n的样本,样本均数和标准差分别为 和 s,设:则t值服从自由度(v)为n-1的t分布(t-distribution)t 分布的概念记为:, v=n-1图 自由度分别为
8、1、5、时的t分布t分布图形 f(t) =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3t分布的特征t分布是一簇曲线,当不同时,曲线形状不同;单峰分布,以0为中心,左右对称;当逼近时,t分布逼近z分布,故标准正态分布是t分布的特例;t分布曲线下面积是有规律的-t /2,v0t /2,v/2/2双侧概率t分布曲线下面积规律P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t0(山区的成年男子脉搏均数高于一般男子的脉搏均数) 0=9.3cm2.计算统计量一、单样本t 检验 3.确定P 值和做出推断结论 查附表2的t界值表,单侧界值t0.05,11=1.796,
9、t 0.05,不拒绝H0,差异无统计学意义,尚不能认为该山区男婴的双顶径大于一般男婴双顶径一、单样本t 检验 二、配对t检验又称成对t检验,适用于配对设计的定量资料什么是配对设计同一批受试对象治疗前后某些生理、生化指标的比较;同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;配对动物试验,各对动物试验结果的比较等配对设计得到的资料称配对资料二、配对t检验先求出各对子的差值d的均值, 若两种处理的效应无差别,理论上差值d 的总体均数应为0。所以这类资料的比较可看作是样本均数与总体均数为0的比较。要求差值的总体分布为正态分布二、配对t检验1、建立检验假设,确定检验水准H0:d=0饮用
10、咖啡前后运动者得平均心肌血流量无差异 H1: d 0双侧=0.05 二、配对t检验3. 确定P值,做出推断结论以v=11,查附表2,t界值表,双侧t0.05/2,11=2.2013.738P0.05按0.05的检验水准,拒绝H0,接受H1,差别有统计学意义,认为饮用咖啡前后运动者得平均心肌血流量存在差异三、完全随机设计两样本比较的t检验两本均数比较的t检验亦称为成组t检验,又称为独立样本t检验(independent samples t-test)适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数是否相等 当两样本含量较小且均服从正态分布时,要根据总体方差相等与
11、否采用不同检验方法(一)总体方差相等的t检验总体方差相等( )的t检验 需计算合并方差 其中 为两样本均数差值的标准误例 测得14名慢性支气管炎病人与11名健康人的尿中17酮类固醇(mol/24h)排出量如下,试比较两组人的尿中17酮类固醇的排出量有无不同。病 人X1:n=14; 10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.60健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 (
12、一)总体方差相等的t检验1.建立检验假设 H0:1 2 ,即病人与健康人的尿中17酮类固醇的排出量相同H1: 1 2 ,即病人与健康人的尿中17酮类固醇的排出量不同 =0.05 (一)总体方差相等的t检验2.计算t值 本例n1=14, X1=212.35, X12=3549.0919 n2=11, X2=210.70, X22=4397.64 (一)总体方差相等的t检验3.确定P值 作出推断结论 =14+11-2=23,查t界值表,得t0.05,23=2.069,现t=1.80350.05。按=0.05水准,不拒绝H0,差异无统计学意义。 结论:尚不能认为慢性支气管炎病人与健康人的尿中17酮类
13、固醇的排出量不同。(一)总体方差相等的t检验两小样本均数比较t检验t检验 方差不齐 方差齐变量变换 秩和检验 一、两样本方差的齐性检验即使两总体方差相等,但两个样本方差间由于抽样误差的存在而不等,因此需进行方差齐性检验用较大的样本方差S2比较小的样本方差S2 (二)总体方差的齐性检验和t检验 1为分子自由度,2为分母自由度 注意: 当样本含量较大时(如n1和n2均大于50),可不必作方差齐性检验 (二)总体方差的齐性检验和t检验 方差不齐时,两小样本均数的比较,可选用以下方法: 采用适当的变量变换,使达到方差齐的要求; 采用秩和检验; 采用近似法t 检验,常用Satterthwaite法(二)
14、总体方差的齐性检验和t检验 计算统计量t 值,校正自由度 (二)总体方差的齐性检验和t检验 1.资料要来自严密的抽样研究设计2.选用假设检验的方法应符合其应用条件 3.要根据资料的性质事先确定采用双侧检验或单侧检验 4.假设检验的推断结论不能绝对化 5.正确理解P值的统计意义6. 假设检验和可信区间的关系应用假设检验的注意问题假设检验中作出的推断结论可能发生两种错误: 拒绝了实际上是成立的H0,这叫型错误(typeerror)或第一类错误,也称为错误。 不拒绝实际上是不成立的H0,这叫型错误(typeerror)或第二类错误,也称为错误。 型错误和型错误可能发生的两类错误型错误和型错误 检验结果真实情况拒绝H0不拒绝H0H0 成立I型错误(a )推断正确(1-a )H0 不成立即H1成立 推断正确(1-b)II型错误( b )H0 H1baa 和b 关系示意图以单侧检验为例H0:=0 , H1 :0 t界值H0 H1ba以单侧检验为例H0:=0 , H1 :0 a 和b 关系示意图t界值联系:一般增大,则减
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026河南信阳市罗山县征兵笔试重点题库及答案解析
- 2026年福建省福州市单招职业倾向性测试题库带答案详解
- 企业培训师的职责与招聘面试题集
- 2026年郑州工业安全职业学院单招职业倾向性测试题库含答案详解
- 2026年池州职业技术学院单招职业倾向性测试题库带答案详解
- xy轴立式铣床课程设计
- c.语言课程设计
- 2026年温州商学院单招职业倾向性考试题库及完整答案详解1套
- 2026年郑州职业技术学院单招职业技能测试题库及参考答案详解一套
- 教育行业面试题集与教学技能要求
- 工地大门施工协议书
- 文史哲与艺术中的数学智慧树知到期末考试答案章节答案2024年吉林师范大学
- 铁血将军、建军元勋-叶挺 (1)讲解
- 2023年西门子PLC知识考试题(附含答案)
- 鼻鼽(变应性鼻炎)诊疗方案
- 消防应急疏散和灭火演习技能培训
- 流产诊断证明书
- 劳动合同英文版
- 川泸运地块土石方量勘察报告报告
- 威廉姆斯内分泌学 内分泌学书籍
- GB/T 20933-2021热轧钢板桩
评论
0/150
提交评论