




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章,数值变量资料的统计推断,学习目标,说出抽样误差的概念 记住标准误计算公式并能说出公式的含义 描述t分布的特征及其应用 说出参数估计的含义及方法 描述均数假设检验t检验和u检验的方法,第一节 均数的抽样误差与标准误,抽样研究 用统计量(如样本均数,样本率P)来推断总体参数(如总体均数,总体率)的方法称为抽样研究。 统计推断 通过样本信息推断总体特征,此过程称为统计推断。,抽样误差 在抽样过程中由于个体差异造成的样本统计量与总体参数的差异,或同一总体的相同统计量之间的差别称为抽样误差。,统计推断:根据样本信息来推论总体特征。 均数的抽样误差 :由抽样引起的样本均数与总体均数的差异称为均数的抽样误差。 标准误:反映均数抽样误差大小的指标,衡量抽样误差的指标标准误,标准误的公式: 公式含义: (1)当n固定时, 标准误与标准差成正比 (2)当 固定时,标准误与样本含量的平方根成反比,第二节 分 布,英国统计学家W.S Goset (哥塞特)于 1908年以笔名“Student”提出了分布,发现了 的分布规律,即 分布。,哥塞特(W.S. Gosset,18761937),1908年,哥塞特首次以Student为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。,一、t 分布的概念,正态变量X采用u(X)/变换,则一般的正态分布N (,)即变换为标准正态分布N (0,1)。 又因从正态总体抽取的样本均数服从正态分布 N(, ),同样可作正态变量的u变换,即,实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值, 此时就不是u变换而是t变换了,即下式:,二、t分布曲线的特征,t分布曲线是单峰分布,以0为中心,左右两侧对称, 曲线的中间比标准正态曲线(u分布曲线)低,两侧翘得比标准正态曲线略高。 t分布曲线随自由度而变化,当样本含量越小(严格地说是自由度 =n-1越小),t分布与u分布差别越大;当逐渐增大时,t分布逐渐逼近于u分布,当 =时,t分布就完全成正态分布 。 t分布曲线是一簇曲线,而不是一条曲线。 t分布下面积分布规律:查t分布表。,t 分布示意图,我们常把自由度为的t分布曲线下双侧尾部合计面积或单侧尾部面积为指定值时,则横轴上相应的t界值记为t,。如当 =20, =0.05时,记为t0.05, 20;当 =22, =0.01时,记为t0.01, 22。对于t, 值,可根据和值,查附表2,t界值表。,t分布曲线下双侧或单侧尾部合计面积,统计推断,参数估计,假设检验,点估计,区间估计,第三节 总体均数的估计,参数估计:用样本指标(统计量)估计总体指标(参数)称为参数估计。 估计总体均数的方法有两种,即: 点值估计 区间估计。,一、点值估计,点值估计:是直接用样本均数作为总体均数的估计值。 此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估计出总体均数大小,也无法确知总体均数的可靠程度 。,二、区间估计,区间估计是按一定的概率(1-)估计包含总体均数可能的范围,该范围亦称总体均数的可信区间缩写为CI)。 1-称为可信度,常取1-为0.95和0.99,即总体均数的95%可信区间和99%可信区间。 1-(如95)可信区间的含义是:总体均数被包含在该区间内的可能性是1-,即(95),没有被包含的可能性为,即(5)。,总体均数的可信区间的计算,1.未知且n较小(n100) 按t分布的原理,2.已知或n较大(n100) 按u分布的原理,总体均数的可信区间的计算步骤,1.计算自由度V=n-1 2.计算标准误 3.查表 4.计算,95%的可信区间 为123.72.064(查表)2.38(11.9/5),即(118.79, 128.61)。故该地1岁婴儿血红蛋白平均值95的可信区间为118.7128.61(g/L)。,例3.1 为了了解某地1岁婴儿的血红蛋白浓度,从该地随机抽取了1岁婴儿25人,测得其血红蛋白的平均数为123.7g/L,标准差为11.9g/L。试求该地1岁婴儿的血红蛋白平均值95的可信区间。,例3.2 上述某市120名12岁健康男孩身高均数为143.07cm,标准误为0.52cm,试估计该市12岁康男孩身高均数95%和99%的可信区间。,95%的可信区间为 143.071.960.52,即(142.05,144.09)。 99%的可信区间为 143.072.580.52, 即(141.73,144.41)。,注 意 点,标准误愈小,估计总体均数可信区间的范围也愈窄,说明样本均数与总体均数愈接近,对总体均数的估计也愈精确; 反之,标准误愈大,估计总体均数可信区间的范围也愈宽,说明样本均数距总体均数愈远,对总体均数的估计也愈差。,标准差和标准误的区别,第四节 均数的假设检验,案例 根据大量调查,已知健康成年男子脉搏的均数为72次/分钟据,某医生在一山区随机抽查了25名健康成年男子脉搏数,求得其均数为74.2次/分钟,标准差为6.5次分钟,能否认为该山区健康成年男子的脉搏数与一般健康成年男子的脉搏数不同?,一、 假设检验的意义和一般步骤,本例两个均数不等有两种可能性: 由于抽样误差所致 受山区某些因素的影响,假设检验一般步骤,第一步:建立假设,确定检验水准 H0:无效假设(null hypothesis) H1 :备择假设(alternative hypothesis) 检验水准亦称显著性水准。它是判别差异有无统计学意义的概率水准,其大小应根据分析的要求确定。通常取=0.05。,第二步:选定检验方法和计算统计量 数值变量资料:两组大样本均数的比较,选择u检验,两组小样本均数的比较,选择t检验; 分类变量资料:两个率的比较,可选择u检验也可选择 2检验。,第三步:确定概率P值 P值是指在H0所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量的概率。当求得统计量后,一般可根据有关统计用表查得P值。例如t检验中,tt,,则P ;tt,,则P。,第四步:作出推断结论 当P时,结论为按所取检验水准拒绝H0,接受H1,即差异有统计学意义; 当P时,结论为按所取检验水准不拒绝H0,即差异无统计学意义。,二、均数的t检验,样本均数与总体均数的比较 配对数值变量资料的比较 两独立样本均数的比较,(一)样本均数与总体均数的比较 已知的总体均数一般为理论值、标准值或经大量观察所得的稳定值等。 公式:,(二)配对数值变量资料的比较 配成对子的两个个体随机分配两种不同的处理 同一批对象治疗前后某些生理、生化指标的比较 同一种样品(如同一份血样分为两部分),采用两种不同的方法进行测定,来比较两种方法有无不同,公式:,(三)两独立样本均数的比较 也称成组比较,适用于比较按完全随机设计而得到的两组资料。 公式:,式中 和 为两样本含量, 为两样本合并的方差,计算公式为:,如已计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/TS 26048-1:2025 EN Intelligent transport systems - Field device Simple Network Management Protocol (SNMP) data interface - Part 1: Global objects
- 【正版授权】 ISO 20120:2025 EN Lubricants - Determination of the coefficient of friction of synchronizer lubricated by manual transmission fluids (MTF) - High-frequency,linear-oscillati
- 【正版授权】 ISO 17268-1:2025 EN Gaseous hydrogen land vehicle refuelling connection devices - Part 1: Flow capacities up to and including 120 g/s
- 【正版授权】 IEC 62841-4-3:2020/AMD1:2025 EN Amendment 1 - Electric motor-operated hand-held tools,transportable tools and lawn and garden machinery - Safety - Part 4-3: Particular requ
- 【正版授权】 IEC 60245-5:1994/AMD1:2003 FR-D Amendment 1 - Rubber insulated cables - Rated voltages up to and including 450/750 V - Part 5: Lift cables
- 【正版授权】 IEC 60287-1-3:2002 FR-D Electric cables - Calculation of the current rating - Part 1-3: Current rating equations (100 % load factor) and calculation of losses - Current sha
- 水彩老师考试题及答案
- 成人音乐测试题及答案
- 安康药房面试题及答案
- 生猪屠宰面试题及答案
- 2025年发展对象考试题库附含答案
- 2025年新专长针灸考试题及答案
- 高三生物一轮复习课件微专题5电子传递链化学渗透假说及逆境胁迫
- DBJ50-T-306-2024 建设工程档案编制验收标准
- 2025四川雅安荥经县国润排水有限责任公司招聘5人笔试历年参考题库附带答案详解
- 2025中国银行新疆区分行社会招聘笔试备考试题及答案解析
- 药品医疗器械试题及答案
- 子宫内膜类器官构建与临床转化专家共识解读 2
- ESD手术常见并发症
- 普通话驾驶员培训课件
- 中医治疗疼痛课件
评论
0/150
提交评论