




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三讲 计量资料的统计推断,2,统计推断(Statistical inference):用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。,主要内容,第一节 标准误 第二节 t 分布 第三节 总体均数的估计 第四节 假设检验 第五节 未知总体与已知总体均数的 比较 第六节 完全随机设计两总体均数的比较 第七节 配对设计资料均数的比较 第八节 均数假设检验的注意事项,4,第一节 标准误(Standard error),一、概念 抽
2、样误差:由于抽样引起的样本统计量与总体参数之间的差异。 标准误 :(x Sx) 表示抽样误差大小的指标; 样本均数的标准差;,X 1 S1 X 2 S2 X I Si X n Sn,x,标准误示意图,6,三、 (均数)标准误 意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。 与样本量的关系:S 一定,n,标准误,二、(均数)标准误的计算,7,SPSS计算标准误,Analyze-Descriptive Statistics-Frequencies-Statistics-Dispersion-S.E. mean-Continue-OK,8,大数定理:当样本量
3、足够大时,样本的均数以很大的概率接近总体均数(计量资料)。 当试验次数足够多时,事件A出现的频率就会接近于概率P(计数资料)。 中心极限定律:正态分布也称为中心分布。 如果所研究的随机变量可以表示为大量独立随机变量的和,其中每一个随机变量对于总和只起微小作用,则可以认为这个随机变量近似服从正态分布,其均数也近似服从正态分布。,两个基本定律(了解),9,一、t 分布的概念:从正态分布演化到t 分布的5个步骤。 反应抽样误差分布的规律。 二、t 分布图形: 三、t 分布面积特征( t界值表):,第二节 t 分布,10,t 分布的图形(u 分布 是t 分布的特殊形式),11,t 值表(附表2 ) 横
4、坐标:自由度, 纵坐标:概率, p, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值。,t 值表规律: (1) 自由度()一定时,p 与 t 成反比; (2) 概率(p) 一定时, 与 t 成反比;,13,第三节 总体均数的估计,统计推断的任务就是用样本信息推论总体特征。 参数估计,用样本均数估计总体均数。 1、 点(值)估计(近似值) 2、 区间估计(近似范围),14,1、点(值)估计(point estimation): 用样本均数直接作为总体均数的估计值, 未考虑抽样误差。,15,2、区间估计(interval estimation), 概念:根据样本均数,按一定的可信度计
5、算 出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间(confidence interval, CI)。 方法: (1) u 分布 法 (2) t 分布法,16,(1)u 分布 法,公式,应用条件:,例题,意义:与正常值范围进行比较,(xus x,xu s x) 即(xus x),样本量较大, 已知或可计算出 x 及 Sx,换句话说,做出校全体女大学生身高均数为163.0 - 164.5cm的结论,说对的概率是95%,说错的概率是5%;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是99%,说错的概率是1%。,意义: 虽然不能知道某校全体女大学生身高均
6、数的确切数值,但有95%的把握说校全体女大学生身高均数在163.0 - 164.5cm之间,有99%的把握说校全体女大学生身高均数在 162.7 164.7cm之间。,18,(2)t 分布 法,公式,应用条件,例题,意义,(x ts x,xt s x) 即(xts x),样本量 较小, 已知或可计算出 X 及,s x,19,SPSS求可信区间,Analyze-Descriptive Statistics-Explore-Statistics-Descriptives-Continue-OK,20,区间估计的准确度:说对的可能性大小, 用 (1-) 来衡量。99%的可信区间好于95%的可信区间
7、(n, S 一定时) 。 区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。99%的可信区间差于95%的可信区间(n, S 一定时) 。 准确度与精确度的关系: (例如预测孩子的身高),21,正常值范围估计与可信区间估计,22,第四节 假设检验,显著性检验; 科研数据处理的重要工具; 某事发生了: 是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。,假设检验: 1、原因 2、目的 3、原理 4、过程(步骤) 5、结果,24,1、假设检验的原因,由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、X4、,不同。 因此,X1、X2 不同有两种(而且只有两
8、种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性 。 (2)分别所代表的总体均数不同。差别有显著性。,2、假设检验的目的,判断是由于何种原因造成的不同,以做出决策。,反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。 概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。,3、假设检验的原理/思想,27,4、假设检验的一般步骤
9、, 建立假设(反证法): 确定显著性水平( ): 计算统计量:u, t,2 确定概率值: 做出推论,(1). 建立假设 检验假设或者称无效假设(null hypothesis),用H0表示, H0假设是假设两总体均数相等。 备择假设(alternative hypothesis),用H1表示。H1是与H0相反的假设,假设两总体均数不相等。,(2)确定显著性水平(significance level ) 显著性水平()就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于时,则认为该事件为小概率事件,是不太可能发生的事件。通常 取0.05 或 0.01。游戏规则,(3
10、)计算统计量 根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出 u 值 或 t 值。 注意:在检验假设成立的情况下,才会出现的分布类型或公式。,(4)确定概率值(P) 将计算得到的u值或 t值与查表得到u或t,,比较 ,得到 P值的大小。根据u分布和t分布我们知道,如果|u| u或| t | u ,则 P 。,(5)作出推断结论 如果p,认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性大于,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论是不认为两总体均数不相等。如果p,我们认为在检验假设H0成立的条件下,得到等于或大于现有统计量u值或t值的可能性小
11、于,可判断为小概率事件,则拒绝H0,接受H1,差别有统计意义,结论是两总体均数不相等,或者某一总体均数大于(或小于)另一总体均数。,5、假设检验的结果,接受检验假设 拒绝检验假设 正确理解结论的概率性(都隐含着犯错误的可能性)。,34,第五节 未知总体与已知总体均数的 比较,一、大样本 一般女性平均身高160.1 cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80cm。 请问某大学18岁女大学生身高是否与一般女性不同。,35,目的:比较样本均数所代表的未知总体均数 与已知的总体均数有无差别 计算公式:u 统计量,36, 适用条件: (1) 已知一个
12、总体均数; (2) 可得到一个样本均数; (3) 可得到该样本标准误; (4) 样本量不小于100。,例题: (1) 一个总体均数:160.1 cm ; (2) 一个样本均数:163.74 cm ; (3) 可计算出样本标准误:3.8/100=0.38 (4) n = 100;,38,假设检验: 建立假设: 检验假设:某校女大学生身高均数与一般女子身高均数相同; H0:=0; 备择假设 :某校女大学生身高均数与一般女子身高均数不同; H1:0 确定显著性水平( ):0.05,39, 做出推论: U= 9.58 1.96, p 0.05 = , 小概率事件发生了,原假设不成立;拒绝H0 , 接受
13、H1, 可认为:某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。, 计算统计量:u 统计量: u =, 确定概率值: |u|=9.58 u = 1.96 u u p =0.05;,二、小样本 已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果见数据“男生心率.SAV”。,41,目的:比较一个小样本均数所代表的未知总 体均数与已知的总体均数有无差别。 计算公式: t 统计量:t= 自由度:=n - 1,42, 适用条件:
14、(1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准误; (3) 样本量小于100; (4) 样本来自正态或近似正态总体。,43,例题: 已知: (1) 一个总体均数:74次/分 ; (2) 一个样本均数:65.63次/分 ; (3) 可计算出样本标准误:7.2/ 16=1.8 (4) n =16 100;,44,假设检验: 建立假设: 检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等; H0:=0; 备择假设 :常参加体育锻炼的中学男生的心率与一般中学生不同; H1:0 确定显著性水平( ):0.05,45, 计算统计量: t = : t =4.65 确定概率值: n=
15、 16, 自由度 = n 1 = 15, t0.05(15) = 2.131 t t0.05(25) , p 0.05 做出推论: p 0.05 , 小概率事件发生了,原假设不成立;拒绝H0 , 接受H1, 可认为:常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。,46,SPSS进行单一样本的假设检验,Analyze-Compare Means-One Sample T test-test Variable-Option-Confidence Interval-Continue-OK,47
16、,第六节 完全随机设计两总体均数的比较,例题: 为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。,48,目的:由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。 计算公式及意义: t 统计量: t = 自由度 = n1+n2 2, 适用条件: (1)已知/可计算两个样本均数及它们的标准差 ; (2)两个样本之一的例数少于100;,49,例题: 已知: 一个样本: 均数48.25, 标准差32.0; 另一个样本:均数36.37, 标准差27.65; (2) n
17、1=20; n2=19,50,假设检验: 建立假设: 检验假设:两组药疗效相同; 备择假设 :两组药疗效不同不同; 确定显著性水平( ):0.05,51, 计算统计量:t 统计量: t = 1.238; 自由度:20+ 19 2 = 37 表中: t 0.05(37) = 2.026 确定概率值: t 0.05; 做出推论: 因为 p 0.05 , 不能拒绝H0: 认为 两组药疗效相同。可以用国产药代替进口药。,52,SPSS进行两个样本的假设检验,Analyze-Compare Means-Independent Samples T test-test Variable-Grouping-D
18、efine Groups-1,2-Continue-OK,53,第七节 配对设计资料均数的比较 (paired design),什么是配对设计资料?,将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。 有哪几种形式?,54,1比较目的:通过对两组配对资料的比较,判断不同的处理效果是否有差别,或某种治疗方法是否起作用。 2公式: t = = 自由度: = 对子数 - 13.适用条件:.将人或动物进行配对,配好的每对个体分别随机地分到 两个不同的处理组中去,接受不同处理。.观察同一批病人在治疗前后的变化,治疗前的数值和治 疗后的数值也是配对资料。.同一批病人或动物用不同的方法处理。,55,例题: 为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。(数据见touxi.sav),56,. H0:d = 0 H1:d 0 . 确定显著性水平 = 0.05 . 计算统计量: t =7.826,. 确定概率:=10 - 1=9。 查表 t 0.05(9) =2.262 t = 7.826 t 0.05(9) p 0.05 . 判断结果:因为p 0.05,故拒绝检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届山东省泰安肥城市高二下化学期末检测模拟试题含解析
- 供应工业冷库管理办法
- 数据湖成本控制-洞察及研究
- 档案数据追溯管理办法
- 公安举报投诉管理办法
- 货物装卸机械使用安全守则
- 智能化农用机器人及其人机交互优化-洞察及研究
- 医疗帮扶专家管理办法
- 信用评级机构竞争态势与公司债券发行上市审核探析
- 公安职工餐厅管理办法
- 2025年中国LTCC技术行业市场现状、前景分析研究报告(智研咨询发布)
- 租赁住房培训课件下载
- 房管员试题资料
- 2024年苏州昆山国创投资集团有限公司招聘笔试真题
- 商场吸烟区管理制度
- 糖尿病足截肢术后护理
- 广东省东莞市2022-2023学年高二下学期期末物理试题(含答案)
- 公司第四季度安委会会议汇报材料课件
- 中医护理质量与安全管理职责
- 2025年农业技术员考试试题及答案
- 【诗歌鉴赏】2025届高三下4月名校模考试题
评论
0/150
提交评论