




已阅读5页,还剩96页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,计量资料的统计推断(1),张敬旭公共卫生学院,.,基本内容,.,为了解北京市海淀区18岁女性的健康状况,海淀区教委委托北医三院承担项目的调查工作。2007年,三院课题组从中随机抽取了符合条件的对象100名,并测量了各种指标,包括身高、体重、血清总蛋白等。,.,问题1.其中的总体是?样本是?2.有几个变量?3.属于什么性质的资料?4.变量的分布类型可能是?5.用什么统计量对变量进行描述?,.,例如身高:均数,标准差,问题:是总体的还是样本的?,.,统计推断,随机抽样,参数?,统计量,(、),(X、s、p),本次调查的目的是?,.,统计推断(Statisticalinference):用样本信息推论总体特征的过程。包括:参数估计假设检验,.,参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体指标量进行估计。(如:估计总体均数)假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。(如:检验两个总体的均数是否存在差异),.,主要内容,第一节标准误第二节t分布第三节总体均数估计第四节假设检验第五节三种t检验第六节假设检验的注意事项,t检验单一样本的t检验两组样本的t检验配对样本的t检验,.,X1S1X2S2XISiXnSn,x,海淀区18岁女性身高,A1,A2,A3,A4,Ai,An,每次100人,85次,.,问题:X是否是一个变量?变量值有多少个?2.如果X服从正态分布,X服从什么分布?3.X的标准差是什么?怎么计算?,.,第一节标准误(Standarderror),.,问题:1.在上例中,18岁女性身高的标准差为s3.8(cm)请问标准误(Sx)比3.8大还是小?小2.如果用分布曲线表示结果是什么?,.,二、(均数)标准误的计算,问题:n的意义?,X,.,三、(均数)标准误意义:反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。与样本量的关系:S一定,n,标准误,.,SPSS计算标准误的操作程序:,Analyze-DescriptiveStatistics-Frequencies-“身高”变量选入对话框Statistics子对话框-Dispersion-S.E.mean-Continue-OK,.,课堂练习3,打开“身高-18岁女性.sav”,计算身高和Z身高的标准差及标准误,.,第二节t分布,哥塞特(W.S.Gosset,18761937)英国化学家和数学家。1899年进入都柏林的A.吉尼斯父子酿酒厂,处理一大堆有关酿造方法、原料(大麦等)特性和成品质量之间的关系的统计数据。研究发现,如果是小样本,其规律不遵循正态曲线。由于酒厂禁止他发表关于酿酒过程的研究成果,Gosset不得不于1908年以“学生”的笔名发表他的论文,并于1904年写成第一篇报告误差法则应用以笔名“Student”著名。Gosset是英国现代统计方法发展的先驱,由他导出的统计学t检验广泛运用于小样本平均数之间的差别测试。,.,问题:请问横轴上的值是什么?对应的曲线下的面积是什么意思?,.,标准正态变换后:,ZN(0,1),.,.,问题:对X进行标准正态变换以后?,ZN(0,1),t,Gosset:发现样本量(自由度)较小时,不服从标准正态分布,小样本思想,.,t分布的图形(标准正态分布是t分布的特殊形式),问题:与标准正态分布的区别是什么?,.,请关注表中的自由度和p值,t0.05,10=2.228:当=10时,绝对值2.228的t值占曲线下面积的5%,.,曲线下面积分布规律:t值表(附表2)左侧列:自由度,上两行:概率,p,即曲线下阴影部分的面积;表中的数字:相应的|t|界值。(1)自由度()一定时,p与t成反比;(2)概率(p)一定时,与t成反比;,.,第三节总体均数的估计,用样本均数估计总体均数。,.,1、点(值)估计(pointestimation):用样本均数直接作为总体均数的估计值思考:1.有什么缺点?未考虑抽样误差2.如何解决?,.,2、区间估计(intervalestimation),根据样本均数,按一定的可信度计算出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间(confidenceinterval,CI)。,问题:可信度是什么意思?,.,Z分布法:n100,计算公式:,(xZSx,xZSx)即(xZSx),(xt,Sx,xt,Sx)即(xt,Sx),t分布法:n0.05;,上述骨质疏松的例题,.,(5)作出推论P,H0:12时,得到大于现有统计量t值的可能性P大于,不属于小概率事件,则不拒绝H0,差别无统计学意义。,.,如果P,说明在H0成立的条件下,得到等于或大于现有统计量的可能性P小于,可判断为小概率事件,则拒绝H0,接受H1,差别有统计意义,结论是两总体均数不相等。,.,(5)做出推论:p0.05()问题:请问p是什么事件发生的概率?是小概率吗?不能拒绝H0,两组均数差异没有统计学意义,认为两组药疗效相同,可以用国产药代替进口药。,上述骨质疏松的例题,.,5、假设检验的结果问题,拒绝了实际成立的检验假设(H0):一类错误不拒绝实际上不成立的检验假设(H0):二类错误,问题:上述例题的结论可能出现哪类错误?二类错误。两类药疗效不同,但是用现有的数据没有发现差别。,问题:假设结果是P0.05,结论是什么?(两类药疗效不同)可能出现哪类错误?一类错误。两类药疗效相同,但是却判定为不同。,.,第五节三种t检验,1.单一样本的t检验2.两组样本的t检验3.配对样本的t检验,.,One-SampleTTest过程:进行样本均数与总体均数的比较。Independent-SampleTTest过程:两样本均数的比较(即两组资料的比较或独立样本的比较)。Paired-SampleTTest过程:配对资料的均数比较。,.,SPSS软件t检验的操作-掌握常用的3种,.,1.单一样本的t检验未知总体与已知总体均数的比较;一组样本与总体的比较,.,已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果见数据“男生心率.SAV”。,问题:总体是?样本是?,.,55.0072.0058.0057.0070.0075.0072.0069.0061.0067.0069.0073.0059.0071.0053.0069.00如何建立数据库?,.,目的:比较一个样本均数所代表的未知总体均数与已知的总体均数有无差别。计算公式:t统计量:t=自由度:=n-1,.,假设检验:(1)建立假设:检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等;H0:=0;备择假设:常参加体育锻炼的中学男生的心率与一般中学生不同;H1:0,.,(2)确定显著性水平():0.05,.,(3)计算统计量:t=t=4.65,.,(4)确定概率值:查表:n=16,自由度=n1=15,t0.05(15)=2.131t=4.65tt0.05(25),p0.05,.,(5)做出推
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024生态学考试题库及参考答案
- 2024年血液内科三基三严模拟练习题及答案
- 消防安全知识竞赛试题题库(含答案)
- 2025年施工员之装修施工基础知识考试题库含答案【巩固】
- 2025年医院学生服务活动记录范文
- 2024年吉林省考评员练习题及答案
- 农业系学生毕业论文
- 毕业论文管理专业
- 加工中心毕业论文
- 经济系毕业论文写什么好
- 征兵心理测试题及答案
- 2025-2030中国永磁电机行业深度解析与发展现状趋势分析报告
- 模块十 轴测图的基本知识(课件)-中职高考《机械制图》一轮复习(高教版第5版)
- 红火蚂蚁咬伤急救
- 再回首二部合唱简谱金巍
- 酒店装修工期管理措施
- 2025年注册测绘师测绘综合能力的真题卷(附答案)
- 2025-2030中国移动卫星终端设备行业发展分析及发展趋势与投资前景预测研究报告
- 智慧公交可行性研究报告
- 项目城市轨道交通风险管理与安全评估刘连珂
- 音乐演出活动场地使用协议
评论
0/150
提交评论