数值变量资料的统计推断_第1页
数值变量资料的统计推断_第2页
数值变量资料的统计推断_第3页
数值变量资料的统计推断_第4页
数值变量资料的统计推断_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/3/25,1,第四讲,数值变量资料的统计推断,2019/3/25,2,统计推断Statistical inference 是用样本信息推论总体特征的过程。,(一)参数估计 (二)假设检验,2019/3/25,3,一、参数估计,(一)点估计 (二)区间估计(置信区间),2019/3/25,4,二、假设检验,又称显著性检验,是指由样本均数间存在 的差别对样本所代表的总体均数间是否 存在着差别所做出判断的分析推断方法及过程。,2019/3/25,5,样本均数与总体均数之间的差异或样本均数之间的差异,称为均数的抽样误差(sampling error of mean)。 均数的标准误 ( ) 是描述均数的抽样误差大小的统计指标。,一、均数的抽样误差与标准误,2019/3/25,6,统计理论表明:,1. 从正态总体中随机抽取例数为n,样 本均数 也服从正态分布; 2. 从均数为,标准差为的正态或近似 正态的总体中抽取例数为 n 的样本,样 本均数的总体均数为,标准差 。 标准误的计算公式为:,2019/3/25,9,在实际工作中, 往往是用 来估计的,这时对正态变量 采用的不是 u 变换, 而是 t 变换,即:,2019/3/25,10,t 分布是一簇对称于0的单峰分布曲线。 自由度 (实际上是样本含量 n-1)越小,曲线越扁平,随着自由度的增大,t分布曲线逐渐逼近标准正态曲线。 t 分布主要用于总体均数的区间估计和 t 检验。,2019/3/25,11,三、总体均数的估计(参数估计) 参数估计有两种方法: 点估计和区间估计 1. 点估计(point estimation)以样本统计量直接 估计总体参数。未考虑抽样误差的存在。即: 2.区间估计(interval estimation)以预先给定的概率估计总体参数在哪个范围内的估计方法称为区间估计。,2019/3/25,12,(1)已知时,按正态分布原理,用公式 估计总体均数的95%的置信区间。 (2)未知、且样本例数较小时,按t分布原理,估计总 体均数的95%置信区间。 (3)未知,但样本例数 n 足够大时,按正态分布原理,估计总体均数95%置信区间。,2019/3/25,13,区间估计(置信区间)例9-13 (P289),健康男子20人, 即 n=20 = n-1 收缩压均数为: 标准差为: 代入公式:,2019/3/25,14,以14岁130例女孩计算指标:,2019/3/25,15,四、假设检验的基本步骤 1. 建立检验假设:无效假设 H0 备择假设 H1 2. 确定检验水准: =0.05 3. 选定检验方法和计算检验统计量 4. 根据自由度确定P值 5. 判定统计结果,定专业结论,2019/3/25,16,第四节 t 检验 和 u 检验 t 检验( t-test )的应用条件: 当样本例数较小(n30),样本来自呈正态分布的总体,总体标准差未知。在做两个样本均数比较时,还要求两样本相应的总体方差相等( )。 一、样本均数与总体均数的比较 样本均数与总体均数比较的目的是推断样本所代表的未知总体均数与已知的总体均数0是否有差别。,2019/3/25,17,例 9-15 P 291,建立检验假设: 定检验水准: 计算 t 值 4.定P值,判定结果: t0.05,差别无显著性 在 的水准上,接受H0, 该法测得均数与真值相同,2019/3/25,18,二、配对资料的比较 配对设计的均数的假设检验有三种情况: 1. 自身比较; 2. 同一样品用两种方法检验的结果; 3. 对成对设计的两个受试对象分别给予两种处 理,目的都是推断两种处理的效果有无差别。 统计量的计算公式为:,2019/3/25,19,例 问该药是否对高血压患者治疗前后舒张压 是否有影响?,1.建立检验假设,定检验水准: 2. 计算t 值 3. 定P值 : 4. 判定定结果:t t0.01,73.99 P0.01, 差别有高度显著性 在 的水准上,拒绝H0,接受H1,差别有高度显著性,该药有影响。,2019/3/25,20,三、 两个小样本均数的比较,2019/3/25,21,表 用两种不同蛋白质含量饲料喂养 大鼠后体重增加的克数 高蛋白组 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组 70 118 101 85 107 132 94 1.建立检验假设,定检验水准: =0.05 2. 计算t 值:,2019/3/25,22,3. 定P值: t = 1.89 4.定结果: 在=0.05的水准上, 接受H0 , t0.05, 差别无显著性,不能认为两种饲料对大白鼠有影响。,2019/3/25,23,U 检验(U-test),应用条件: 当样本例数较大(n 30 ),样本来自呈正态分布的总体,总体标准差未知。在做两个样本均数比较时,要求两样本相应的总体方差相等( ), 变量为独立的随机样本。,2019/3/25,24,一、大样本均数与总体均数的比较,例题:已知一般正常成年男子脉搏均数74次/分 ,现测得某山区100名正常成年男子脉搏65.26次/分 ,标准差为7.2次/分 ,问:山区正常成年男子脉搏均数是否比一般正常成年男子脉搏跳动得较慢? 已知: (1) 总体均数: = 74次/分 ; (2) 样本均数: = 65.26次/分 ; (3) 样本均数的标准差: S=7.2次/分 n=100,2019/3/25,25,分析计算,大样本,2019/3/25,26,建立检验假设: 2. 定检验水准: 3. 计算 u 值: 4. 定P值,判定结果: u=12.14 u0.01 P 0.01,差别有高度显著性 在 的水准上,拒绝H0, 接受H1, 山区正常成年男子脉搏均数是比一般正常成年男子脉搏跳动得较慢。,2019/3/25,27,2. 两个大样本均数的比较,2019/3/25,28,例题 9-17 男女新生兒甘油三酯浓度测定值如下:,男婴 n1=175 女婴 n2=167 (一) 建立检验假设 (二) 定水准 (三) 选方法, 求检验统计量 (四) 定P值, 判定结果,2019/3/25,29,在=0.05的水准上,接受H1, U0.05,差别无显著性,男女新生兒甘油三酯浓度相同。,2019/3/25,30,四、假设检验应注意的问题,1. 资料必须合乎随机化抽样原则 2. 选用的假设检验方法应符合其基本应用条件 3. 实际差别大小与统计意义的区别 4. 进行假设检验时 对差异有无显著性或有无 统计意义的判断不能绝对化 5. 假设检验的单侧检验与双侧检验的选择,2019/3/25,31,方差分析(F-检验) 方差分析(analysis of variance , ANOVA )能用于两个或两个以上样本均数的比较,还可分析两个或多个研究因素的交互作用以及回归方程的线性假设检验。 应用的条件是: 1. 各样本的每个变量值是相互独立的随机 变量 2. 各样本都来自呈正态分布的总体 3. 各个总体方差齐,2019/3/25,32,一、方差分析的基本思想 把全部观察值之间的变异-总变异,按设计和需要分为两个(组间、组内-误差)变异或多个变异部分,其自由度也分解为相应的部分。 计算变异间的比值 (F值),若F值接近于1,可认为处理因素无作用;若F值远大于1,且大于或等于F界值表中的某界值时,可认为处理因素有作用。,2019/3/25,33,变异分割,2019/3/25,34,二、单因素的方差分析 单因素方差分析中,要把总的离均差平方和分为组间部分和组内部分,其自由度也分为相应的部分,并用各自的离均差平方和除以各自的自由度,得到均方。即F值。,2019/3/25,35,表 单因素方差分析的计算公式 变异来源 离均差平方和 自由度 均方 F SS MS 总 N-1 组 间 (处理组间) k-1 组 内 (误差) N-k,2019/3/25,36,表 四组资料的肝重占体重比值(%)的测定结果 饲 料 A B C D 2.62 2.82 2.91 3.92 2.23 2.76 3.02 3.00 2.36 2.43 3.28 3.32 2.40 2.73 3.18 3.04 9.61 10.74 12.39 13.28 46.02 4 4 4 4 16 2.4025 2.6850 3.0975 3.3200 2.8763 23.1669 28.9278 38.4593 44.6304 135.1844,2019/3/25,37,检验步骤,1. 建立检验假设 H0: 1=2=3= 4 H1: 1、2、3 、4 不等或不全等 2. 定检验水准: =0.05 3. 计算检验统计量(F值) (1)求 SS,2019/3/25,38,2019/3/25,39,(2)求均方(Mean Square, MS) (3) 求F值 :,2019/3/25,40,4.定 P 值,判定结果,5. 定结论 在=0.05的水准上,拒绝H0 , 接受H1, ,不同饲料对大白鼠 肝重与体重比例有影响。,2019/3/25,41,方差分析表 变异来源 SS MS F P 组 间 2.0276 3 0.6759 10.24 0.01 组 内 0.7918 12 0.0660 总 2.8194 15,2019/3/25,42,三、多个样本均数间两两比较 q检验,计算公式:,2019/3/25,43,检验步骤,1. 建立检验假设 H0: H1: 2. 定检验水准: =0.05 3. 计算检验统计量(q 值) 4. 先将均数从小到大排秩序,2019/3/25,44,表 四个样本均数两两比较的 q 检验 对比组 两均数之差 标准误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论