医学统计学培训资料(ppt 262页).ppt_第1页
医学统计学培训资料(ppt 262页).ppt_第2页
医学统计学培训资料(ppt 262页).ppt_第3页
医学统计学培训资料(ppt 262页).ppt_第4页
医学统计学培训资料(ppt 262页).ppt_第5页
已阅读5页,还剩256页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本资料来源 医学统计学 总体与样本参数和统计量同质与变异抽样误差概率变量 例2 1某市110名7岁男童的身高 cm 资料如下 请作统计描述 114 4119 2124 7125 0115 0112 8120 2110 2120 9120 1125 5120 3122 3118 2116 7121 7116 8121 6115 2122 0121 7118 8121 8124 5121 7122 7116 3124 0119 0124 5121 8124 9130 0123 5128 1119 7126 1131 3123 8114 7122 2122 8128 6122 0132 5122 0123 5116 3126 1119 2126 4118 4121 0119 1116 9131 1120 4115 2118 0122 4114 3116 9126 4114 2127 2118 3127 8123 0117 4123 2119 9122 1120 4124 8122 1114 4120 5115 0122 8116 8125 8120 1124 8122 7119 4128 2124 1127 2120 0122 7118 3127 1122 5116 3125 1124 4112 3121 3127 0113 5118 8127 6125 2121 5122 5129 1122 6134 5118 3132 8 表2 1110名7岁男童身高频数分布 图2 1某市110名7岁男童身高的频数分布 如例2 1 某市110名7岁男孩身高均数为 用加权法可求某市110名7岁男孩身高均数如下 表2 5某市大气中日平均浓度 表2 440例麻疹易感儿童的血凝抑制抗体滴度 正态分布标准正态分布 正态分布的特点 1 单峰 钟形2 以均数为中心 两侧对称3 尾端不与横轴相交4 均数 位置 标准差 形状5 曲线下面积分布有特殊规律 表3 1110名7岁男童身高频数实际分布与理论分布的比较 例3 3已得110名7岁男童身高 现欲估计该地1995年身高界于116 5cm到119 0cm范围内的7岁男童比例及110名7岁男童中身高界于116 5 119 0cm范围的人数 临床参考值范围的制定 1 选取适当数量的 正常 人2 控制测量误差3 确定单 双侧4 确定适当的范围大小5 确定正确的统计方法 正态分布法百分位数法 总体和样本 总体population 样本sample 有限总体无限总体 随机抽取 统计推断 外推 统计描述 抽样研究总体 样本 在抽样研究中 抽样误差是不可避免的 数理统计推理和中心极限定理 centrallimittheorem 表明 从正态总体N 中 随机抽取例数为n的样本 样本均数也服从正态分布 即使从偏态总体随机抽样 当n足够大时 如n 50 也近似正态分布 不同自由度下t分布图 例4 2现测得某地25名1岁婴儿血红蛋白的平均值为123 7 g L 求其95 可信区间 本例n 25 S 11 9g L 按式 4 2 算得样本均数的标准误为 g L n 1 25 1 24 取双尾0 05 查附表2 t值表得 按式 4 4 得 即 118 79 128 61 g L故该地1岁婴儿血红蛋白平均值95 的可信区间为 118 79 128 61 g L 例4 4某地抽得正常成人200名 测得其血清胆固醇的均数为3 64mmol L 标准差为1 20mmol L 试估计该地正常成人血清胆固醇均数的95 可信区间 本例n 200 50 故采用正态近似的方法按式 4 7 计算可信区间 今 3 64 S 1 20 取双尾0 05得 即 3 47 3 81 mmol L故该地正常成人血清胆固醇均数的95 可信区间为 3 47 3 81 mmol L 假设检验 例3 4据大量调查知 健康成年男子脉搏的均数为72次 分 某医生在山区随机调查了25名健康成年男子 其脉搏均数为74 2次 分 标准差为6 5次 分 能否认为该山区成年男子的脉搏高于一般人群 返回1返回2 两均数不相等的原因有两种可能 由于抽样误差所致 样本来自另一总体 由于环境条件的影响 山区成年男子的脉搏确实高于一般 判断的方法 假设检验 1 建立检验假设 确定检验水准H0 0山区成年男子平均脉搏数与一般人群相等H1 0山区成年男子平均脉搏数高于一般人群单侧 0 05 2 计算统计量 3 确定P值 作出统计推断查附表2 t界值表 t0 05 24 1 711 t0 10 24 1 318 得0 10 P 0 05 按 0 05水准不拒绝H0 尚不能认为该山区健康成年男子的脉搏均数高于一般健康成年男子的脉搏均数 例3 6为探讨MRI无创性测量肺脉舒张压 PADP 的新途径 分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压 资料如表3 1 问两种方法的检测结果有无差别 表3 1两种方法检测12名患者的肺脉舒张压 kPa 结果 1 建立假设检验 确定检验水准H0 两方法检验结果相同 即 d 0H1 两方法检验结果不同 即 d 0双侧 0 05 2 计算统计量 n 1 12 1 11 3 确定P值 作出统计推断查附表2 t界值表 得0 20 P 0 10 按 0 05水准不拒绝H0 尚不能认为两种方法检查的结果不同 3 成组设计的t检验 例3 7某医生研究野木瓜用于手术后的镇痛疗效 以哌替啶作为对照 观察两药的镇痛时间 h 得到下表3 2结果 问野木瓜与哌替啶的术后平均镇痛时间是否不同 表3 2野木瓜和哌替啶的镇痛时间 h 比较 1 建立假设检验 确定检验水准H0 1 2 即两总体均数相等H1 1 2 即两总体均数不相等双侧 0 05 2 计算统计量 3 确定P值 作出统计推断查附表2 t界值表 得P 0 001 按 0 05水准拒绝H0 接受H1 差异有统计学意义 故可认为野木瓜与哌替啶的术后平均镇痛时间不同 野木瓜液的镇痛时间较长 能否用两样本均数比较的t检验 例3 8为了摸清高碘是否影响儿童的智力发育 造成智力低下 研究者抽样调查了农村地区的高碘地区100名小学生和非高碘区105名小学生的智商 IQ 得到如表3 3结果 问该农村地区的高碘地甲病区小学生智商水平是否与非高碘区不同 假定两组受教育年限 学校规模 师资水平 经济状况 生活水平相近 1 建立假设检验 确定检验水准H0 该市高碘区与非高碘区儿童智力均数相等 即 1 2H1 该市高碘区与非高碘区儿童智力均数不等 即 1 2双侧 0 05 2 计算统计量 3 确定P值 作出统计推断查附表2 t界值表 时 得P 0 001 按 0 05水准拒绝H0 接受H1 差异有统计学意义 可认为该农村高碘区与非高碘区儿童智力均数不等 高碘区较低 I型错误与II型错误 拒绝了实际上成立的H0 这类 弃真 的错误为I型错误 typeIerror 不拒绝实际上不成立的H0 这类 存伪 的错误为II型错误 typeIIerror 客观实际拒绝H0不拒绝H0H0成立I型错误 推断正确 1 H0不成立推断正确 1 II型错误 的关系 通常当n固定时 愈小 愈大 反之 愈大 愈小 增大n 可同时减小 检验效能 1 称为或把握度 powerofatest 其统计学意义是若两总体确有差别 按 水准能检出其差别的能力 值的大小很难确切估计 只有在已知样本含量n 两总体参数差值 以及所规定的检验水准 的条件下 才能估算出 大小 或通过非中心的t界值表得到 假设检验中的注意事项 要保证组间的可比性要根据研究目的 设计类型和资料类型选用适当的检验方法正确理解差别有无显著性的统计学意义结论不能绝对化单 双侧检验应事先确定 假设检验常见结果 专业有意义 统计学检验无意义 专业无意义 统计学检验有意义 专业有意义 统计学检验有意义 两均数的等效检验 equivalencetestofmeans 问题的提出 研究者希望了解该新药 或检验方法 与常规药物 或检验方法 有效率是否相近或相等 以便代替原用的药物 若用前述的一般假设检验方法 P 可得出不拒绝H0的统计结论 即尚不能认为两种处理有差别 问题 能否认为两药等效 Why 例3 12为评价厄贝沙坦治疗轻 中度高血压病人的临床疗效 以录沙坦为对照 选取轻 中度高血压病人 采用双盲双模拟 随机对照法 治疗4周时的收缩压改变值的均数及标准差列入表3 5中 能否认为两种药物的降压效果等效 表3 5厄贝沙坦与氯沙坦的4周降压效果 kPa 1 建立假设 样本均数与总体均数两样本均数H0 0 H0 1 2 H1 0 H1 1 2 0 05 0 05 是等效界值 应在进行等效检验时 事先给定 是一个有临床意义的值 一般由研究者根据专业知识确定 2 计算统计量 1 样本均数与总体均数比较2 两样本均数比较 3 确定P值 作出统计推断根据 n 1 样本与总体 或 n1 n2 2 两样本 查t界值表 确定P值 若P 拒绝H0 可认为两总体均数等效 例3 12根据表3 5的资料能否认为两种药物的降压效果等效 表3 5厄贝沙坦与氯沙坦的4周降压效果 kPa 1 建立假设检验 确定检验水准H0 1 2 0 67kPaH1 1 2 0 67kPa 0 05 2 计算统计量 3 确定P值 作出统计推断查附表2 t界值表 得0 025 P 0 05 按 0 05水准拒绝H0 接受H1 可认为两种药物的降压效果等效 4 注意事项 1 值的选定在等效检验中十分重要 若 确定过大 将把不等效的处理措施判断为等价 若 确定过小 则很难得到等效的结果 2 惯用的假设检验与等效检验H0与H1的比较 惯用的假设检验等效检验H0 1 2H0 1 2 H1 1 2H1 1 2 方差分析 例5 1某社区随机抽取了30名糖尿病患者 IGT异常和正常人进行载脂蛋白 mg dL 测定 结果见表5 2 问三种人的载脂蛋白有无差别 表5 2糖尿病患者 IGT异常及正常人的载脂蛋白测定结果 总变异 组间变异 组内变异 1 建立检验假设和确定检验水准H0 三种人载脂蛋白的总体均数相等 即 1 2 3H1 三种人载脂蛋白的总体均数不全相等 0 05 总 N 1 30 1 29 组间 k 1 3 1 2 组内 N k 30 3 27MS组间 SS组间 组间 2384 026 2 1192 013MS组内 SS组内 组内 5497 84 27 203 62F MS组间 MS组内 1192 013 203 62 5 854 表5 4例5 1的方差分析结果 3 确定P值和作出推断结论以 组间为 1 组内为 2查F界值表 得F0 05 2 27 3 35 F0 01 2 27 5 49 本例F 5 8547 F0 01 2 27 故P 0 01 在 0 05水准上拒绝H0 接受H1 可以认为三种人的载脂蛋白不同 例5 2对小白鼠喂以A B C三种不同的营养素 目的是了解不同营养素增重的效果 采用随机区组设计方法 以窝别作为划分区组的特征 以消除遗传因素对体重增长的影响 现将同品系同体重的24只小白鼠分为8个区组 每个区组3只小白鼠 三周后体重增量结果 克 列于表5 5 问小白鼠经三种不同营养素喂养后所增体重有无差别 表5 5A B C三种营养素喂养小白鼠所增体重 克 1 建立检验假设和确定检验水准H0 三种营养素喂养的小白鼠体重增量相等 即 1 2 3H1 三种营养素喂养的小白鼠体重增量不全相等 0 05 总 N 1 24 1 23 处理 k 1 3 1 2 区组 n 1 8 1 7 误差 k 1 n 1 2 7 14 MS处理 SS处理 处理 144 92 2 72 46MS误差 SS误差 误差 340 54 14 24 32F MS处理 MS误差 72 46 24 32 2 979 表5 7例5 2的方差分析结果 3 确定P值和作出推断结论 以 处理 即 1 2和 误差 即 2 14查F界值表 得F0 05 2 14 3 74 本例F 2 980 05 根据 0 05的水准 不拒绝H0 尚不能认为三种营养素喂养的小白鼠体重增量有差别 多个样本均数间的多重比较 方差分析的结果提供了各组均数间差别的总的信息 但尚未提供各组间差别的具体信息 即尚未指出哪几个组均数之间的差别具有或不具有统计学意义 为得到这方面的信息 可进行多个样本均数间的两两比较 它又称为样本均数间的多重比较 multiplecomparison SNK q检验 SNK为Student Newman Keuls三人姓氏的缩写 检验统计量为q值 又常称为q检验 一般在方差分析结果拒绝 0 1 2 k时 再用SNK q检验进行多重比较 例5 5对例5 1资料作两两比较 H0 任两对比组的总体均数相等 即 A BH1 任两对比组的总体均数不等 即 A B 0 05 将三个样本均数从小到大依次排列 并编上组次 表5 8三个样本均数两两比较的q检验 变量变换的类型 1 对数变换2 平方根变换3 倒数变换4 平方根反正弦变换 相对数 率构成比相对比动态数列 发病率患病率 表4 1某地2000年5种慢性疾病构成比 标准化率直接法间接法 表4 4甲 乙两厂各年龄组人数及糖尿病患病率 表4 6直接法计算甲 乙两厂糖尿病标准化患病率 表4 7利用标准人口年龄构成计算标准化患病率 相对数应用的注意事项 1 计算相对数时分母不宜太小 2 分析时不能以构成比代替率 3 对观察单位数不等的几个率 不能直接相加求其总率 4 比较相对数时应注意可比性 5 对样本资料的比较应随机抽样 并作假设检验 表4 22000年某地区不同年龄组恶性肿瘤死亡构成比与死亡率 表4 3某地1990年和2000年5种慢性疾病发病情况 二项分布特点Poisson分布 二项分布的正态近似Poisson分布 率的抽样误差 抽查某地居民200人的粪便 检出蛔虫阳性40人 求 0 0283 2 83 总体率的区间估计查表法正态近似法 例7 7在某地随机抽取329人 作血清登革热血凝抑制抗体反应检验 结果29人阳性 估计该地人群血清登革热血凝抑制抗体阳性率 样本率为 8 81 率的标准误为 1 56 故该地人群血清登革热血凝抑制抗体反应阳性率的95 可信区间为 8 81 1 96 1 56 8 81 1 96 1 56 5 75 11 87 例7 8据以往经验新生儿染色体异常率为0 01 某研究者想了解当地新生儿染色体异常是否低于一般 随机抽查当地400名新生儿 结果1名染色体异常 请作统计推断 H0 0 01H1 尚无理由拒绝H0 据此样本尚不能认为该地新生儿染色体异常率低于一般新生儿 例7 9十八世纪天花在人群中的自然感染率高达90 1798年英国医生琴纳对23名志愿者作牛痘免疫试验 发现这23名接种了牛痘疫苗的人接触天花病毒后竟无一人感染 试从统计学的角度来推断牛痘疫苗是否有预防天花的作用 接种人群与不接种人群天花感染率相等 即接种人群比不接种人群天花感染率低 即单侧在成立的前提下 23人中自然感染人数 无一人感染的概率为 23人中自然免疫的概率微乎其微 P 0 0001 按的检验水平 拒绝 接受 无人感染并非偶然性所致 牛痘抗天花得到了有力的佐证 例7 10根据以往经验 一般胃溃疡患者有20 发生胃出血症状 现观察某医院65岁以上溃疡病人304例 有31 6 发生胃出血症状 问老年胃溃疡患者是否较容易出血 老年胃溃疡患者出血率等于一般胃溃疡患者 即老年胃溃疡患者出血率高于一般胃溃疡患者 单侧本例n 304 p 0 316 0 2 按式 5 12 有 查u界值表 附表2 时的t界值表 得 故 按单侧水平拒绝 接受 认为老年胃溃疡患者较一般患者易于出血 检验 四格表行列表列联表 例8 1为了解铅中毒病人是否有尿棕色素增加现象 分别对病人组和对照组的尿液作尿棕色素定性检查 结果见表8 1 问铅中毒病人与对照人群的尿棕色素阳性率有无差别 表8 1两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率 铅中毒病人29 18 74 7 17 26 3680 56对照组9 19 26 28 17 74 3724 32 合计38357352 05 注 括号内为理论频数 H0 1 2 即两总体阳性率相等 H1 1 2 即两总体阳性率不等 0 05 2 1 2 1 1 20 05 3 84 20 01 6 63 本例 2 23 12 故P 0 01 按 0 05水准拒绝H0 接受H1 因而可认为两总体阳性率有差别 统计学推论 结果说明 铅中毒病人有尿棕色素增高现象 结合样本率作实际推论 表8 3穿新旧两种防护服工人的皮肤炎患病率比较 防护服种类皮肤炎症合计患病率 阳性例数阴性例数 新1 3 84 14 11 16 156 7旧10 7 16 18 20 84 2835 7 合计11324325 6 H0 两组工人皮肤炎总体患病率相等 即 1 2H1 两组工人皮肤炎总体患病率不等 即 1 2 0 05校正 值为查 界值表得 0 10 P 0 05 按 0 05水准不拒绝H0 尚不能认为穿不同防护服的两组工人的皮肤炎患病率有差别 表8 4两种血清学检验结果比较 甲法乙法合计 45 a 22 b 67 6 c 20 d 26 合计514293 H0 两法总体阳性检出率无差别 即B C H1 两法总体阳性检出率不同 即B C 0 05 查 2界值得P 0 005 按 0 05水准拒绝H0 接受H1 故可认为甲乙两法的血清学阳性检出率不同 参照所得结果 说明甲法的阳性检出率较高 表8 5某省三个地区花生的黄曲霉毒素B1污染率比较 地区检验的样品数合计污染率 未污染污染 甲6232979 3乙30144431 8丙831127 3 合计44408447 6 H0 三个地区花生污染黄曲霉毒素B1污染率相等H1 三个地区花生污染黄曲霉毒素B1污染率不全相等 0 05 3 1 2 1 2查 2界值得P 0 005 按 0 05水准拒绝H0 接受H1 故可认为三个地区花生污染黄曲霉毒素B1污染率不相等 有地区性差异 表8 6鼻咽癌患者与眼科病人血型构成比较 组别A型B型O型AB型合计 鼻咽癌患者55455719176眼科病人4423369112 合计99689328288 H0 鼻咽癌患者与眼科病人血型的总体构成比相同 H1 鼻咽癌患者与眼科病人血型的总体构成比不全相同 0 05 2 1 4 1 3查 2界值得P 0 25 按 0 05水准不拒绝H0 故尚不能认为鼻咽癌患者与眼科病人的血型构成有差别 即尚不能认为血型与鼻咽癌发病有关 表8 7不同期次矽肺患者肺门密度级别分布 矽肺期次肺门密度级别合计十卄卅 4318814245 19672169 6175578 合计50301141492 H0 各期矽肺构成比相同并且各级肺门密度构成比相同 即矽肺期次与肺门密度无关联 H1 各期矽肺构成比不全相同或各级肺门密度构成比不全相同 即矽肺期次与肺门密度有关联 0 05查 2界值得P 0 005 按 0 05水准拒绝H0 接受H1 故可认为肺门密度与矽肺期次有关联 结合本资料可见肺门密度有随矽肺期次增高而增加的趋势 趋势检验 当率是按自然顺序的等级分层或者在连续性资料等级化后再分层的情况下 可采用CochranArmitage趋势检验 CochranArmitagetrendtest 以分析率随该分层变化的趋势 检验公式如下 表8 8某市不同年级中学生吸烟率 该市中学生吸烟率无随年级增加而增高的趋势 该市中学生吸烟率有随年级增加而增高的趋势由于本例是按性质分组的资料 评分为1 2 3 4 5 6 趋势检验所需中间结果见表6 10的后4列 用式 6 10 计算得值为 查附表5 得P 0 005 按水准 拒绝 接受 故可以认为该市中学生吸烟率有随年级增加而增高的趋势 两样本率的等效检验 H0 1 2 即两总体率不等价 H1 1 2 即两总体率等价 例8 10为研究国产与进口特布他林注射液对支气管炎 哮喘 和喘息性支气管炎 喘支炎 的平喘效果 临床试验结果见表6 14 问国产与进口的特布他林的疗效是否等价 0 1 0 05 表8 14国产与进口的特布他林的平喘疗效 本例 国产组p1 0 9000 n1 200进口组p2 0 8647 n2 207一般检验结果为 1 22 1 0 25 P 0 50 差别无统计学意义 尚不能认为国产与进口的特布他林的平喘疗效有差别 但因不知其II型错误概率的大小 故还难以判断它们的疗效是否相同 1 建立检验假设和确立检验水准H0 两种药物治疗效果不等效 即 H1 两种药物治疗效果等效 即 0 05 2 计算检验统计量按式 6 12 6 17 和式 6 1 计算理论频数和值试验组对照组 3 确定P值和作出推断结论查附表3 界值表 得0 025 P 0 05 按 0 05水准 拒绝H0 接受H1 故可以认为国产与进口的特布他林的平喘效果等价 本例如作u检验 单侧 按式 6 18 计算统计量 查附表2 t界值表 得0 01 P 0 025 结论同前 等效检验时应注意的问题 1 等效检验的目的在于推断两总体率是否等效 须在试验设计时规定检验水准 2 两样本率比较的等效检验 两样本率差值必须小于等效界值 有人建议 最大不应超过对照组样本率的20 3 等效界值 是一个有临床意义的值 如在新药研究时 规定新药有效率比标准药提高多少才有意义的值 等效界值的选定至关重要 唯一的途径是由该研究领域的专家 从专业角度反复论证 并结合成本效益估计出一个允许的差值 4 等效检验与一般的假设检验有所不同 估计样本含量的方法也略有差别 应用条件计算过程注意事项 非参数统计秩和检验 参数统计与非参数统计的区别秩和检验的计算过程 编秩 非参数统计的概念 nonparametrictest 参数统计 在样本所来自的总体分布型已知 如 正态分布 的基础上 对总体参数进行估计或检验 如 t检验 方差分析 非参数检验 不依赖总体的分布型 不对总体参数进行推断 只是通过样本观察值推断总体的分布位置 如 秩和检验 Ridit分析 非参数检验的优缺点 优点不受总体分布的限制 适用范围广 可以是计量资料 等级资料以及一端或两端无确切数据的资料 计算简便 易于掌握 不足对于符合参数检验条件的资料其检验效能较低 因而 对这类资料应首选参数检验 不满足者 则用非参数检验才是准确的 表7 110名健康人用离子交换法与蒸馏法测定尿汞值 g l 检验步骤 1 建立检验假设 确定检验水准 H0 差值总体中位数Md 0H1 Md 0 2 计算检验统计量T求差值 见表7 1 4 编秩差值为0 则不计该例 如两差值相等 则取其平均秩次 给秩添加符号 见表7 1 5 求秩和并确定检验统计量 本例T 18 5 3 确定P值 并作出统计推断 A 当n 50时 查附表6 T界值表 本例n 9 T 18 5 查表得双侧P 0 10 按双侧水准不拒绝H0 尚不能认为两法测定尿汞值有差别 B 当n 50时 用正态近似法 u检验 按式 7 1 计算u值 2 成组设计两样本比较的秩和检验 Wilcoxon两样本比较法 1 原始数据的两样本比较例7 3某实验室观察局部温热治疗小鼠移植肿瘤的疗效 以生存日数作为观察指标实验结果见表7 3 试检验两组小鼠生存数有无差别 表7 3两组小鼠发癌后生存日数 检验步骤 1 建立检验假设 确定检验水准 H0 两组小鼠生存日数总体分布相同H1 两组小鼠生存日数总体分布不同 2 计算检验统计量T编秩将两组数据由小到大统一编秩如原始数据相同则取其平均秩次求秩和并确定检验统计量T本例n1 10 n2 12 检验统计量T 170 3 确定P值 并作出统计推断 A 查附表7 T界值表 本例n1 10 n2 n1 2 T 170 查表得P 0 05 按双侧 故可认为实验组生存日数较对照组长 B 若n1 n2 n1超出附表7的范围 则用正态近似法 可按式 7 3 计算u值 7 3 式中 N n1 n2 0 5 连续性校正系数 直线相关直线回归 0 r 1 1 r 0 r 1 r 1 r 0 r 0 某地一年级12名女大学生的体重与肺活量的数据如下 试求肺活量 L 对体重 kg X的直线相关与回归方程 体重 kg X424246464650505052525858肺活量 L Y2 552 202 752 402 802 813 413 103 462 853 503 00 检验女大学生体重与肺活量间是否有直线相关关系 Ho 0 两变量间无直线相关关系H1 0 两变量间有直线相关关系 0 05本例n 12 r 0 7495 按式 10 18 12 2 10查附表2 t界值表 得0 005 p 0 002 按 0 05水准拒绝Ho 接受H1 故可以认为一年级女大学生体重与肺活量间呈正的直线关系 最小二乘法 1 描述两变量的依存关系 2 利用回归方程进行预测 forecast 3 利用回归方程进行统计控制 statisticalcontrol 应用直线回归应注意的问题直线回归应用很广泛 但应注意防止不恰当的使用 1 作回归分析要有实际意义 不能把毫无关联的两种现象勉强作回归分析 即便有回归关系也不一定是因果关系 还必须对两种现象间的内在联系有所认识 即能从专业理论上作出合理解释或有所依据 2 在进行直线回归分析前 应绘制散点图 当观察点的分布有直线趋势时 才适宜作直线回归分析 散点图还能提示资料有无异常点 outlier 即对应于残差绝对值特别大的观测数据 异常点的存在往往对回归方程中的系数的估计产生较大的影响 因此 需要复查此异常点 若是测定 记录或计算机录入错误 应予修正或删除 3 直线回归方程的适用范围一般以自变量的取值范围为限 在此范围内求出的估计值 一般称为内插 interpolation 超过自变量取值范围所计算的值称为外延 extrapolation 若无充分理由证明超过自变量取值范围还是直线 应该避免外延 直线相关与回归的应用 区别与联系 一 区别 一 资料要求不同回归要求因变量Y服从正态分布 X是可以精确测量和严格控制的变量 一般称为 型回归 相关要求两个变量X Y服从双变量正态分布 这种资料若进行回归分析称为 型回归 可以计算两个回归方程由X推Y的回归方程由Y推X的回归方程 二 应用情况不同说明两变量间依存变化的数量关系用回归 说明变量间的相关关系用相关 二 联系 一 方向一致对一组数据若同时计算r与b 它们的正负号是一致的 r为正号说明两变量间的相互关系是同向变化的 b为正 说明X增 减 一个单位 Y平均增 或减 b个单位 二 假设检验等价对同一样本 r和b的假设检验得到的t值相等 由于r的假设检验可直接查表 而b的假设检验计算较繁 故在实际

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论