




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归分析 计算机在生物工程中的应用 上海应用技术学院香料香精技术与工程学院 授课老师 王一angyifei QQ 46478797 概述 变量之间的关系 确定性关系 非确定性关系 讨论随机变量与非随机变量之间的关系问题 回归分析 回归分析要解决的问题 确定二组或二组以上相对应的变量之间的相关关系 找出这些变量之间的定量关系式 对这个定量关系式的可靠性进行统计检验 根据变量之间的定量关系式作出预报和控制 进行优化分析 对多因素问题进行因素分析 确定各因素之间的主次关系 应用回归分析的原理 作出试验处理少 统计性质好的实验设计 回归分析的种类 如果因变量是连续变量 设自变量个数为K 当K 1时 回归分析的种类有 直线回归分析 一元线性回归分析 通过直线化实现简单曲线回归分析非线性回归多项式回归 回归分析的种类 当K 2时 称为多元回归分析 当同时对多个因变量进行回归分析时称为多重回归 在多元回归分析中 简单而又实用的是多元线性回归分析 如果因变量是与生存时间有关的连续变量而且未被离散化 如 生存时间 复发时间 死亡时间等 而自变量可以是定性的 也可以是定量的 此时采用生存分析中的半参数或参数回归分析 如果因变量是有序变量 无论它取2个离散值 如 死与活 复发与未复发 还是多个离散值 自变量可以是定性的和定量的 时 都可选用logistic回归分析 直线回归分析 直线回归分析 LinearRegression 是基于最小二乘法 LeastSquareMethod 原理产生的最优无偏估计 它是研究一个自变量 Independent 与一个因变量 Dependent 之间是否存在某种线性关系的统计学方法 例题讲解 某地一年级12名女大学生的体重 kg 与肺活量 L 的直线回归分析 例题讲解 写入数据文件 linreg1 sas submit 生成SAS数据集 work linreg1 例题讲解 solution assist dataanalysis regression Linear 例题讲解 Select table work linreg1Select columns y x 例题讲解 submit 截距 回归系数 例题讲解 结果分析误差均方的平方根 RootMSE 0 40305决定系数 R2 0 3809因变量均值 DependentMean 2 83583直线回归方程 Y 0 01954 0 05709X 例题讲解 如果用户想得到回归分析更详细的结果 可以选用 additionaloptions 例题讲解 additionaloptions 的7种选择selectionmethod选择回归分析方法displayedstatistics显示统计量coefficients系数parameterestimates参数估计regressionplots回归图形outputtablespoon输出表格rowoptions行选择 编程方法 多元线性回归分析 研究多个自变量 independent 与一个因变量 dependent 之间是否存在某种线性关系 称为多元线性回归分析方程 y b0 b1x1 b2x2 bmxm x为自变量m是自变量个数b0为回归方程的常数项b1等为偏回归系数 例题讲解 已知29例儿童的血红蛋白 hemogl g 与钙 Ca ug 镁 铁 锰 铜的含量 并已建立数据文件 mulreg1 sas 试建立钙 镁 铁 锰 铜对血红蛋白的多元线性回归分析 例题讲解 例题讲解 调入文件 mulreg1 sas solution assist dataanalysis regression Linear 例题讲解 submit后得到结果 例题讲解 结果分析得到多元线性回归方程y 1 379787 0 069304Ca 0 028253Mg 0 027934Fe 16 577335Mn 1 715089Cu回归方程的显著性检验p 0 0001 达到 0 05显著水平 y与x1 x2 x3 xm的线性关系显著回归系数的显著性检验总体回归效果显著并不说明每个自变量对因变量都很重要 即可能有某个自变量对y不起作用 对这种自变量希望从回归方程中剔除 这样可以建立更简单的回归方程 多元逐步回归分析 additionaloptions selectionmethod 多元逐步回归分析 多元逐步回归分析 FORWARD或F前进法 前向选择法 从模型中没有变量开始 每次将一个最显著的变量引入模型 直到模型以外的变量不再有显著的F值为止BACKWARD或B后退法 后向选择法 从模型中含有所有自变量开始 每次从模型中剔除一个贡献最小的变量 直到模型中只剩下均为显著的变量为止STEPWISE逐步回归法每次引入模型一个最显著的变量 然后考虑从模型中剔除一个最不显著的变量 直到既没有变量引入也没有变量剔除为止 多元逐步回归分析 MAXR最大R2改进法 最大相关法 要求模型中的变量个数不超过20 从模型中没有变量开始 每次选择一个产生最大R2的变量进入模型 然后将模型中的每个变量与模型外的变量比较 决定是否能产生最大R2的变量代替模型中的某一个变量 直到没有替换可增加R2为止MINR最小R2改进法 最小相关法 要求模型中的变量个数不超过20 此法类似于MAXR法 但是MINR法寻找产生最小R2增量的替换 多元逐步回归分析 得到结果y 1 43741 0 06603Ca 0 02911Fe 18 38605Mn 1 97671Cu 多元逐步回归分析 同样也可以用编程方法分析 多元逐步回归分析 多元逐步回归分析 多元逐步回归分析 多元逐步回归分析 多元逐步回归分析 y 1 48741 0 06603Ca 多元逐步回归分析 y 1 07179 0 04046Ca 0 03118Fe 多元逐步回归分析 多元逐步回归分析 多元逐步回归分析 R SQUARE复相关系数平方R2C P Cp统计量 是误差总平方的度量REGRESSION回归变异 ERROR误差变异TOTAL总的变异PARAMETERESTIMATE回归系数估计值 例题讲解 在阿尔卑斯山及苏格兰的17个地方沸点及大气压Forbes数据 例题讲解 散点图 例题讲解 写入程序submit 例题讲解 得到结果 例题讲解 例题讲解 置信区间 置信区间又称估计区间 是用来估计参数的取值范围的 1 对于具有特定的发生概率的随机变量 其特定的价值区间 一个确定的数值范围 一个区间 2 在一定置信水平时 以测量结果为中心 包括总体均值在内的可信范围 3 该区间包含了参数 真值的可信程度 4 参数的置信区间可以通过点估计量构造 也可以通过假设检验构造 例题讲解 通过cli方法得到各个预测值的95 置信区间 例题讲解 Submit后 得到结果 例题讲解 通过clm方法得到各个预测值平均值的95 置信区间 例题讲解 Submit后 得到结果 例题讲解 同时用cli和clm方法得到各个预测值和预测值平均值的95 置信区间 例题讲解 Submit后 得到结果 例题讲解 用SAS画出预测值平均值置信区间图 例题讲解 用SAS同时画出预测值平均值置信区间图 实例分析 一元回归 实例分析 一元回归 前言 背景介绍 实例分析 一元回归 试验内容 实例分析 一元回归 实例分析 一元回归 根据模型做出预测 与别人的结果比较 是讨论的重要组成部分 实例分析 一元回归 置信区间 实例分析 一元 多元回归 实例分析 多元逐步回归 逻辑斯蒂 Logisticregression 回归分析 因变量为二值 二项 疾病的发生与不发生有或没有数个自变量对因变量产生影响 Logisticregression 逻辑斯蒂 Logisticregression 回归分析 1 多元线性回归方法要求Y的取值为计量的连续性随机变量 2 多元线性回归方程要求Y与X间关系为线性关系 3 多元线性回归结果不能回答 发生与否 logistic回归方法补充多元线性回归的不足 逻辑斯蒂 Logisticregression 回归分析 该法研究是当y取某值 如y 1 发生的概率 p 与某暴露因素 x 的关系 P 概率 的取值波动0 1范围 基本原理 用一组观察数据拟合Logistic模型 揭示若干个x与一个因变量取值的关系 反映y对x的依存关系 逻辑斯蒂 Logisticregression 回归分析 1 变量的取值logistic回归要求应变量 Y 取值为分类变量 两分类或多个分类 自变量 Xi 称为危险因素或暴露因素 可为连续变量 等级变量 分类变量 可有m个自变量X1 X2 Xm 逻辑斯蒂 Logisticregression 回归分析 2 两值因变量的logistic回归模型方程 一个自变量与Y关系的回归模型如 y 发生 1 未发生 0 x有 1无 0 记为p y 1 x 表示某暴露因素状态下 结果y 1的概率 P 模型 或 模型描述了应变量p与x的关系 逻辑斯蒂 Logisticregression 回归分析 几个logistic回归模型方程 Logistic回归模型Logistic回归的logit模型Logistic回归模型 逻辑斯蒂 Logisticregression 回归分析 例题讲解 在女生月经初潮调查中 23名11 15岁女生的月经与体质情况如表 其中 x1是30秒脉搏数 x2是体重 x3是年龄 月经Y是二项分类变量 0表示未来月经 1表示已来月经 试用Logistic回归分析脉搏 体重和年龄与月经来潮的关系 例题讲解 采用编程方法分析 调入logistic1 sas文件 submit 例题讲解 例题讲解 由最大似然估计法得到对数优势线性判别函数LogitP 30 1643 0 0642x1 1 0096x2 0 8098x3 月经未来潮概率 根据依变量取值排序 先 0 后 1 针对未来月经 例题讲解 例题讲解 例题讲解 由最大似然估计法得到对数优势线性判别函数LogitP 30 1643 0 0642x1 1 0096x2 0 8098x3 月经来潮概率 根据依变量取值排序 先 1 后 0 针对已来月经 例题讲解 例题讲解 50例急性淋巴细胞性白血病病人 治疗时取得了外周血中细胞数x1 千个 mm3 淋巴结浸润等级x2 分为0 1 2 3四级 出院后巩固治疗x3 有巩固治疗为1 无巩固治疗为0 并随访取得病人的生存时间T 月 变量Y 生存时间1年以内为0 1年以上为1 试建立Logistic回
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司美味大餐活动方案
- 公司爬羊台山活动方案
- 公司搬迁美食活动方案
- 公司旅游两天策划方案
- 公司春季出游活动方案
- 公司春游出行活动方案
- 公司汉服体验活动方案
- 公司组织韶山活动方案
- 公司环保日活动策划方案
- 公司游戏策划方案
- 贸易安全内部培训教材
- 沪科版七年级数学下册知识点
- TDSQL认证考试考题及答案-70分版
- 云南省大理白族自治州(2024年-2025年小学三年级语文)统编版期末考试(下学期)试卷(含答案)
- 2025年日历( 每2个月一张打印版)
- 2023年北京海淀社区工作者考试真题
- 2024年国开电大 高级财务会计 形考任务4答案
- 幼儿园中班数学活动课件:有趣的排序
- 2024年广东省惠州一中学英语七下期末达标检测试题含答案
- 2023-2024学年广西壮族自治区桂林市高二下学期期末质量检测数学试卷(含答案)
- 化妆品行业联合研发合同样本
评论
0/150
提交评论