第二军医大学《医学统计学》多元线性回归分析第15章_第1页
第二军医大学《医学统计学》多元线性回归分析第15章_第2页
第二军医大学《医学统计学》多元线性回归分析第15章_第3页
第二军医大学《医学统计学》多元线性回归分析第15章_第4页
第二军医大学《医学统计学》多元线性回归分析第15章_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、multipleelinearregressinalysis、多元线性回归分析、第15章、第二军医大学卫生统计学教室照顾、2、讲义内容第一节多元线性回归(重点)第二节参数选择方法(重点)第三节多元线性回归的应用与注意事项、3、第一节多元线性回归、第一、多元线性回归模型、4、5、 多元回归:多个y,多个x多元回归:一个y,多个x,6,0常数项j偏振回归系数:如果其他参数不变,则Xj增减一个单位y的平均变化量。 e去除m个自变量影响y后的随机误差。 7、多线性回归模型的应用条件:1.Y与X1、X2、Xm之间存在线性关系2 .各Yi之间相互独立的3.e遵循平均为0、方差为2的正态分布。 8、多线性回归分析步骤:1.根据样本数据求模型参数的估计值:2.假设检验回归方程式和各Xj。9、2、建立多维线性回归方程式10、15、15、16、17、18、19、19、19、19、19、19、19、19、19、19、19、19、19、19、19、16、17、18、19、三、多次线性回归方程的假设检验和评价、20、(一)回归方程的假设检验和评价、1 .方差分析法,均不为0。 21、22、23、2 .决定系数R2,血糖值变异的60%可以通过总胆固醇、甘油三酯、胰岛素和糖化血红蛋白的变异来解释。 24、3 .复相关系数r、y与多个参数之间的线性相关程度y以及估计值之间的Pearson相关系数r。 25,(2)各个变量的假设验证和评价,1 .偏回归平方和表示在模型中包含其他的m-1个参数的条件下,该参数给予y的回归贡献。 其值越大,表示对应的参数越重要。26、27、0.6129.9627.0635.7939133.7107、28、胰岛素(X3)和糖化血红蛋白(X4)与血糖(y )具有线性回归关系。29、2.t检定法、30、胰岛素(X3)和糖化血红蛋白(X4)与血糖(y )有线性回归关系。 31 .正规化回归系数bj的绝对值随着用于比较引数Xj对y的影响的绝对值变大而变大。 归一化回归公式的截距为0。 3、标准回归系数、标准回归系数与一般回归方程的回归系数的关系:32、按对血糖影响大小的顺序为糖化血红蛋白(X4)、胰岛素(X3)、甘油三酯(X2)和总胆固醇(X1)。 胰岛素受到负面影响。 33、第二节参数的选择方法、34、一、全局选择法比较通过参数的各种组合确立的回归方程式,从所有组合中选择一个“最佳”回归方程式。 35、R2可用于评估回归公式的优劣。 为了比较两个不同参数回归方程,必须考虑到方程包含参数的个数的影响而对R2进行校正。 “最佳”回归公式是指最大者。 1 .校正决定系数选择方法,36、p是方程式中的参数的个数。 最优方程的Cp期望值为p 1。 最好选择Cp最接近P 1的回归公式。 2 .选择法,37,38,二,阶段选择法全局选择计算量大: 6变量,计算26-1=63方程式; 10个变量计算210-1=1023个方程式。 按照选择变量的顺序,前进法、后退法和阶段性回归法不同,其共同特征在于每步只导入或排除一个参数Xj。 对39、Xj的取舍进行f检验:计算进入第l步骤时: p:方程式的参数个数SS次: Xj的偏回归平方和SS馀数:残差平方和,40、1 .前进法开始方程式中没有参数,从方程式之外选择偏回归平方和最大的参数作为f检验,决定是否导入方程式缺点:后续变量的引入可能不重要以前引入的变量。 Xj入选,41,2 .后退方法(仅供未选择)将所有参数包括在方程中,通过对偏差回归平方和最小的参数进行f检验来确定是否将其从方程中排除。缺点:参数高相关性可能导致不正确的结果。 Xj间隔剔除,42,3 .逐次回归法(先前选择后的双向滤波)在方程式中没有参数,从方程式之外选择偏差回归平方和最大的参数作为f检验,决定是否进入方程式的各参数进入方程式时,从方程式中选择偏差回归平方和最小的参数作为f检验,从方程式中排除另外,43、输入值越小,选择参数的基准越严格,方程式中选择的参数越少。 输入值越大则相反。 小样本:输入=0.05,输出=0.10。 大样本:输入=0.10,输出=0.15。 进入,在选择44、X4之前建立四个线性回归方程式X1之前,建立了三个含有参数和两个参数的多线性回归方程式,以使得在Xj的上一步骤被去除之后不选择下一步骤。45、46、47、48、49、50、第三节多次线性回归的应用及注意事项、51、一、多次线性回归的应用1 .影响因素分析、年龄(X1)饮食习惯(X2)吸烟状况(X3)工作紧张度(X4)家族史(x5)、高血压(y )、bj的意义在其他参数不变时,Xj在一个单位时间内y的平均变化因此,能够排除拥挤因素。 52、2 .心脏表面积(Y)=b0 b1心横径(X1) b2心纵径(X2) b3心横径(X3)新生儿体重(Y)=b0 b1胎儿妊娠年龄(X1) b2胎儿头径(X2) b3胎儿胸径(X3) b4胎儿腹径(X4)、53、3 .统计控制使用回归式进行逆推定,确定y并控制x 用射频治疗器治疗脑肿瘤:脑皮质损伤半径(Y)=b0 b1射频温度(X1) b2照射时间(X2)、54、2,多次线性回归应用注意事项1 .指标量化应变量y以连续变量x连续,序列分类或无序分类变量(1)连续变量: X(2)序列分类变量: 1轻X=2中三重、55、 (3)无序分类变量伪变量,56,2 .样本的含量n至少是x个数m的510倍3 .多重共线性的实用非常普遍,可以使用最小二乘法建立的回归方程式无效的去除方法:去除成为主成分回归共同线性的参数。57、4 .变量之间的交互对于y的作用大小与另一个参数的读取值有关。 血糖(y )和总胆固醇(X1)、甘油三酯(X2)、胰岛素(X3)、糖化血红蛋白(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论