已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
回归系数的假设检验前面所求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数b为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作b是否为零的假设检验,可用方差分析或t检验。 .P(x, y) Y - - X 应变量Y的平方和划分示意图任一点P的纵坐标被回归直线与均数截成三段:第一段,表示实测点P与回归直线的纵向距离,即实际值Y与估计值之差,称为剩余或残差。第二段,即Y估计值与均数之差,它与回归系数的大小有关。|b|值越大,也越大,反之亦然。当b=0时,亦为零,则=,也就是回归直线不能使残差减小。第三段,是应变量Y的均数。依变量y的总变异由y与x间存在直线关系所引起的变异与偏差两部分构成,即上式两端平方,然后对所有的n点求和,则有 由于,所以于是 =0 所以有 反映了y的总变异程度,称为y的总平方和,记为;反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为;反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和或剩余平方和,记为SSr。总变异SS总是由回归关系引起的SS回和与回归无关的其它各种因素产生的SS剩所构成。若回归直线与各实测点十分吻合,则SS回将明显大于SS剩,当全部实测值都在回归直线上时,SS总=SS回,SS剩=0,反之,若回归直线拟合不好,SS回相对较小,SS剩则相对增大。可见SS回/SS剩反映了回归的效果。上式又可表示为: 这表明y的总平方和划分为回归平方和与离回归平方和两部分。与此相对应,y的总自由度也划分为回归自由度与离回归自由度两部分,即 在直线回归分析中,回归自由度等于自变量的个数,即;y的总自由度;离回归自由度。于是:离回归均方,回归均方 (1)、方差分析法:具体计算如下:1、 建立无效假设:H0 := 0, 即胆固醇与年龄之间无直线关系H1 :0, 即胆固醇与年龄之间有直线关系= 0.05 2、计算SS总=88.8081 df总=19SS回=b l xy =0.141 (453.7385)=63.9771 df回=1 SS剩 = SS总 SS 回 =88.8081-63.9771=24.8310 df剩=18 方差分析结果表变异来源SSdfMSF总变异88.808119回归63.9771163.977146.377剩余24.8310181.3795 3、查表确定p值 F0.05(1,18) = 4.41 , F0.01(1,18) = 8.29 P0.01 故按= 0.05水准拒绝无效假设,接受备择假设。 4、结论:可以认为高血脂病人治疗前胆固醇与年龄由直线关系。(2)、t检验 基本思想与样本均数与总体均数比较的t检验类似,而检验统计量t值的计算按下式完成: df = n-2 本例 n =20,SS剩=1.3795 , lxx=3216.95, b=0.141 按df = 18 ,查t界值表,t0.05(18) =2.101, t0.01(18) =2.878 ,按a=0.05 水准,拒绝H0, 接受H1 , 结论同上。 直线回归方程的应用统计预测: 1、总体回归系数的区间估计根据参数估计原理,回归系数b是总体回归系数的点估计,正像样本均数不一定恰好等于总体均数一样,需要对总体回归系数进行区间估计。 式中Sb为回归系数的标准误;n-2为自由度。回归方程为根据资料的样本回归系数b=0.141估计总体回归系数的95%可信区间。已知b=0.141, sb=0.0207, t0.05(18)=2.101则总体回归系数的95%可信区间为(0.141-2.1010.0207, 0.141+2.1010.0207)=(0.0975,0.1977)2、的区间估计是指总体中自变量X为某一定值X0时,的总体均数。对的估计可计算可信区间: 式中即的标准误,可按下式计算: 式中SY.X为剩余标准差。当时,此时,可信区间的范围最窄,预测精度相对较高。试计算当X0=50岁时,的95%可信区间。已知,, sy.x=1.175=2.661+0.14150 = 9.71t0.05(18)=2.101当X0=50时,的95%可信区间为(9.71-2.1010.3418,9.71+2.1010.3418)= ( 8.99, 10.43) 即当年龄为50岁时,估计其胆固醇的的总体均数在(8.99, 10.43) 范围内的可能性为95%。3、个体Y值的容许区间总体中,X为一定值时,个体Y值的波动范围,可按下式求出: 式中SY为X取一定值时,个体Y值的标准差,其计算公式为 试计算当X0=50时,个体Y值的95%容许区间。已知 =9.71,t0.05(18)=2.101,SY.X=1.175 故当X0=50岁时,个体Y值的95%容许区间为:(9.71-2.1011.2230, 9.71+2.1011.2230)=(7.14, 12.28) 即当年龄为50岁时,总体中有95%的个体Y值波动在(7.14,12.28) 的范围内。用回归方程进行统计控制控制是指党要求Y值在一定的范围内波动时,如何通过控制X的范围来实现统计控制的目标, 所以统计控制是利用回归方程进行的逆估计。如:为使一名糖尿病人的血糖维持在正常范围(4.446.66mol/L),如何控制血中胰岛素水平?这可以对回归的逆运算来实现。例如:资料已建立了有胰岛素估计血糖平均水平的直线回归方程,问:欲将血糖水平控制在正常范围的上限6.66mol/L以内时,血中胰岛素应维持在什么水平上?已知,取0.05,本例当个体y值取6.66mol/L 时的x值,故取单侧t0.05(18)=1.734,所得方程为:由此式解得x = 32.64(mu/L) , 即如要将一名糖尿病人的血糖控制在6.66mol/L以内,胰岛素水平可维持在32.64(mu/L)以上。又例:某市环境监测站在某交通点连续测定30天,每天定时采样3次,发现大气中NO2浓度Y(mg/m3)与当时的汽车流量X(辆/小时)呈直线关系,根据90对观测数据求得回归方程 ,剩余标准差。若NO2最大容许浓度为0.15mg/m3,则汽车流量应如何控制?设a=0.05。本例 ,a=0.05,n=90-2=88,查表得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁省沈阳市重点中学2025年高一生物第一学期期末质量跟踪监视模拟试题含解析
- 湖北职业技术学院《民航管理信息系统》2024-2025学年第一学期期末试卷
- 浙江省余姚市第四中学2025-2026学年高一上生物期末达标检测试题含解析
- 血液科白血病急性期护理须知
- 苏州工业园区职业技术学院《农化产品高效利用与管理》2024-2025学年第一学期期末试卷
- 风湿免疫科类风湿病综合治疗方案
- 普外科腹腔镜胆囊切除术术后护理规范
- 全科医学科慢性阻塞性肺疾病管理规范
- 肝癌靶向治疗方案
- 社会学实训报告
- 育婴员初级复习题与答案
- 燃气题库考试
- 风电对鸟类迁徙影响研究-洞察及研究
- 小学生摄影培训
- 学校暗访活动方案
- 2025药物警戒培训
- (项目管理)建设项目后评价报告书
- 导管室设备管理制度
- 社区警务介绍课件
- AI大模型赋能应急管理数字化建设方案
- 沉浸式元宇宙内容创作与用户体验研究-洞察阐释
评论
0/150
提交评论