


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验报告八实验课程: 回归分析实验课专业:年级:姓名:学号:得分:
统计学1教师评语:学生收获与思考:2实验八含定性变量的回归模型(4学时)一、实验目的1.掌握含定性变量的回归模型的建模步骤3.运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、实验理论与方法把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。例如研究粮食0-1DD1=0表示干旱年份,i粮食产量的回归模型为:y=β+βx+βD+εi 0 1i 2i i。因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据logistilogisti回归模型,probi三.实验内容DATASASxt10321xt103对公司规模和公司类型的回归,并对所得到的模型进行解释。2h对玻璃做自由落体撞击,y=1y=022的logistic回归,并解释回归方程的含义。323.其中的Logisitic回归分析影响毕业去向的因素。四.实验仪器计算机和SAS软件五.实验步骤和结果分析SASxt10321xt103公司规模和公司类型的回归,并对所得到的模型进行解释。3RR0.8951,可以认为回归拟合效果较好。回归方程通过F的。由参数估计表,可以看出,全部变量都是显著的,回归方程为:^33.870.102x1
8.06x2其中,x2是虚拟变量,当公司类型为“互助”时,x2为0,为“股份”时,x2为1。由方程可知,x2为1,即股份制公司的保险革新措施速度y会更大。股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。规模公司大。SAS程序:dataxt103;inputyx1x2/*01*/cards;1715104269202117503031022104002770122100191200429001623802816411527211129513868131851212241201661133051301241142461;run;procregdata=xt103;modely=x1x2;run;y=1y=022的logistic回归,并解释回归方程的含义。模型信息:5模型解出的是y=0的概率。由三个检验中,统计量的P值都小于0.05,可以认为模型是显著的。由Wald检验的显著性概率及其P值,可以看出,h变量对方程的影响是显著的。由极大似然估计,各个参数系数也通过检验。因此模型有效。6logit
p(y0)
exp(14.597.98h)1exp(14.597.98h)模型意义为,小球掉落高度为h,则玻璃未破碎的概率为p,而y=0表示玻璃未破碎。也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为h时,玻璃未破碎的概率就是7.98h)p(y0)
1exp(14.597.98h),那么,玻璃会破碎的概率就为1-p(y=0),这也可以看成是一种比例,就是大量实验中,同个高度h,玻璃会被击破的比例。SAS程序:datadatawjz;inputhy/*01*/cards;1.5001.5201.5401.5601.5811.6001.6201.6401.6601.6811.7001.7201.7401.7611.7801.8011.8201.8401.8611.8811.9001.9211.9401.9611.9812.001;run;7proclogisticdata=wjz;modely=h;run;proclogisticdata=wjz;classh;modely=h/link=glogitaggregatescale=none;run;23.其中毕业Logisitic回归分析影响毕业去向的因素。2 3 专业课x1 英语x 性别x 月生活费x 毕业去向2 3 两个统计量的P值均大于0.05,说明模型拟合的较好。8BETA=0)P学意义。三个变量中,有两个是不显著的变量,x3,x2,剔除x3:两个统计量的P值均大于0.05,说明模型拟合的较好。9:BETA=0(评分,wald)的结果P0.01统计学意义。三个变量都是显著的。以x4“由模型可以看出:p(y2)
-19.1160.17x1
0.038x2
0.004x)41-19.1160.17x1
0.038x2
0.004x4
)-18.010.012x1
0.122x2
0.0101x)4p(y
-18.010.012x1
0.122x2
0.0101x)41-19.1160.17x1
0.038x2
0.004x4
)-18.010.012x1
0.122x2
0.0101x)410从参数估计表中,与参加工作的同学相比,读研的的同学相比,读研的同学其专业课成绩更好x1的P=0.00,而外语成绩x2的p=0.35)和经济状况x4的P=0.18)没有显著差异Sas程序:datadataa;inputinputx1x2x3x4y;cardscards;9565.0160026362.0085018253.0070026088.0085037265.0175018585.00100039595.00120029292.0195026363.0085017875.0190019078.0050018283.0175028065.0185038375.0060026090.0065037590.0180026383.0170018575.0075027386.0095028666.01150039363.00130027372.0085018660.0195027663.00110019686.0075027175.01100016372.0185026088.0065016795.0150018693.0055016376.0065018686.0075027685.016501118292.08292.0195037360.07360.0080018285.08285.0175027575.07575.0075017263.07263.0165018188.08188.0085039296.09296.019502run;run;procprintprocprint;runrun;proclogisticproclogistic;classclassx3;modelmodely(ref='3')=x1x2x3x4/link=glogit aggregatescale=none;runrun;proclogisticproclogistic;classclassx3;modelmodely(ref='3')=x1x2x4/link=glogit aggregatescale=none;runrun;proclogisticproclogistic;classclassx3;modelmodely(ref='1')=x1x2x4/link=glogit aggregatescale=none;runrun;六.收获与思考七.思考题当自变量是定性变量的时候,我们需要引进虚拟变量进行数量化,当定性变量有n个水平的时候,我们该引进多少的虚拟变量,否则会怎样?不妨试试在sas中试试会出现什么问题。答:当定性变量有n个水平时应该引进n-1个虚拟变量。否则最后一个虚拟变量无法用最小二乘估计计算出来。例:X1-X3为虚拟变量。DataDataa;inputinputx1x2x3xy@@;cardscards;1001.26751001.35771001.40781001.58821001.26751001.35771001.40781001.58820101.71650101.76660101.80680101.85700101.71650101.76660101.80680101.8570120011.22680011.35690011.46700011.4472;procregdata=a;modely=x1-x3x;run;X3没有参数估计结果。因为x1x2x3出现完全共线性,x1x2均为0时即代表了x3为1.表21iyx1公司类型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份表2213序号h(m)y序号h(m)y11.500141.76121.520151.78031.540161.80141.560171.82051.581181.84061.600191.86171.620201.88181.640211.90091.660221.921101.681231.940111.700241.961121.720251.981131.740262.001序号1序号1234567891011121314151617181920212223专业课x1英语x2性别x3月生活费x4956382607285959263789082808360756385738693738665.062.053.088.065.085.095.092.063.075.078.083.065.075.090.090.083.075.086.066.063.072.060.010001001010110011001001y600 2850 1700 2850 3750 11000 31200 2950 2850 1900 1500 1750 2850 3600 2650 3800 2700 1750 2950 21500 31300 2850 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030放射治疗设备精准度检测与技术革新方向预测报告
- 2025-2030换电重卡运营经济性测算研究报告
- 2025-2030律师行业年轻律师培养与人才留存策略调研
- 无线侧信道攻击分析-洞察与解读
- 外科护理学题库四川及答案解析
- 宠物医院从业资格考试及答案解析
- 配电箱质检报告及验收标准模板
- 医美机构信息化管理系统功能总结
- 年度融资部门业务总结与发展规划
- 工会活动组织与实施方案模板
- 突发公共事件对转化进程的冲击效应-洞察阐释
- 中医药健康知识讲座课件
- 2025年房地产经纪协理之房地产经纪操作实务押题练习试题B卷含答案
- 护理事业十五五发展规划(2026-2030)
- 2025循环流化床锅炉水冷壁防磨格栅安装及检验规程
- 自来水安装施工合同4篇
- 海龟汤题目和答案(100题)
- 输血常识试题及答案
- 2025焊工安全考试题库及答案书
- 省级职业技能大赛2024(高职组)口腔修复工艺赛项规程
- 《系统性红斑狼疮肾炎》课件
评论
0/150
提交评论