版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要本文通过构建反映创新发展和经济结构的指标体系,通过熵值法构造加权矩阵,采用TOPSIS综合评价模型对各个省份的创新发展进行评价,并借用R软件对各个省份的高质量发展综合得分进行地图可视化映射展示。发现在空间上,创新水平的高低与地域有关,东南沿海省份及北京上海创新水平较高,中部地区创新水平一般,西部地区较差。依据综合评价的结果对于反映创新水平的二级指标进行岭回归和LASSO回归,挑选出对于创新发展水平影响较大的指标。接着针对经济结构的5个指标进行回归分析,第三产业协调和全社会固定资产投资对于创新的影响较大。并依据与本文构建的指标体系以及数据分析,针对创新方面给予总结及建议,并认为应从创新的环境及人才等方面给予重视。关键字:创新发展、topsis综合评价、岭回归、lasso回归[7]。(10)(11)其中,t代表惩罚的力度,t越大,对系数的大小惩罚越重,约束越紧。取系数的平方和形式可以避免正负系数相抵消的情况。在矩阵形式中,Z按照传统是标准化之后的(均值为0,方差为1),y也需要中心化。由公式可知最优解为(12)λ是这个模型的调整参数,当λ趋于0的时候,就退化为最小二乘估计法。当λ趋于正无穷的时候,则是纯截距回归。Lasso回归原理介绍lasso回归是和岭回归类似,也是构建一个惩罚函数来压缩一些变量从而得到一个简洁的模型,lasso的复杂程度由λ来控制,λ越大对变量较多的线性模型的惩罚力度就越大,最终获得一个变量较少的模型。它保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。它的原理可类似于“马太效应”,因为是有偏的,模型相当于牺牲偏差来寻求方差,以达到尽可能的贴合实际,这就导致对模型贡献大的变量的系数相对会变大,而对模型贡献小的变量系数会被压缩到0,λ值越大,变量的数量就越少。除此之外,另一个参数α来控制应对高相关性数据时模型的性状。lasso回归α=1,岭回归α=0,这就对应了惩罚函数的形式和目的。我们可以通过尝试若干次不同值下的λ,来选取最优λ下的参数。(13)(14)其中λ与t是一一对应,为参数调节系数。令当时一部分系数会被压缩至0,而达到压缩变量的目的。两类回归模型理论评价如下图所示,两个图是对应于两种方法的等高线与约束域。椭圆代表的是随着模型随着λ的变化所得到的残差平方和,β为椭圆的中心点,为对应普通线性模型的最小二乘估计。左右两个图的区别在于约束域。等高线和约束域的切点就是目标函数的最优解,岭回归方法对应的约束域是圆,其切点只会存在于圆周上,不会与坐标轴相切,则在任一维度上的取值都不为0;对于Lasso回归方法,其约束域是正方形,会存在与坐标轴的切点,使得部分维度特征权重为0。所以,Lasso回归方法可以达到变量选择的效果,将不显著的变量系数压缩至0,而岭回归方法虽然也对原本的系数进行了一定程度的压缩,但是任一系数都不会压缩至0,最终模型保留了所有的变量。由下图可知岭回归解和lasso回归解与原先的最小二乘解都是有一定距离的。相较于最小二乘和岭回归,lasso回归可以使部分变量的系数压缩到0,使贡献小的变量表现为不显著。模型构建及实证分析数据来源及处理在各类指标中,由于统计口径或是数据提供问题,本文将一些指标进行略微调整。相关数据来源,其中,专利发明总数、R&D人员总数、从业人员总数、R&D课题数、高等学校数、R&D经费支出、各地区规上工业企业数量情况、高技术产业投资额、各地区高技术产业专利情况、各地区高技术产品进出口贸易来源于《2018年中国科技统计年鉴》,社会消费品零售总额、各省GDP、第三产业年度增加值、城镇居民人均收入、农村居民人均可支配收入、全社会固定资产投资、全体居民消费水平、来源于《2018年中国统计年鉴》首先检查数据完整性,以及各个省份相同指标数据单位是否一致、统一,接着通过15个小指标计算各个二级指标的值,然后对数据进行归一化处理,消除数据量纲,为后续分析做铺垫。将已经归一化处理的数据导入到python中,按照上文模型理论体系构建顺序进行求解,首先将数据读入python数据框中,形成一个31行9列的一个矩阵。接着通过熵权法对加权矩阵进行求解。表SEQ表\*ARABIC2各变量熵值及权重然后根据指标权重的大小构建加权决策矩阵,计算每个指标的正理想解与负理想解。因为数据为无量纲数据,因此使用通过欧式距离计算各个观测到正理想解与负理想解的距离。模型的贴合度就是观测到负理想解的距离比上到正理想解与负理想解的距离之和。比值越大,说明观测离正理想解的距离越近与负理想解的距离越远,观测的表现就越优,其评分相对较大,就表明创新水平越高。表SEQ表\*ARABIC3各省份创新水平综合评分通过对31个地区创新水平综合评价排序,本文大致将各省市划分为三大类,第一梯队是广东、北京、上海、江苏、浙江等东南沿海省份,这些省份、直辖市的创新水平引领全国,同时汇聚了全国优秀资源创新基点高潜力大;第二梯队就是中东部地区相较于东部省份有些差距,但是发展经济发展也十分迅速,将会带动创新水平的提升;第三梯队就是西部地区,创新水平低下,经济发展较缓慢,在创新方面还需要继续发展。表SEQ表\*ARABIC4各省份创新水平程度划分图3各省创新水平热力图岭回归分析将2017年各个区域创新水平的指标数据读入程序中,然后进行无量纲化处理并拆分数据集为训练集和测试集,用训练集来拟合模型,多次迭代模型以寻求最优的参数值,用测试集来检验模型的预测值和实际值的偏差,偏差小的说明模型拟合的较好。经过模拟得出以下结果。表SEQ表\*ARABIC5岭回归结果Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1Residualstandarderror:0.008208on20degreesoffreedom由上面结果可知在使用岭回归分析影响创新水平的指标时发现科技论文数量、高等学校数是不显著的,高科技产业投资对于创新的影响程度较小,而各地区规上工业企业数量情况、万人发明专利拥有量对于地区创新水平的高低有很大影响。Lasso回归分析应用和岭回归类似方法,将同样的数据进行lasso回归,并得到以下系数表,根据表中内容我们可见高等学校数这个变量已经压缩至0,高技术产业投资额的系数也压缩的很小。可见lasso回归相较于岭回归有压缩变量的作用,lasso回归有着与岭回归不同的原理,它可使变量显著的更加显著,不显著的就被压缩至0,从而达到压缩变量的作用。因为被压缩至0的变量对于方程的贡献极小,所以即使删去相应的变量也不会对方程产生较大的影响,反而变量的个数相较于原来有所减少,方程更简洁计算也相对方便。表SEQ表\*ARABIC6Lasso回归系数表通过对比岭回归和lasso回归的结果发现,lasso回归的R-squared为0.996,岭回归的R-squared为0.9954,两者相差不大,从残差标准误来看,岭回归的残差标准误为0.008208,而lasso回归的残差标准误0.0009722,lasso回归相对于岭回归来说效果要好一些,除此之外lasso回归还将部分不显著的变量压缩至0,提高了样本在维度中的浓度,因此我们可将lasso回归结果作为创新发展水平测度综合评价中显著变量选择的工具。lasso回归结果中的变量系数反应出变量的重要程度,由系数我们可知,在对于创新水平测度的综合评价中万人发明专利拥有量、每万人从业人员中R&D人员数、R&D经费支出占GDP比重、各地区高技术产品进出口贸易、各地区高技术产业专利情况、各地区规上工业企业数量情况的系数较大,表明在影响地区创新水平的众多因素中创新人才、创新资金、创新企业起决定性因素。经济结构变迁表SEQ表\*ARABIC7经济结构变迁回归结果Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1;R-squared:0.6911由回归分析的结果可知模型的AdjustedR-squared为0.6911,即模型能解释69.11%的因变量,而且模型中常数项、第三产业协调和全社会固定资产投资表现的都比较显著,具有统计学意义。由此回归模型结果我们可知,每当第三产业协调指数增加1时,创新水平综合评价的分就会增加0.747,三产业协调和全社会固定资产投资表现与综合评价得分正相关,社会消费品零售总额与创新水平发展综合评价得分负相关。总结及建议本文应用topsis综合评价模型对于反映创新能力水平的9个二级指标进行综合评价,通过岭回归和lasso回归模型对二级指标进行选取。由岭回归和lasso回归分析结果对比可知lasso回归在本次分析处理中表现比岭回归要好,因此本文选择lasso回归的结果作为回归分析的主要方法。在lasso回归中经过次次迭代选择惩罚参数,最终将显著性较差的变量的系数压缩至0,从而达到降维的目的。由结果可知在创新层面上万人发明专利拥有量、每万人从业人员中R&D人员数、R&D经费支出占GDP比重、各地区高技术产品进出口贸易、各地区高技术产业专利情况、各地区规上工业企业数量情况的系数较大,在这些指标背后隐藏的是支撑地区创新的各种因素,如人才、资金、技术储备、工业环境等,因此对于区域创新水平综合评价而言上述五个指标起着重要作用。探究经济结构变迁对于创新能力的影响时发现在影响经济结构变迁的诸多因素中第三产业协调和全社会固定资产投资对于地区创新的影响较大。及服务业越发达,表明经济发展水平越高,资金越充足,对于创新的影响就越大。关注创新的人才创新说到底还是人的创新,首先要有足够的高质量的人才,而人才的培养就关联到教育和资金问题。地方和国家要对教育事业给予最大的支持,要投入足够的资金和良好的环境,确保人才的可持续高质量供应。最近的贸易战也给予我们一些启示,在美国对我国芯片封锁下我们不能进行有效的反击,反映了我国在芯片行业的竞争力不足,也就是创新能力不足,受到了国外技术的限制。在基础研究领域国家和地方也要进行投入,虽然基础研究回利慢,但是这种影响深远,有利于后续创新的发展。关注创新的环境即便是有了高端的人才,也要给予其合适的环境、政策、资金等众多条件。环境对于创新来说也是极其重要的,不仅仅时生活环境,还有政策环境如“大众创新,万众创业”和文化环境如创新创业产业孵化基地这种大环境,人人都怀着一个创新的心,那么我们的创新能力自然而然的就提升了。关注产教结合要发挥高等教育和研究所的优势,不能仅仅搞研究,还要把研究出来的东西进行实践,反过来再次指导研究,这样不仅可以加快研究进程,在一定程度上也可以解决研究经费问题。除此之外,政府也可以适当参与进来,以政策的刺激或者是优惠撮合企业与高等院校、研究所合作,以促进经济结构变迁和改革。关注经济发展资金是创新能力水平提升的动力之一,有了充足的资金就可以搭建必要的创新环境,引进高端人才。政府也应通过减税或者其他激励政策加大对于创新产业的扶持,加大对于高等学校研究所的拨款。创新能力和经济发展是相辅相成的,是是相互影响的,我们必须调节好他们之间的关系。参考文献“十三五”时期科技创新驱动对我国区域发展格局变化的影响与适应[J].经济地理,2016,36(1):1-9.刘伟.科普是技术创新的有力推手[J].科技智囊,2018,No.277(8):70-87.陈虹,宋屹.科技创新:优化经济结构的决定性因素[J].河北企业,2003(7):15-15.杜辉."创新型城市"的内涵与特征[J].大连干部学刊,2006,22(2):10-12.叶琳.福建创新型省份建设进程评价研究[J].发展研究,2011(2):30-33.ChenMH,ChangYC,HungSC.SocialcapitalandcreativityinR&Dprojectteams[J].R&DManagement,2007,38(1):21-34.董力,刘艳玲.岭回归在我国工程保险需求影响因素分析中的应用[J].西安电子科技大学学报:社会科学版,2013(2):34-41.附录表SEQ表\*ARABIC8符号说明致谢我的学年论文是在刘云忠老师的悉心指导
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- “法治护航民营经济”行动方案
- 疼痛治疗总结2026
- 2025松阳县职业中等专业学校工作人员招聘考试试题
- 2025景东彝族自治县职业高级中学工作人员招聘考试试题
- 文化旅游演艺综合体在2025年的技术应用与创新前景分析报告
- 2025年废旧纺织品循环利用行业创新报告
- 哈丽法塔外幕墙单元体专项施工方案
- 幼儿园角色区服装清洗频率与卫生状况-基于2024年后勤清洗记录与抽检
- 初中历史教学中数字故事创作与历史情境再现的教学设计课题报告教学研究课题报告
- 北交所消费服务产业跟踪第六十期:工业金刚石近期价格上涨且散热应用逐步商业化关注北交所相关公司惠丰钻石
- 生物浙江宁波市三锋联盟2025-2026学年度高一年级第二(下)学期期中联考(4.22-4.24)
- 2026福建福州开大学川智慧教育科技有限公司招聘财务主管笔试参考题库及答案解析
- 【答案】《以案说法》(中南财经政法大学)章节作业慕课答案
- 云南省2025年普通高中学业水平合格性考试历史试题
- 《扣件式钢管脚手架安全技术规范》JGJ130-2023
- GB/T 39844-2021可靠性增长统计试验和评估方法
- GB/T 20641-2014低压成套开关设备和控制设备空壳体的一般要求
- GB/T 13454.2-2013塑料粉状三聚氰胺-甲醛模塑料(MF-PMCs)第2部分:试样制备和性能测定
- 计算流体力学CFD课件
- 作文与预测-范文gre讲义
- 昆虫生态及预测预报
评论
0/150
提交评论