



全文预览已结束
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2 0 1 1 年 第 6 期 S c i e n c e d T m t R h 文章编号 1 0 0 0 7 6 9 5 2 0 1 1 0 6 0 0 1 5 0 4 企业 自主创新项 目风险评价模型与实证研究 王平 朱帮助 五 邑大学经济管理学院 广东江门 5 2 9 0 2 0 摘要 针对企业 自主创新项 目风 险评价 中的高维 非线性 问题 提 出 了一种基 于主成 分分析 和遗 传神 经网络 的企 业 自主创新项 目风险评价方法 该方法利用主成分分析对企业 自主创新项目风险评价体系进行特征提取 利用遗 传算 法直接训练神经 网络 的权重形成遗传神 经网络 特征提取后的综合主成分指标进 入遗传神 经 网络 的智能评价 系统 实证结果表明 该方法具有较好 的泛化能力 与标准 B P神经 网络方 法相 比 该方法具有 明显 的优 势 关键词 企业 自主创新项 目风险 评价方法 主成分分析 遗传算法 人工神经网络 中图分类号 F 2 7 2 5 文献标 识码 A O n E v a lu a t i o n Mo d e l a n d I t s A p p lic a t io n o f E n t e r p r is e I n d e p e n d e n t I n n o v a t io n P r o j e c t R is k W ANG Pin g ZHU Ba ng z hu S c h o o l o f E c o n o m ic s a n d Ma n a g e m e n t Wu y i U n iv e r s i t y J i a n g me n 5 2 9 0 2 0 C h i n a Ab s t r a c t F o r s o l v i n g t h e h ig h d i me n s io n a l a n d n o n li n e a r p r o b le m s o f e n t e r p ri s e i n d e p e n d e n t in n o v a t i o n p r o j e c t r is k e v a l u a t i o n a n in t e ll ig e n t m o d e l b a s e d o n p r i n c i p al c o mp o n e n t a n a ly s is P C A g e n e t i c a l g o rit h m G A a n d a r t i fic i al n e u r a l n e t w o r k A N N i e P C A G A A N N is p r o p o s e d in t h is p a p e r I n t h i s h y b rid a p p r o a c h P C A is u s e d f o r f e a t u r e e x t r a c t io n in o r d e r t o r e d u c e t h e mo d e l c o mp le x it y o f AN N a n d imp r o v e t h e s p e e d o f ANN G A is u s e d t o t r a in t h e w e ig h t s o f ANN t o c o ns t it ut e a GAANN mo d e l a n d t h e n t h e e x t r a c t e d p ri n c ipa l c o mpo ne n t s a r e in t r o d u c e d in t o GAANN t o o b t a in t h e e v a lua t io n r e s u lt s Th e e mpiri c a l r e s u lt s r e v e a l t h a t PCA GA ANN mo d e l ha s un de r s t a n ding f o r e c a s t ing a bilit y Co m p a r e d w i t h t h e s t a n d a r d b a c k p r o p a g a t i o n a r t ific ia l n e u r al n e t w o r k B P A N N P C A G A A N N h a s s o me s u p e rio rit y in p r e dic t in g a c c u r a c y Ke y w o r d s e n t e r p r i s e i n d e p e n d e n t in n o v a t i o n p r o j e c t r i s k e v a l u a t i o n m e t h o d p ri n c i p a l c o m p o n e n t a n a l y s i s g e n e t ic a l g o r i t h m a rti fi c i a l n e u r a l n e t w o r k 1 引言 2 0世纪 9 0年代初 伴随着以信息技术为核心的 新技术革命 的发展以及全球性竞争 的 日益激烈 适 应新的技术和市场发展需要的技术创新成 为理论界 与企业界关注的焦点 而 自主创新研究也逐渐成为 技术创新理论研究 中的热 门课题 国内外 的相关研 究均表 明 自主创 新是 企业 核心 竞争 力 的重要 源 泉 谁拥有强大 的 自主创新能力 谁就能在市场 竞争中占据主动和竞争优势 近年来 随着经济全 球化的不断深入 我 国企业所受到 的竞争压力不断 增强 任何企业要想在竞争 中获得优 势 就需要积 极主动地开展 自主创新 活动 以增强 自身 的 自主创 新 能力 但是 由于自主创新本身所固有的高风险性 使得其立项 和决策成为企业一 项十分 困难 的工作 特别是当企业有多个 可供选择 的项 目 而其所拥有 的资源又不允许这些项 目同时实施时 决策者 常常 会陷入难 以取舍的困境 鉴于此 如何对企业 自 主创新项 目风 险进行评价 并据此为其立项决策提 供支持 从而 降低企业 自主创新 的风险 提高企业 自主创新能力便成为当前一个具有重要现实意义的 研究课题 J 因此 非常有必要开展企业 自主创新 项 目风险评价研究 近年来 针对企业 自主创新风险评价的研究 开 始受到学者们 的高度重视 然而 由于企业 自主创 新风险来源 的多样性 影响因素的复杂性 国内外 对企业 自主创新风 险的研究主要从 企业层面开展研 究 如岳彩轩 王维等 牟小俐 宋哲 从 企业层面分别建立 了由 3 1个 1 6个 2 7个和 1 3个 指标组成 的企业 自主创新风 险评价指标体系 然而 从项 目层 面进行 研究 比较 罕见 目前 仅 发现 陈建 新 包国宪 从项 目层 面分 别建立 了由 3 6个和 收稿 日期 2 0 1 0 0 9 1 9 修 回日期 2 0 1 0 1 1 0 l 基金项目 广东省自然科学基金项 目 面向电子商务客户行为预测的综合集成方法研究 9 4 5 2 9 0 2 0 0 1 0 0 4 0 6 0 基于实物期权理论的企 业信用风险评价方 法研究 8 1 5 2 9 0 2 o 0 lo o o o 1 0 项 目来源 江门市科 技计划项 目 企业 自主创新项 目评 价与投 资决策方 法研究 江财工 2 0 0 8 1 0 3号 l6 王平等 企业 自主创新项 目风险评价模型与实证研究 1 5个指标组成的企业 自主创新项 目风险评价指标体 系 且采用层次分析法 模糊综合评判等方法对企 业 自主创新项 目风险进行评价 这些方法的缺点是 评价中的随机因素影 响较多 评价结果易受评估人 员主观意识 经验和知识局限性的影响 很 难为决 策者进行立项决策提供有效支持 最近 一 些研究 开始尝试采用人工神经网络开展企业 自主创新风 险 评价研究 利用人工 神经 网络特有 的优点 自学 习 自适应 能力 克服 了主观 因素的 问题 然而 人工神经网络本身所具有的不确定性影响了评价结 果的稳定性 和准确性 鉴于文献 7 的评价指标 体系较全面 本文采用该评价指标体 系 将 主成分 分析 P C A 遗传算法和人工神经网络结合起来对 企业 自主创新项 目风险进行综合评价 旨在解决传 统人工神经网络 的某些不足 有望提高评价结果 的 稳定性和准确性 2 主成分分析和遗传神经网络的基本原理 2 1 主成分分析 P C A 针对企业 自主创新项 目风险评价指标体系 由 于所选取的评价指标较多 3 6个 直接利用人工 神经网络模型进行综合评价 比较 复杂 甚至会产生 维数灾难 等 问题 因此 首先进行信 息提取是很 有必要的 主成分分析法利用降维的思想 把原来 较多的评价指标用较少 的综合主成分指标来 代替 综合指标保 留了原始变量的绝大部分信息 且彼此 互不相关 能够使 复杂问题简单 化 J 因此 采用 主成分分析法对企业 自主创新项 目风险评价进行信 息提取是合适 的 设 几个 自主创新项 目 P个评价指标 这里 P 3 6 构建 出企业 自主创新项 目风险评价的原始数据 矩阵 X l 2 i 1 2 7 1 2 P 1 将原始数据进行标准化处理 一 二 兰 一 其中 fi v a r n 1 砉 一 2 计算相关矩阵 R p p 焘 上l b 1 一 k lZ k i n z k i n 3 令 I R A I 0 求解相关矩阵 R的特征根 A 且使得 A A A 其对应的特征向量为 u 1 2 p 得到主成分 互 4 计算各主成分方差贡献率 e j A 艺A 和累 J m 计方差贡献率 E 当 通常为 8 5 时 m的最小整数作为 m 的值 即主成分的个数为 m 2 2 遗传神经网络 G A A N N 遗传算法 G A 是一种基于 自然选择和基因遗 传学原理的随机搜索优化方法 具有很强 的全局优 化能力 由于基于梯度下降的 A N N学习算法具有较 高的精确性 但存在容易陷入 局部极小 的缺点 而 G A具有很强的全局搜索能力 可以避免局部极小 因此 在一定程度上 G A和 A N N是互补的 将两者 结合起来可能会发挥各 自的优势并产生一个更加鲁 棒的方法 目前 G A与 A N N结合方式主要有三种 一 是直接用 G A来训练 A N N的权重 二是用 G A来 优化 A N N的初始权值 三是用 G A来优化A N N的结 构 本文采 用 第一 种 方法 即利用 G A直 接训 练 A N N的权重 设三层 A N N模型 为输入层 中第 个结点的 输 出 H 为隐含层 中第 i个结点 的输出 0 为输出 层 中第 个结点的输出 聊 为输入层中第 个结点 与隐含层第J 个结点 的连接权值 W H O j i为隐含层中 第 个结点与输出层第 i个结点的连接权值 G A A N N算法的具体步骤 1 初始化种群 P 包括交叉规模 交叉概率 P 突变概率 P 以及对任一 W I H j 和 w M o 初始化 并采用实数进行遗传编码 2 计算每一个个体评价 函数 将其排序 并 n 依据概率值选择进入下一代的个体 P f 其中 n为染色体数 为个体 i 的适应度值 可用误差平方和 E来衡量 即 1 E i 二l y d 一 y 其中 P为训练集的样本数 c 为网络输 出层节 点的个数 y 为第 k个样本第 个 网络输 出节点 的 理想输出值 y m为第 k 个样本第 个网络输出节点 的实际输出值 3 以概率 P 对个体 G 和 G 交叉操作产生 新个体 G 和 G 没有进行交叉操作的个体进行 直接复制 4 利用概率P 突变产生 G 的新个体 G 5 将新个体加入到种群 P中 并计算新个体 的评价函数 6 若找到了满意的个体 则结束 否则转 3 7 达到所要求的性能指标后 将最 终群体 中 的最优个体解码即可得到优化后的网络连接权值 王平等 企业自主创新项 目风险评价模型与实证研究 l7 3 基于 P C A G A A N N的 自主创新项 目风险评价 3 1 基 本 思路 基于 P C A G A A N N的企业 自主创新项 目风险 评价模 型构建 的基本思路是 首先利用 P C A降维方 法对 G A A N N系统输入数量较多 的评价 指标数据进 行特征提取 提取 出数量较 少 的综合 主成分 指标 这些综合指标保留了原始变量 的绝大部分信息 然 后用这些综合主成分指标来进行 G A A N N学习与预 测 最终获得评价结果 3 2评 价原 理 P C A的优势在于其能够有效地实现数据 降维和 特征提取 运用 P C A对 G A A N N的输人数据进行 预处理 简化 G A A N N的数据输入 从而减少 G A A N N的学 习任 务 加 速 G A A N N的学 习过 程 当然 P C A的缺点在于它本质上是一种线性特征提 取技术 因而无法捕捉评价指标 间的非线性映射关 系 也就不能直接用来进 行企业 自主创新项 目风险 评价 恰好 G A A N N的主要优势在于它灵活的非 线性建模能力 能够较好 地捕捉到数据 中的非线性 特征 因此 P C A和 G A A N N之间存在着互 补关 系 为了充分发挥两种方法各 自的优势 将它们两 者集成是有意义的 P C A C A A N N系统 主要用来对企业 自主创新 项 目风险进行评价 由于 G A A N N在处 理信 息时 一 般不能将输入 向量空间维数简化 所 以当输入信 息空间维数较大时 可能会导致 A N N训练质量降 低 正因为如此 本文采用 P C A来进行输入 向量提 取 然后将 提取 出来 的综合 主成分指标 交 由 G A A N N学习与预测 即利用 P C A先对指标数据进行预 处理 再根据预处理后的信息结构来构成 G A A N N 的信息预测系统 如图 1所示 是 H H 毫 H H 图 1 基于 P C A G A A N N的 自主创新项 目风险评价过程 从图 1可知 基于 P C A G A A N N的企业 自 主创新项 目风险评价过程包括三个主要 阶段 数据 准备 输入指标 P C A特征提取 和 G A A N N学 习与 预测 通常 应首先针对具体 的研究对象分析和研 究对象的相关 因素 收集各种来源的数据 然后在 收集到的评价指标数据中 利用 P C A进行评价指标 数据的特征提取 这个 阶段获得 的样本集除去 了所 有不必要的冗余信息 仅保 留了影响评价准确度的 综合主成分指标 随后 这些提取 出来 的综合主成 分指标被送人 G A A N N预测系统 通过 G A A N N 学习与预测 输出评价结果 3 3 算 法 实现 根据上述 P C A G A A N N的学习算法 和基 于 P C A G A A N N的评价原理 给出企业 自主创新项 目风险评价的 P C A G A A N N实现算法 1 输入企业 自主创新项 目风 险评价的指标数 据矩阵 2 利用 P C A对评价指标矩 阵进行特征提取 3 由特征提取的综合主成分指标构成学 习样 本集 并分割为供 G A N N学 习和评价的训练集 和 测试集 4 确定合适 的参数 G A A N N模型参数 利用训练集对 G A A N N进行学习与训练 5 获得 理想 参数 后 G A A N N 的学 习过程 结束 6 输入测试集 利用训 练好 的 G A A N N进 行评价 评价时 只要输入待评价项 目的综合主成 分向量 便可立即得到相应项 目的风险值 4实证分 析 以文献 7 中深圳市某大型 台资企业 1 2组 自 主创新项 目风险评 价实际数据为例来说 明上述方法 的应用并验证该方法 的可行 本文采用 S P S S 1 7 0统计软件辅助实现 P C A特 征提取 计算得相关矩阵 R的特征值 贡献率和累 积贡献率见表 1所示 由于前 1 0个成分 的特征值大 于 1 且累积贡献率达到 9 7 3 7 6 其余 2 6个成分 对方差影响极小 因此可以提取前 1 0个成分作为主 成分 1 0个主成分 F i 一1 2 1 0 0 1 化结果见表 2所示 表 1 R的特征值 贡献率和 累积 贡献 率 主成分 特征值 贡献率 累积贡献率 l 5 5 0 4 l5 2 8 8 I 5 2 8 8 2 5 2 6 1 1 4 6 1 4 2 9 9 0 3 3 4 I 1 2 l 1 4 2 2 41 3 2 5 4 4 038 l 1 2l6 52 541 5 3 5 8 1 9 9 4 6 6 2 4 8 7 6 3 29 6 9 1 56 71 64 3 7 2 90 4 8 O 66 7 9 71 O 8 2 48 6 6 9 05 86 61 5 9 2 1 7 9 6 0 52 9 2 6 67 1 O 1 69 5 4 7 09 9 7 3 76 表 2 0 1 化 的主成分 成分 项 1 2 3 4 5 6 7 8 9 1 O 1 O 1 O 0 2 6 O 6 o 0 2 9 0 5 4 0 7 2 0 6 9 0 4 2 0 6 9 O 9 8 2 0 48 0 5 7 O 8 9 O o 9 O 5 8 O 8 9 O 37 0 3 9 0 1 O 2 8 3 0 4 8 0 6 9 0 7 4 0 2 8 0 3 6 0 8 6 0 6 4 0 9 0 0 9 5 0 O 9 4 0 38 0 51 0 0 7 O 6 7 0 75 0 59 0 45 0 3 4 0 7 9 0 o9 5 0 9 4 0 4 O 5 8 O 5 0 0 O8 0 71 0 85 0 3 7 0 7 6 0 5 7 6 0 9 4 O 4 4 O 5 1 0 2 3 0 9 4 0 5 2 0 4 7 0 9 2 O 6 8 0 7 5 7 0 7 4 O 2 3 O 3 8 0 O 8 0 6 l 0 4 6 O 9 3 0 4 0 0 3 O O O 9 8 O 65 0 4 7 0 0 7 O 1 2 O O9 0 59 O 1 0 O 5 9 0 4 5 0 56 9 O 8 5 0 o 8 O 8 l O 3 9 0 6 o O 8 7 O 1 5 O 2 6 O 8 8 0 3 0 1 O 0 4 7 0 3 3 0 9 6 O 5l 0 3 4 0 O1 O 3 6 O 6l 0 5 7 0 3O 1 1 0 78 0 9 3 0 6 9 O 41 O 6l 0 46 0 4 9 O l1 0 6 0 0 64 1 2 O 6 9 0 4 0 0 5 7 O 92 0 4 9 O 83 0 5l O 7l 0 0 7 O 5O 1 8 王平等 企业 自主创新项目风险评价模型与实证研究 本文采用 MA T L A B 7 0 1 软件和 G A工具箱编程实 现 P C A G A A N N系统 A N N为 3层误差反 向传 播前 向 B a c k P r o p a g a t io n B P 神经网络 结构为 1 0 6 1 用表 2中前 l0组数据作为训练集 后 2 组数据作 为测试集 模 拟待评 价的 自主创新项 目 以考查 P C A G A A N N预测 系统 的泛化能力 G A 参数设置为 初始种群大小为 6 0 遗传代数为 7 0 0 学习精度为 1 0 一 其他参数均为默认值 由于训练样 本较少 最终 确定 的 G A A N N系 统不十分稳定 每次的训 练结果会有不 同幅度的变 化 为此 本文利用训练集和测试集分别进行 了 5 0 次学习与测试 计算得到平均 学习结果和平均测试 结果见表 3所示 可以发现 平均学 习结果与实际 风险评 价结果十分接近 相对误 差最大为 4 9 4 最小为 一 0 7 4 平均测试结果也与实际风险评 价 结果比较 接 近 相 对误 差最 大 为 5 7 8 最 小 为 3 4 1 为比较 P C A G A A N N和单纯 A N N的有 效性 本文直接利用原始指标数据进行 5 O次学习与 测试 计算得到平均学习结果 和平均测试 结果的最 大相对误差分别为 7 8 7 9 1 8 最小 相对误差 分别为 一1 1 6 一6 1 6 显然 整体上 P C A G A A N N 比单纯 A N N的稳定性 准确性 更高 由此可见 应用 P C A G A A N N方法进行企业 自主 创新项 目风险评价是可行 的 表 3 训练结果 与测试结 果 企业 1 2 3 4 5 6 7 8 9 1 0 l1 1 2 代号 实际 0 42 5 0 5 3 6 0 41 4 0 2 7 1 0 6 5 3 0 2 91 0 5 2 3 0 61 4 0 7 0 2 0 3l5 0 5 8 6 0 2 2 5 风险 评价 0 4 0 4 0 5 4 8 n 蚰 5 O 2 7 3 O 6 7 6 0 3 01 0 5l1 0 5 9 4 0 6 8l O 31 8 0 5 6 6 O 2l2 风险 绝对 0 O2 1 0 0 1 0 O O 9 0 0 o 2 一O O 2 一O Ol 0 01 2 0 0 2 O 0 2l 一0 0 0 1 0 0 2 0 01 3 误差 相对 4 9 4 2 2 4 2 I 7 0 7 4 3 5 2 3 4 4 2 2 9 3 2 6 2 9 9 0 9 5 3 41 5 7 8 误差 5 结论 本文提出了一种基于 P C A G A A N N的企业 自 主创新项 目风险评价方法 实证结果验证 了该方法 的可行性 与已有的企业 自主创新项 目风险评价方 法相比 基于 P C A G A A N N的企业 自主创新项 目 风险评价方法具有如下几点优势 1 采用主成分 分析作数据预处理 提取主成分特征指标作为 G A A N N预测系统的输人 大大降低 了数据维度 有效 提高了 AN N的训 练质量 2 利用 G A直接训练 A N N权重 克服 了传统 A N N学习算法在处理高维 小样本数据 时易出现 过学习 收敛速度慢 陷 入局部极小等缺点 提高 了模型的泛化能力 3 把 A N N作为后
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论