版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题报告-金融基于SVM模型的 2016年5月9 SVM属于监督学习算法,对于求解小样本、非线性、高维度问 策略则属于利用SVM解决二元分类问题。构建SVM模型的过程可以简要概括为寻求SVM在求解非线性问题时使用核函数将数据映射到高 金 SVM择时策略模型对数据进行归一化和降维处理,然后选取粒 价数据和技术指标作为训练集数据源,将SVM模型训练成一个 SVM50%,并且对
从业资格号:F 重要事项 东 所有。未获得东 ,任何人不得 进 的发布 的信息均来源于开资,我公司对些信息的准确和完整性不作何保证,也保证所包含的息和建议不发生任何变更我们已力求报内容的客观公正,但文点结论建议 考,告中信或意并不易建,资据做出任何资策与公司作无关。有关分析师承诺, 最后部分。并请阅读报告最后一页的免责 TOC\o"1-1"\h\z\u1、机器学习简 3、线性分类问 4、非线性分类问 5、特征量筛选方 6、参数寻优过 、特征量选 、SVM择时模型流 、SVM择时策略实证分 、SVM择时策略回测分 8、总 图图表1:机器学习过 图表2:支持向量机二维示 图表3:干扰最优分类超平面的离群 图表4:粒子群优化算法流 图表5:遗传算法流 图表6:数据特征量集合 图表8:择时策略要 图表9:主成分分析降维结 图表10:沪深300股指数据归一 图表11:PSO算法参数适应度曲线(基础价量 图表12:PSO算法参数适应度曲线(技术指标 图表13:GA算法参数适应度曲线(基础价量数据 图表14:GA算法参数适应度曲线(技术指标 图表15:以基础价量为样本的最优滑窗长 图表16:以技术指标为样本的最优滑窗长 图表17:特征量集合A与集合 图表18:沪深300股 主力合约走势与策略累计收益(技术指标 图表19:沪深300股 主力合约走势与策略累计收益(价量数据 1、机器学习简TomMichaelMitcT、执行结果衡量标准P以及应值𝑦⃗,学习机器通过观测训练集((1,1n,n构造相应算法用于预测其他特定数据源x在训练器中的响应y,并以预测结果𝑦⃗̅适当地近响应值为目标。数据源 训练器 训练器响应学习机 预测结 2SVM时策machineSVM择时模型的本质属于分类器,构建的流程包括:1.收集数据,例如基本的历史行进行梳理,删除重复项以降低数据维度;3.训练算法,使用粒子群优化算法(PSO)以及遗传算法(GA)实现参数调优;4.测试算法,在设置止损点位的基础上对择时策略 SVM分类算法与其他参数优化算法相结合,使其通过学习带有涨跌的历史数据,成为预测未来某一时 在编450名球员的比赛场均数据,包括得分(两分球/三分球、助攻、篮板、盖帽以及抢断等特征量,构建SVM模型,其中后场球员 𝑤𝑇𝑥⃗+𝑏= ℎ(𝑥⃗)=𝑔(𝑤𝑇𝑥⃗+𝑏) 𝑦⃗=𝑔(𝑥⃗)∈(−1, 其中𝑥⃗表示二维特征量12),函数(1)用来表示分类超平面,若𝑓(𝑥⃗)<0,则数据=0,则数据点在超平面上,不属于任何一类。函数𝑔(𝑥⃗)类似于Logistics函数,将𝑓(𝑥⃗)的𝛾̂=𝑦⃗(𝑤𝑇𝑥⃗+𝑏)的正负性来验证分类的置信度和准确性,为此我们致力于寻找能图𝛾̂,在这两个支撑超平面上的点称为支持向量,它们满足𝑦⃗(𝑤𝑇𝑥⃗𝑏)=𝛾̂持向量的数据点,则满足𝑦⃗(𝑤𝑇𝑥⃗𝑏);若𝑦⃗(𝑤𝑇𝑥⃗+𝑏)<0,则表示数据点分类错误。4、非线性分类问鉴于SVM模型被运用在解决小样本的非线性分类问题,可以通过核函数和惩罚因 多项式核:k(𝑥⃗,𝑥⃗)=(⟨𝑥⃗,𝑥⃗ 𝑖 𝑖𝑗+径向基核:k(𝑥⃗𝑖𝑥⃗𝑗)=𝑒𝑥⃗𝑝{−𝛾̂|𝑥⃗𝑖−线性核:k(𝑥⃗𝑖𝑥⃗𝑗)=⟨𝑥⃗𝑖Sigmoid核:k(𝑥⃗𝑖𝑥⃗𝑗)=tan𝑎(𝑥⃗𝑖𝑥⃗𝑗)+图表类器的效果产生影响。如图3所示,若不考虑被圈起的数据点则分类超平面与支撑𝑖=1量ξC,使得C∑𝑛𝜉最小,其中ξ表示数据点允许偏离的函数间隔的量,C𝑖=15、特征量筛选方量反映同类特性时对其进行合并。在SVM择时策略模型中我们采用PCA(Principle 等)与合成数据项(MACD、RSI等)中存在相关性的特征进行剔除,6、参数寻优过参数寻优的过程主要针对SVM模型中核函数参数和惩罚因子,我们选择两种方法来对核函数中𝛾̂以及惩罚因子C进行动态寻优,分别是粒子群算法和遗传算法。 1粒子和速度初始 2粒子适应度值计
在可行解空间初始化一群粒子,每个粒子代表极值优化问题的一个潜在最优解,类似于实验。适应度由适应度函数计算得到,其值大小表示粒子的优劣。和群体极值分别代表粒子和种群中所有粒子搜索到的适应度最优位置。粒子每更新一次位置就计算一次适应度值,并且3寻 和群体极 通过比较新粒子适应度值以3寻 和群体极 值的适应度值更新极值和群体极值位置是是 8寻优过程结
2.1.种群初始通过编码将问题可行2.1.种群初始适应度由适应度函数计算得到,用于区分群体中的好坏。3.4.交叉操选择操作从旧群体中以一定概率选择优良组成新的种群,以繁殖得到下一3.4.交叉操否5.变异操交叉操作从种群中随机选择两个,通过交5.变异操是6.变异操作的主要目的是维持种群多样性,从种群中随机选择,并针对其某一特征进行变异以产生更优秀的。是6.7.7.交叉、变异操作逐步迭代以产生新解。同PSO算法,群体中的每个代表一个潜在所以我们通过SVM模型中分别使用两种算法进行参数寻优,最终选择交叉验证结果中7SVM型实、特征量选我们旨在构建一个日度级别的策略,所以选取能够快速反应市场信息的数据作为SVM的测试集。选择的样本属性集合分为两类,特征量集合A包括基本数据,特征量集合B包括技术指标,在后续模型构建中将对这两类集合进行对比。图表6:数据特征量集合A收盘最高昨额520当日涨跌520当额520昨日涨跌B指数平滑异同平动力指标,反映价格变动的能量和速价格震荡指标,反映收盘价的周期变趋向量比率,通 量比值反映市 情相对强弱指标,反映市 强度变随机指标,通过最高价 以及收盘价反映价格趋势的强威廉量震荡指标,反 量长短期运动趋威廉佳庆、SVM择时模型流程选取过去n天的训练集数据,将其进行归一化,并使用PCA进行降维处理,得到将得到的最优参数代入SVM模型,选择出构建模型的最佳时间窗口长度,判断的将滑动窗口以及最优参数代入SVM模型,使用当日的训练数据进行分类,预测明、SVM择时策略实证分析首先针对SVM择时策略回测,数据源、参数以及模型参数设定如下8沪深300股指当月合201114日至2016429 策130个最大迭代次数200,种群规模20,交叉验证折数5,惩罚系数取值范围0-100,核函数𝛾̂的取值范围0-1000粒子群优化算最大迭代次数200,种群规模20,交叉验证折数3范围0-100,核函数𝛾̂的取值范围0-通过对数据归一化处理,原本规模或者单位不同的特征量数据统一转换至0到1量的维数降低,但保留的维数已经能够覆盖原始数据90%的方差特征。AB的测试中,交叉验证的准确率相对较高,于是我们选择由遗传算法优化得到的参数。使用遗传算法和技术指标数据源可以达到接近65%的交叉验证准确率。
在得到的最佳窗口长度基础上,我们可以使用得到的SVM模型预测 、SVM择时策略回测分析17A指预测最大上涨下跌累计收益最大9最大7年化信息最佳18300AB50%。结合最大回撤、累计收益AB8 策略,包括开发更灵活、指令清晰的择时模型,以及将SVM分类回归功走长期(6-12个月强烈看看5-5-5-震振幅-5振幅-5%振幅-5%看5-5-5-强烈看东证(简称东证)是东方 全资子公司,资本达5亿元,系国内四家 所的结算会员。东证专注于金融和商品的研究与服务,提供、及时的研发产品服务和投资策略;专注于的创新,创建安全、快捷的通道,开发多样化、个性化的系统;专注于构筑全面的风险管理和客户。东证管理团队管理经验丰富,业绩出众,在业内享有盛誉。人才管理及激励机制完善,公司拥有学历以上人员占比30%,具有海外和经历的高端人才占比10%。 所年度会员金奖,同时获投资者教育奖、客户管理奖、技术管理奖和功能发挥奖等四项单项大奖;荣获 所优胜会员第七名,铜、橡胶和 油三项企业服务奖;荣获大连商品 所优秀会员第九名;东证 荣获大连商品 所、和讯网第二届 “十大 研发团队”农产品团队 第二名、化工团 第五名;荣获郑州商品 所行业进步奖等。东 全年无风险事故,充分体现了公司稳健经营,稳步发展的经
金 -专题报告2016-05-刘本人具有中国业授予的执业资格或相当的专业胜任能力,以勤勉的职业态度,独立、客观地出具。清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因中的具体推荐意见或观点而直接或间接接收到的。 任何变更,在不同时期,本公司可发出与所载资料、意见及推测不一致的报告。本公司会适时更新我们的研究,但可能会因某些规定而无法做到。除了一些定期的报告之外,绝大多数研究报在任何情况下,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年伊春市农村信用社联合社秋季校园招聘笔试备考题库(浓缩500题)含答案详解(a卷)
- 2026秋季国家管网集团华南公司(广东省管网公司)高校毕业生招聘考试参考题库(浓缩500题)及答案详解【易错题】
- 2026国家管网集团北方管道公司秋季高校毕业生招聘考试备考试题(浓缩500题)附答案详解(夺分金卷)
- 2026届国家管网集团高校毕业生招聘笔试备考试题(浓缩500题)含答案详解(a卷)
- 2026秋季国家管网集团浙江省天然气管网有限公司高校毕业生招聘笔试模拟试题(浓缩500题)有答案详解
- 2026国网湖北省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题及一套参考答案详解
- 2025国网云南省高校毕业生提前批招聘(约450人)笔试模拟试题浓缩500题完整答案详解
- 2026秋季国家管网集团西北公司高校毕业生招聘考试备考题库(浓缩500题)附答案详解【完整版】
- 2026国网甘肃省电力校园招聘(提前批)笔试模拟试题浓缩500题参考答案详解
- 2026国网陕西省电力校园招聘(提前批)笔试模拟试题浓缩500题(含答案详解)
- 通信机房施工安全操作规程
- 《机械基础(第七版)》期末考试复习题库(含答案)
- 华为企业大学培训体系建设
- 高标准农田监理大纲(技术标)
- 肝脾破裂抢救预案及流程
- 2023-2024学年唐山市路南区数学六上期末含答案
- 文具店创业计划书模板
- 中国胸痛中心认证标准(第六版)
- 中国资产证券化案例
- GB/T 41957-2022炭黑原料油石油炼制催化油浆
- 十万个为什么速查速用大全集
评论
0/150
提交评论