




已阅读5页,还剩12页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
0,机器学习在投资中的应用,2016年6月,机器学习的应用场景,01,物理世界传感器3D建模,机器学习,高性能计算,理解,决策,感知,智能硬件机器人自动驾驶,探索发现3D打印,搜索广告证券,互联网索引知识,人人机交互,机器学习的演进过程是问题驱动、循环上升的,01,RandomForest,CNN/RNNDeepLearning,垃圾邮件识别信用卡审批二分/多分问题,推荐系统用户分类医学辅助判断相对复杂的分类问题,语音/人脸/图像识别用户画像/衣食住行高度复杂的决策问题,机器学习在金融领域的应用已覆盖风控、智能理财和投资,01,风险控制:信贷风险、欺诈风险、运营风险数据维度和量级的提升,使得机器学习能更精准的识别风险智能化理财服务:智能投顾、个性化资产配置建议用户行为数据的不断丰富,使更了解客户需求的智能理财服务成为可能量化投资:自动交易策略、新量化因子的挖掘、多因子模型的改进量化投资领域是机器学习技术一个非常天然的应用场景,量化投资是机器学习的天然应用场景,01,存在隐含模式,无法简单表达,有足够数据,存在系统性影响股价走势的关键因素,无法表达或遍历所有的投资模式,有多种时间维度多个市场的历史数据,机器学习的先决条件,证券投资的现实问题,百度互联网证券部应运而生,成为专注于证券业务的科技团队,02,6,百度首个投资类垂直领域专业团队ToC产品:百度股市通机构产品:大数据、策略合作2015年,百度互联网证券事业部成立,专注于证券业务。同时组建金融工程组和数据挖掘组,深挖百度大数据的投资价值,我们从基础数据、投资因子和量化模型三个方面着手研究,02,随着非结构化数据增加及可获取难度的提高,机器处理的优势日渐显现,02,特点:容易获取、分析举例:交易数据、财务数据特点:获取成本高、技术门槛高举例:1.公司公告、调研报告、券商研报:文本挖掘与语义分析技术2.社交、热点、新闻、事件:大数据搜集技术、非结构化数据结构化3.搜索日志、网络舆情:大数据处理技术、舆情分析技术消费数据、供应链交互、物联网数据,结构化数据,非结构化数据,多维数据,8,-,利用机器学习方法,可将数据加工为独特的投资因子,02,基于个股/行业/板块/热点概念搜索量的关注度因子聚类算法:利用股票相近属性进行热点概念聚类基于财经新闻、券商研报语义分析的舆情因子NLP技术:语义分析,关键信息抽取和正负向情感判断基于机器学习技术提炼的经典量化投资因子Boosting技术:聚合高相似度的同类因子,提升因子贡献,百度大数据因子与传统金融因子相关性非常低,02,数据来源:港澳数据,百度大数据2010-2015,实践:与投资相关的机器学习问题之整体脉络,03,机器学习,有监督学习,无监督学习,聚类密度估计,回归问题,分类问题,模型选择Feature选择过拟合,明天指数点位是多少?,明天某支个股是上涨还是下跌?,未来配置哪些股票?,明天是该做多还是做空?,多因子选股,CTA择时,未来个股收益率多少?,实践:CTA策略样例,03,预测模型:随机森林输入特征:基于量价信息初步处理得到的Feature未叠加交易模型、仓位管理、止损等额外条件,数据来源:中金所数据2015-2016,实践:多因子选股策略样例,03,输入特征:百度大数据因子(搜索、舆情、机器提升指标等)组合构建方法:中证800成份股,月度换仓,100支股票,行业中性配置,数据来源:港澳数据、百度大数据2011-2015,机器学习与投资模型的融合是科学,更是艺术,03,面临的问题:现有数据的同质化,有效性下降金融数据的样本数量限制了模型的选择空间模型复杂度与泛化能力的Trade-off解决思路简单为美:如无必要,勿增实体(OccamsRazor)魔鬼在细节:问题定义、FeatureEngineering、SamplingBias、etc.机器学习方法优化已有因子,超越人的认知Data,MoreData!,展望:AlphaGo能否用于投资?,04,围棋是相对封闭的系统博弈时优化的目标单一明确完全公开信息下的博弈,VS,金融市场开放,影响市场变量众多是一种非完全公开信息下的博弈历史数据无法覆盖未来各种的变化,围棋博弈,投资交易,展望:守望更深刻的变革,04,人工智能已在数据与知识层面超越人类,未来将向“分析、推理”的更高阶智能发起挑战,Now感知,Future-理解,决策,快速建立企业全景图实时跟踪上市企业动态深度分析信息传播与变异联合训练大数据因子1分钟阅
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全书完整的课件
- 偶像的力量课件
- 保健品业内知识培训课件
- 伤寒论中药课件
- GB∕T 35770-2022《 合规管理体系 要求及使用指南》之8:“5领导作用-5.1.1治理机构和最高管理者”专业深度解读和应用指导材料(雷泽佳编写2025D0)
- 2025-2026学年云南省屏边县民族中学高三物理第一学期期末学业质量监测模拟试题
- 四川省宜宾市江安县2021-2022学年九上期末数学试卷(解析版)
- 疫情期间用工管理办法
- 潍坊热线管理办法细则
- 社区档案存档管理办法
- 空间中的“爱情买卖二次元手游”玩家的数字身体与爱欲张力研究
- 小提琴培训行业供需趋势及投资风险研究报告
- 人教版九年级英语全册词性转换1-14单元
- 天耀中华合唱简谱大剧院版
- 铭记抗战历史+弘扬民族精神+纪念抗战胜利主题班会
- 深静脉血栓预防及护理课件
- 心律失常临床诊疗指南
- 《现代服务业》课件
- 大学生毕业论文写作教程全套教学课件
- 肝硬化及其并发症
- 腾讯基干领导力素质模型V4.0-最后版本
评论
0/150
提交评论