新闻舆情智能分析及其投资应用_第1页
新闻舆情智能分析及其投资应用_第2页
新闻舆情智能分析及其投资应用_第3页
新闻舆情智能分析及其投资应用_第4页
新闻舆情智能分析及其投资应用_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11. 海内外机构广泛关注另类数据投研海外金融机构投入高成本布局另类数据海外对新闻数据投资价值的探索和国内机构布局21.1海外金融机构投入高成本布局另类数据2018年投资机构在另类数据上预算的分布2018年不同管理规模的投资机构在另类数据上的平均预算37%41%15%7%$5百万$357,143$607,143$1,056,250$1,472,222$1,600,000$1,400,000$1,200,000$1,000,000$800,000$600,000$400,000$200,000$0资料来源:,中信证券研究部资料来源:,中信证券研究部资料来源:,中信证券研究部2018年投资机构对各

2、类投资研究方式未来变化的预期57%29%7%43%39%Investment newslettersIndependent research providers减少Investment bank research50%32%7%11%29%18%Financial information systems (e.g., Thomson Reuters)7%61%7%7%36%7%Conferences4%68%7%4%61%7%Financial publications (e.g., Barrons)4%4%62%57%4%7%保持4%46%4%4%43%11%Alternative data

3、 sources4%21%50%增加1.2 海外对新闻数据投资价值的探索和国内机构布局海外研究与案例2010年,Bollen等人利用推特构建出的冷静情绪下的指标能够有效预测下一日的涨跌, 正确率达到86.7%。该研究成果已经应用到一家英国的对冲基金Derwent Capital Markets中。2015年,欧洲央行的研究报告“Quantifying the Effects of Online Bullishness on International Financial Markets”检索 Twitter 和 Google 中“牛市”和“熊市”两个 词出现的频数作为投资者的情绪指标,其与标普

4、500指数下期收益率的回归系数为 10.98,且具有显著性。2018年9月,知名的对冲基金Two Sigma花10万美金在Kaggle平台举办采用新闻预测 股票趋势的竞赛以寻求人工智能解决方案,吸引了全球2900多支队伍参加国内的相关基金产品:以互联网大数据为信息源,以特定信息为主要选股标准的产品资料来源:Wind,中信证券研究部部分国内已发行的大数据基金(亿份)001242.OF博时淘金大数据100A博时基金股票型2015-05-0435.1312001420.OF南方大数据300A南方基金股票型2015-06-2418.7444001637.OF嘉实腾讯自选股大数据嘉实基金股票型2015-

5、12-0712.6257001564.OF东方红京东大数据东证资管混合型2015-07-3112.6071001113.OF南方大数据100A南方基金股票型2015-04-249.9144001734.OF广发百发大数据策略成长A广发基金混合型2015-11-185.50973基金代码基金简称基金公司基金类型成立日期发行份额2. 基于NLP技术的新闻情绪指标构建4BERT模型:深度提取情绪信息BERT模型的基本原理从模型训练到应用指标:六个步骤以市场为指导:借用收益率作为标签情绪指标构建5预训练微调参数2.1 BERT模型:深度提取情绪信息传统的情绪识别模型存在诸多不足依赖于情绪词库的建立,工

6、程量巨大容易断章取义,对诸如“减少亏损”的表达可能完全理解错误。BERT : 2018 年 Google 团 队 在 “ BERT:Pre-trainingofDeepBidirectionalTransformers for Language Understanding”提出的一种新的语言模型能对整句文本进行建模,有效避免传统模型的断章取义的问题通过在大语料比如维基百科上进行预训练,充分学习语言的规律,吸收丰富的知识并 进行迁移,从而降低对目标数据量的要求。资料来源:,.tr,中信证券研究部预训练和参数微调示意图2.2 BERT模型的基本原理预训练:通过预测句子中被掩盖的字符来学习语言的规律

7、参数微调:根据收益率构造新闻的标签,然后进行常规的二分类训练训练完成后,能够对每条新闻输出取值在0,1的情绪分数BERT模型的原理图资料来源:中信证券研究部62.3 从模型训练到应用指标:六个步骤1. 模型预训练:在大数据上进行预训练使模型处于较好的初始化状态2. 采用收益率为新闻打标签:采用股票本身的收益率给新闻赋予标签3. 微调模型参数:采用上一步骤中打好标签的数据进行常规的二分类训练4. 预测新闻情绪:采用上一步骤中训练完成的模型对新的新闻数据执行情绪判断5. 构建情绪指标:所有新闻通过模型得到情绪分数后,按照一定规则构建情绪指标6. 避险/热点发现等任务:对于构建完成的情绪指标,便可用

8、于避险、增强或者热点发 现等任务从模型训练到应用指标的处理流程训练模型模型预训采用收益率微调 练为新闻打标模型参数签使用模型预测 新闻情绪构建指标构建 情绪指标应用指标避险/热点 发现等任 务资料来源:中信证券研究部72.4 以市场为指导:借用收益率作为标签8单条新闻所属日期的归类:我们对新闻时间的划分为每天的15:00,即发布时间在t-1 日15:00以后,t日15:00以前的消息作为t日的消息。标签计算:使用股票本身在t-2日到t+1日收盘价的收益率来打标签。为涨跌幅分别设置10%和-9.09%的阈值,新闻数据的时间范围是2011年5月13日至2020年4月30日,共83万条。其中,201

9、1年1 月1日至2018年12月31日的新闻用来作为训练数据,共计57万条;2019年1月1日至 2020年4月30日的数据作为模型的测试数据以做有效性检测,共计26万条。资料来源:Wind,中信证券研究部。分年度的新闻数目统计(万条)训练完成的模型为每一条新闻的正负面进行评价,输出值为其属于正面消息的概率,取 值范围 0,1 ,对其进行平移处理转换为-1,1。,个股层次:个股新闻情绪=1,=1, 新闻情绪分数t,i,j组合层次:组合新闻情绪 =11 个股新闻情绪,新闻情绪(调整) = 新闻情绪 新闻情绪120日均线新闻情绪变动 = 新闻情绪20日均线(调整) 新闻情绪20日均线(调整)20资

10、料来源:Wind,中信证券研究部新闻情绪指标的20日均线、120日均线和调整后的20日均线2.5 情绪指标构建0.100.00-0.10-0.20-0.30-0.40-0.500.500.400.300-0.102012-012012-032012-052012-062012-082012-102012-122013-022013-042013-062013-082013-092013-112014-012014-032014-052014-072014-092014-112014-122015-022015-042015-062015-082015-102015-122

11、016-012016-032016-052016-072016-092016-112017-012017-032017-052017-062017-082017-102017-122018-022018-042018-062018-072018-092018-112019-012019-032019-052019-072019-082019-102019-122020-022020-042020-06新闻情绪20日均线(调整,右轴)新闻情绪20日均线新闻情绪120日均线93. 中期择时:行情拐点的重要观察信号10结合动量指标,警示牛转熊反其道而行,捕捉超跌反弹新闻情绪vs.交易层面的风险偏好:

12、通常具有较高的一 致性11资料来源:Wind,中信证券研究部3.1 结合动量指标,警示牛转熊参数(-0.03,7%)下的警示信号vs中证全指以近20个交易日上涨超过7%,情绪下降超过-0.03为警示信号,剔除相邻20日以内的重 复信号。在训练集上准确率达到70%(信号次数10),测试集正确率100%(3)。参数(-0.03,7%)下的13次警示信号日期新闻情绪变动未来20日收益率日期新闻情绪变动未来20日收益率2012-05-02-0.06-0.59%2015-06-18-0.04-23.21%2012-12-24-0.038.46%2015-12-25-0.07-21.03%2013-01-

13、28-0.03-1.36%2016-07-11-0.08-0.76%2014-12-18-0.03-2.63%2019-04-24-0.06-11.26%2015-01-08-0.07-0.38%2019-07-05-0.04-4.53%2015-04-16-0.038.48%2020-01-06-0.03-3.13%2015-05-08-0.0827.13%资料来源:Wind,中信证券研究部800070006000500040003000200000.050.00-0.05-0.10-0.15-0.20-0.252012-022012-032012-052012-062

14、012-082012-092012-112013-012013-022013-042013-062013-072013-092013-102013-122014-012014-032014-052014-062014-082014-092014-112014-122015-022015-042015-052015-072015-082015-102015-122016-012016-032016-042016-062016-072016-092016-112016-122017-022017-032017-052017-062017-082017-092017-112018-012018-02

15、2018-042018-052018-072018-082018-102018-122019-012019-032019-052019-062019-082019-092019-112019-122020-022020-042020-052020-07信号新闻情绪变动中证全指(右轴)3.2 反其道而行,捕捉超跌反弹参数(0.03,-5%)下的反弹信号vs中证全指以近20个交易日下跌超过5%,情绪上升超过0.03为反弹信号。在训练集上准确率达到71%(信号次数7),测试集正确率100%(3)。参数(0.03,-5%)下的10次警示信号日期新闻情绪变动未来20日收益率日期新闻情绪变动未来20日收益

16、率2012-06-040.07-2.71%2018-08-060.070.21%2012-11-150.070.06%2018-10-110.042.77%2015-07-270.04-12.61%2019-05-270.032.56%2015-09-220.0412.38%2019-08-060.057.29%2016-02-260.048.47%2020-03-160.051.89%资料来源:Wind,中信证券研究部资料来源:Wind,中信证券研究部9000800070006000500040003000200050.00-0.05-0.10-0.152012-022

17、012-032012-052012-062012-082012-092012-112013-012013-022013-042013-062013-072013-092013-102013-122014-012014-032014-052014-062014-082014-092014-112014-122015-022015-042015-052015-072015-082015-102015-122016-012016-032016-042016-062016-072016-092016-112016-122017-022017-032017-052017-062017-082017-09

18、2017-112018-012018-022018-042018-052018-072018-082018-102018-122019-012019-032019-052019-062019-082019-092019-112019-122020-022020-042020-052020-07信号新闻情绪变动中证全指(右轴)12行情拐点一般伴随着风险偏好的突变, 在市场热情高涨时关注风险偏好的变化 可一定程度上监测到行情的变化交易层面的风险偏好可通过波动率和收 益的相关性来表示。相关性越大,表示 高波动的股票收益更高,即反应投资者 的风险偏好更强。3.3 新闻情绪 vs. 交易层面的风险偏好:

19、通常具有较高的一致性资料来源:Wind,中信证券研究部情绪指标与风险偏好的滚动相关性vs中证全指资料来源:Wind,中信证券研究部情绪指标vs风险偏好0.800.600.400.200.00-0.20-0.40-0.60-0.80-1.00-0.14-0.09-0.040.010.060.112012-012012-022012-042012-052012-072012-082012-102012-122013-012013-032013-052013-062013-082013-092013-112013-122014-022014-042014-052014-072014-082014-1

20、02014-122015-012015-032015-042015-062015-072015-092015-112015-122016-022016-032016-052016-062016-082016-092016-112017-012017-022017-042017-062017-072017-082017-102017-122018-012018-032018-052018-062018-082018-092018-112018-122019-022019-042019-052019-072019-082019-102019-112020-012020-032020-042020-

21、06风险偏好(右轴)情绪指标20日均值-120日均值9,0008,0007,0006,0005,0004,0003,0002,0001.000.800.600.400.200.00-0.20-0.40-0.60-0.80-1.002012-012012-042012-082012-112013-032013-062013-102014-012014-052014-082014-122015-032015-072015-102016-022016-052016-092016-122017-042017-072017-112018-022018-062018-092019-012019-04201

22、9-082019-112020-0360日相关性中证全指(右轴)134. 短期择时:结合波动率,提升择时效果14市场波动率高时情绪指标准确性较高借助波动率优化杠杆增强策略资料来源:Wind,中信证券研究部资料来源:Wind,中信证券研究部不同波动率下的滚动相关性(DIFF5,RET3)波动率分组下的滚动相关性(DIFF5,RET3)4.1 市场波动率高时情绪指标准确性较高按波动率分组来观察波动率对相关性的影响。根据波动率0.1至0.9的分位点将其分为10 组。分别统计每组内相关性的均值和标准差。当波动率处于较高水平时,相关性基本为正,最高一组的均值达到0.34。另外每组的 标准差变化不大,这说

23、明波动率可以比较稳定地确定相关性的范围。y = 0.5176x - 0.01431.00.20.0-0.2-0.4-0.6-0.8-1.00%10%20%30%40%50%60%70%80%0.0-0.1-0.2-0.3158%13%18%23%28%33%38%43%48%根据均值回复性选择在波动率高于均线 时一定程度时暂停使用情绪指标,该阈 值最终根据训练集上的信息率确定为 1.2%。杠杆增强策略的基本逻辑:在情绪指标 相对5日均值变化(DIFF5)高于上阈值 时做多期指,低于下阈值时做空期指。优化后净值波动明显下降,测试集信息 率提升

24、0.26,最大回撤降低8.30%4.2 借助波动率优化杠杆增强策略资料来源:wind,中信证券研究部测试集优化前和优化后相对收益走势资料来源:Wind,中信证券研究部不同20日波动率离差下未来5日波动率的变化30%20%10%0%-10%-20%-30%-40%-50%-10%-5%0%5%10%1.351.3051.101.051.000.950.902019-01-032019-01-212019-02-132019-03-012019-03-192019-04-042019-04-232019-05-142019-05-302019-06-182019-07-042

25、019-07-222019-08-072019-08-232019-09-102019-09-272019-10-222019-11-072019-11-252019-12-112019-12-272020-01-152020-02-102020-02-262020-03-132020-03-312020-04-172020-05-082020-05-262020-06-112020-07-01优化前相对收益优化后相对收益165. 风格配置:显著影响盈利、市值等因子风格收益17情绪指标有效解释风格因子多空收益情绪指标对不同市值股票的作用效果不同风险偏好下盈利因子多空组合收益资料来源:wind,

26、中信证券研究部因子多空收益和情绪指标的回归结果资料来源:Wind,中信证券研究部不同风险偏好下市值因子多空组合收益5.1 情绪指标有效解释风格因子多空收益盈利、市值、流动性和波动率四个因子 的规律均体现了稳定性和显著性。风险偏好上升,有利于低盈利、小市值、 高流动性和高波动的股票;风险偏好下降时,有利于高盈利、大市值、低流动性和低波动的股票。训练集测试集指标p值p值盈利-0.250.00-0.620.00成长0.030.05-0.390.00价值-0.350.000.130.03市值0.300.000.600.00流动性-0.530.00-0.360.00动量-0.220.000.510.00

27、波动率-0.550.00-0.210.06-0.04-0.020.000.020.040.060.08-0.06-0.06-0.04-0.02资料来源:Wind,中信证券研究部0.000.020.040.060.100.080.060.040.020.00-0.02-0.04-0.06-0.08-0.06-0.0418-0.020.000.020.040.06资料来源:Wind,中信证券研究部。G1市值最大训练集上情绪变动与未来收益的关系资料来源:Wind,中信证券研究部,G1市值最大G1和G5的净值比vsG1和G5的新闻情绪20日均线差资料来源:Wind,中信证券研究部。G1市值最大测试集上

28、情绪变动与未来收益的关系5.2 情绪指标对不同市值股票的作用效果在2017年以前,小市值组合明显跑赢大 市值组合,而之后就转为大市值风格。 在风格切换的拐点处,大市值股票的情 绪面相对于小市值股票开始明显提升, 并延续至今。在训练集和测试集上均体现出大市值组 合中相关性为负,而小市值组合中的相 关性为正,表明新闻情绪更加适用于小 市值股票。80.060.040.020.00-0.02-0.04-0.06-0.08G1G2G3G4G5相关性(DIFF5,RET1)相关性(DIFF5,RET3)相关性(DIFF5,RET5)-0.10-0.050.000.050.100.15

29、G1G2G3G4G5相关性(DIFF5,RET1)相关性(DIFF5,RET3)相关性(DIFF5,RET5)0.3050.100.050.00-0.051.21.00.20.02012-01-042012-05-022012-08-162012-12-062013-04-022013-07-262013-11-192014-03-122014-07-012014-10-222015-02-062015-06-022015-09-182016-01-112016-05-042016-08-192016-12-132017-04-072017-07-262

30、017-11-152018-03-082018-06-282018-10-192019-02-122019-06-032019-09-182020-01-092020-05-07净值比(G1/G5)新闻情绪20日均线差(G1-G5,右轴)196. 行业配置:捕捉适用行业的短期超额收益20情绪指标的行业适用性分析基于情绪指标的行业配置策略资料来源:Wind,中信证券研究部2020年以来前5个适用行业的情绪走势资料来源:Wind,中信证券研究部2020年以来前5个适用行业的净值走势6.1 情绪指标的行业适用性分析资料来源:Wind,中信证券研究部各行业情绪变动(DIFF5)和行业指数未来三日收益率

31、(RET3)的相关性00.080.060.040.020.00-0.02-0.04-0.06训练集测试集0.060.040.020.00-0.02-0.04-0.06-0.08-0.10-0.12-0.142019-12-312020-01-072020-01-132020-01-172020-01-232020-02-062020-02-122020-02-182020-02-242020-02-282020-03-052020-03-112020-03-172020-03-232020-03-272020-04-022020-04-092020-04-152020-0

32、4-212020-04-272020-05-062020-05-122020-05-182020-05-222020-05-282020-06-032020-06-09医药基础化工房地产煤炭机械1.3051.101.051.000.950.900.850.802019-12-312020-01-072020-01-132020-01-172020-01-232020-02-062020-02-122020-02-182020-02-242020-02-282020-03-052020-03-112020-03-172020-03-232020-03-272020-04-0

33、22020-04-092020-04-152020-04-212020-04-272020-05-062020-05-122020-05-182020-05-222020-05-282020-06-032020-06-09医药基础化工房地产煤炭机械216.2 基于情绪指标的行业配置策略资料来源:Wind,中信证券研究部基于情绪指标的增强组合与基准组合净值(截至2020年6月9日)选择训练集上相关性在前15的行业进行来进短期的行业配置。每2日调一次仓,在每一个换仓日按照情绪变动(DIFF5)从高到低排序,选择前5个行业构建多头增强组合增强组合的业绩评价(截至2020年6月9日)

34、1.00.82012-012012-022012-042012-062012-072012-092012-102012-122013-012013-032013-052013-062013-082013-092013-112014-012014-022014-042014-052014-072014-082014-102014-122015-012015-032015-042015-062015-072015-092015-112015-122016-022016-032016-052016-072016-082016-102016-112017-012017-032017-042017-062017-072017-092017-102017-122018-012018-032018-052018-062018-082018-092018-112018-122019-022019-042019-052019-072019-082019-102019-1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论