2024年人工智能在选股与ETF轮动上应用_第1页
2024年人工智能在选股与ETF轮动上应用_第2页
2024年人工智能在选股与ETF轮动上应用_第3页
2024年人工智能在选股与ETF轮动上应用_第4页
2024年人工智能在选股与ETF轮动上应用_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年人工智能在选股与ETF轮动上应用

一、策略回顾及时序网络概述

(一)选股策略表现回顾

在先前的研究报告《AI+HI系列:GRU网络在风格自适

应中的创新与应用》中,我们对A股市场过去六年的风格变

化进行了细致的分析。在该报告中,我们提出了一项创新性

的方法,即采用GRU网络构建选股组合,以适应市场风格的

快速转变。

1、GRU选股策略历史回顾

我们对该策略最近的表现进行简单的回顾:

策略自2023年12月1日开始样本外跟踪,截至2024年

2月29日,市场经历了大幅震荡,特别是中小盘指数和微盘

股指数的大幅回撤,相比之下,大盘股指数表现相对稳定。

具体而言,中证500指数下跌了3.58%,中证1000指数下跌

了12.1%,而上证50指数上涨了1.99%,沪深300指数上涨

了0.57%。针对GUR策略,在样本外的表现显示,自2023

年12月份以来,策略实现了2.33%的绝对收益,而基准中证

1000指数下跌了12.1%o因此,策略在这一时期的超额收益

达到了14.43%o此外,2024年至今(2024.2.29),策略实现

了3.48%的绝对收益,超额收益为12.18%。市场上共有2945

只股票型和偏股混合型基金,该策略排名第249位,即处于

91.5%的分位数,显示了其相对较好的绩效表现。

2、canslim策略历史回顾

截至目前(2024.2.29),该策略的绝对收益率为8.66%,

相对偏股混合基金指数超额收益为15.62%。主要归因于2024

年2月份以来成长因子大幅反弹,canslim策略在2月份上涨

19.71%,相对基准超额8.97%。

3、人气策略历史回顾

截至目前(2024.2.29),该策略的绝对收益率为-5.81%,

相对中证1000指数超额收益为6.29%。人气组合采用同花顺

的人气指标以及基于朝阳永续的分析师研报文本数据构建的

情感因子作为基砧构建的选股组合,组合持仓风格偏小盘股

因此对比基准选择中证1000指数,自23年12月以来组合相

对基准有稳定的超额收益。

(二)行业轮动现象

近年来的市场风格的切换也影响着每个行业的走势变化。

可以看出行业轮动的现象非常明显。可以看出,煤炭、银行、

石油石化及非银金融四个行业是去年下半年至今连续表现较好

的行业,其中煤炭行业是去年下半年和24年至今表现最好的

行业,但在22年下半年和23年上半年煤炭的表现非常一殁。

1、FESC行业轮动策略历史回顾

FESC行业轮动策略2023年12月以来的绩效走势,23年

12月至今(2024229)FESC行业轮动策略绝对收益1%,

相对偏股混合基金指数超额收益5.85%。24年至今

(2024.2.29),行业轮动策略绝对收益0.18%,相对收益

5.01%o

图表8FESC行业轮动策略2023年12月以来走势

二、深度时序因子集成

(一)模型概述

在之前的报告《AI+HI系列:PatchTST.TSMixer.

ModernTCN时序深度网络构建量价因子》中我们介绍了三个

Patch+通道独立的设计时序深度学习模型,它们分别基于自

注意力、MLP、CNN实现时序信息挖掘。我们在先前报告的

测试发现,不同架构深度学习模型均能挖掘出IC较高的量价

因子,但TOP组的多头收益、回撤表现差异较大,合理的骨

干网络设计可能有助于提高多头组性能;架构差异更大的模

型相关性低。

在嵌入步骤首先将多变量序列分为多个单变量序列,对

单变量序列进行Patch操作,用一个长度为P的窗口在时序

上进行滑动截取,滑动步长为S,Patch处理后原始序列长度

从L变为N,最后将每个长度为P的子序列映射至目标嵌入

维度D,数据形状从初始的(M,L)变为(M,D,N);

将嵌入处理后的数据输入骨干网络中,基于自注意力/

MLP/CNN架构的骨干网络学习时序维度、变量维度(通道

维度)、特征维度的信息交互,骨干网络输出数据形状为

(M,D,N),对骨干网络的输出进行展平等处理后接入对应任务

的线性层。

因在本篇报告中我们进一步加入GRU模型,考虑多模型

集成的应用。GRU模型属于通道混合模型,通过门控循环机

制学习输入的时序交互,对一个形状为(M,L)的输入样本,通

常取最后一个时间步的GRU输出作为样本的表征,输出形状

为(M,D),其中D为时点token的嵌入维度。

(二)时序因子相关性分析

首先5个单因子间GRU因子与其他四个因子的相关性

略低,GRU与PatchTST、TSMixer.ModernTCN.

Transformer的相关性分别为:0.65.0.59、0.55、0.64o而其

他四个单因子间的相关性均较高(均大于0.8)。归因于我们

在构建GRU因子过程中采用的双任务的方式,首先以收益率

作为目标进行学习,再使用分类任务作为目标继续训练模型。

(三)时序因子测试

对比各因子的IC统计结果相差不大,从数据上来看

TSMixer的测试结果在几个时序因子中效果最佳。IC的均值

和中位数分别为0.099和0.104,年化IC」R为5.976,三个维

度均为几个时序因子中最大值。GRU因子的IC大于0占比

为81.3%,在几个因子中值最大。

(四)时序因子集成及测试

根据上文的介绍我们发现单纯以目前的输入特征来看

(高、开、低、收、成交量、均价),不同的时序模型虽然

架构会有差异,从最终的合成因子的测试结果来看,各时序因

子的相关性非常高,同时IC的测试结果也比较相近。因此我

们采用中性化的方式进行两阶段合成,首先将ModernTCN.

PatchTST、TransformerTSMixer四个相关性很高的因子进

行合成,然后再将GRU与合成因子进行集成生成

Ensemble_factoro

1、全A测试结果

本部分开始我们对集成因子在不同的股票池上进行测试

来探讨其适用域,我们选择的股票池也都是市场近年来关注

度最热的股票池。

2、宽基成分股测试结果

在本部分我们对比因子在三个宽基指数上的测试结果,

同样从IC和分组的结果来分析,另外鉴于沪深300与中证

500的成分股数量较少我们考虑分10组来对比,而对于中证

1000我们依然采用分20组。

3、风格池测试结果

在之前的报告《AI+HI系列:GRU网络在风格自适应中

的创新与应用》中我们提出使用六种风格指数来对市场状态

进行划分,分别为:大盘成长、大盘质量、大盘价值、小盘成

长、小盘质量、小盘价值,过去六年中的市场风格切换也均为

这六种风格的切换。这些指数均采用痔定的财务指标作为筛

选依据,以月度频率从市场中选取50只符合条件的股票进行

组合。

按照我们划分结果来进行切分,近年来的风格切换发生

在21年初,在21年之前市场偏向于大盘质量与大盘成长风

格,而在21年之后市场则是小盘成长与小盘价值占优,其中

小盘价值的表现更加出色。自23年12月份以来市场的风格再

次发生切换,之前持续走强的小盘成长与小盘价值开始回撤,

大盘价值开始走强。我们之前的GRU选股策略在样本外正因

为重仓了大盘价值股,才有了不错的超额收益。

4、基金重仓股测试结果

对于基金重仓股的定义,我们在报告《CANSLIM2.0投

资法——华创金工大师系列成长型之一》中进行过介绍,这

里不再赘述。

2012年以来,每期重仓股平均1657只个股,最大数量为

2615只,最少为820只。其中1657只个股基本涵盖中证800

及中证1000中大多数个股,同时个股也均为机构的重仓股,

对于机构来说满足“可投资”这一要求。

三、应用

通过上文的分析,我们可以看到集成因子

Ensemble_factor在全A样本和小样本(宽基指数、风格池、

基金重仓股)中的分组效果均表现出色。在本部分,我们将深

入研究GRU网络在选股和ETF轮动上的应用。

(一)风格池内选股组合

1、历史回溯

测试方法介绍我们按照如下方法进行回测:数据:2018

年01月01日至2024年2月29日的风格指数基准池。调仓

频率:周度调仓,调仓日为每周的第一个交易日,考虑停牌、

涨跌停对交易影响。仓位控制:等权调仓,同时个股的最大持

仓比例不超过5%。调仓规则:每期选择因子得分最高的

TOP30个股作为下期调仓名单。策略基准:我们使用了风格

基准池作为比较基准。资金在选出股票上平均分配,交易费

用买卖各收千分之1.5o

测试结果

可以发现策略长期来看稳定跑赢风格基准及沪深300、中

证1000。策略组合2018年来年化收益率12.1%,最大回撤

23.4%,换手率58倍。风格基准组合2018年来年化收益率

3.2%,最大回撤31.8%,策略相对收益8.9%。

策略分析

在持仓行业中,银行、化工、交通运输、公用事业、医

药这五个行业的平均仓位最高,均超过6%。其次,机械设备、

汽车、房地产、非银金融等行业持仓比例也较高,其平均仓

位均超过4%。多元化的投资组合策略有助于分散特定行业或

市场风险,从而提高整体投资组合的稳定性和抗风险能力,

从风格基准池的构成来看,其中有一半的成分为大市值

的股票,因此策略的历史持仓有超过一半的仓位为大市值股

票,历史的市值中位数为495亿。统计结果来看,策略在78%

以上的时间持仓个股的市值中位数均在100亿以上。

2、最新TOP30个股名单

从最新一期的持仓来看,其中大盘股的整体总个数24只,

小盘股个数6只。另外,其中不乏很多耳熟能详的机构重仓

股,如建设银行、中国平安、比亚迪、交通银行等。

(二)基金重仓股内选股组合

1、历史回溯

测试方法介绍

我们按照如下方法进行回测:数据:2018年01月01日

至2024年2月29日的基金重仓股基准池。调仓频率:周度

调仓,调仓日为每周的第一个交易日,考虑停牌、涨跌停对交

易影响。仓位控制:等权调仓,同时个股的最大持仓比例不

超过5%。调仓规则:每期选择因子得分最高的TOP30个股

作为下期调仓名单。策略基准:我们使用了风格基准池作为

比较基准。资金在选出股票上平均分配,交易费用买卖各收

千分之1.5o

策略分析

国表50行业分布

累计持仓行业分布

1000%

800%

600%

400%

200%

I□

n

000%

出用

曜器

州有

$II1II阳IIIIIIIEIH

!超

«彝

SK巴W»

Mlr部sr

诵IL4a

EB4€K叁

VVffK画

08醐

as循

在持仓行业中,医药、公用事业、银行、交通运输、化

工这四个行业的平均仓位最高,均超过6%。其次,机械设备、

电子、房地产行业持仓比例也较高,其平均仓位均超过4%。

从基金重仓股基准池的筛选条件来看,至少有单只基金

重仓个股或者至少有6家机构持仓该个股,因此股票池中拘

个股市值偏中大盘风格,历史的市值中位数为156亿。统计

结果来看,策略在73.5%以上的时间挂仓个股的市值中位数均

在100亿以上。

(三)ETF轮动

在本部分我们尝试将上述集成模型用于构建ETF多头组

合。考虑到各上市ETF的数量和时间跨度都远小于股票数据,

直接将ETF的量价数据用于训练存在样本过少问题,因此我

们采用自下而上的方法,用ETF半年报、年报披露的股票持

仓信息来获得ETF的因子得分。

1、ETF的筛选条件及分布统计

我们首先根据ETF持仓披露信息筛选披露中股票总权重

大于90%的ETFo

2、ETF轮动策略

我们根据ETF因子得分构建周度组合,在周度截面用

DoubleTOPK选出10只ETF(Topi=10,Top2=15)。

2019年01Z01日至2024年2月29日,宽基、风格

ETF轮动策略在此期间年化收益率11.7%,基准(沪深300)

年化收益率3.1%,阿尔法8.5%。策略最大回撤为29%。2019

年至今(2024年2月290)1248个交易日中,获得正收益的

天数为636天,盈利天数占比:50.9%,盈亏比1.08。

我们选取沪深300指数作为对比基准,从分年收益来看,

2019年来策略的表现比较稳健,除2019年以外每年都有5个

点以上的超额收益。策略在23年整体回撤仅-3.6%,大幅小

于主动型基金的收益中位数;组合2024年至今(2月29日)

绝对收益9.2%,相对基准超额收益5.4%,持续跑赢基准。

行业、主题ETF回溯结果

2019年01月01日至2024年2月29日,行业、主题

ETF轮动策略在此期间年化收益率16%,基准(沪深300)年

化收益率3.1%,阿尔法12.8%。策略最大回撤为21.9%。

2019年至今(2024年2月29日)1248个交易日中,获得正

收益的天数为631天,盈利天数占比:50.6%,盈亏比1.16。

我们选取沪深300指数作为对比基准,从分年收益来看,

2020年来策略的表现比较稳健,20年至23年每年都有6个

点以上的超额收益。策略在19年表现较差,归因于19年初

符合条件的ETF数量较少,策略并没有满仓运行。策略在22

年绝对收益为0.5%,超额21.8%,23年绝对收益-5.5%,策略

在23年回撤大幅小于主动型基金的收益中位数;组合2024

年至今(2月29日)绝对收益5.7%,相对基准超额收益

1.9%,持续跑赢基准。

四、总结

A股市场在23年11月份以来经历了大幅的震荡,特别

是中小盘指数和微盘股指数的大幅回撤,相比之下,大盘股

指数表现相对稳定。我们的GRU选股策略在这段时间表现相

对较好,分析其超额的来源主要在于其选股的股票池,我们在

前端做了严格的基本面的筛选,在筛选过后的风格基准池上

我们再利用GRU因子来进行选股。跟踪结果表明这样的方式

依然适用于2024年至今的市场环境。本篇报告我们尝试将5

个时序模型构建的量价因子进行结合,并探讨人工智能在选

股及ETF轮动上的应用。在全A上的测试结果表明,

Ensemble_factor在全A上的IC均值和中位数相比集成前的每

个单因子结果均有提升,IC均值和中位数均大于0.1,另外其

年化IC」R提升到6.37。

在宽基指数上的测试中,长期来看集成因子在每个宽基

上的区分度均非常显著。在中证1000上的IC测试结果最佳,

IC的均值和中位数均接近0.1,大于0占比高达79.4%,组合

每年对比中证1000指数均有显著的超额,24年至今累计越额

收益已达5%。在中证500上的IC测试结果次佳,IC均值和

中位数均大于0.08,IC大于0占比为74.2%。因子在沪深

300股票池中的IC均值和中位数均可达到0.07以上,IC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论