量化漫谈系列之十九:AI选股模型失效的三种应对方法_第1页
量化漫谈系列之十九:AI选股模型失效的三种应对方法_第2页
量化漫谈系列之十九:AI选股模型失效的三种应对方法_第3页
量化漫谈系列之十九:AI选股模型失效的三种应对方法_第4页
量化漫谈系列之十九:AI选股模型失效的三种应对方法_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录一、场观构与AI略适性机 4格式剧轮与因反效应 4性非性略极端境的效化 5二、策同化局效的层计归因 6型构同发“拥交”系性险 6练本布极行情征错配 8三、外风体:类、周事化开式择框架 9自择框的建逻与级计 9时略实表与AI模风应用 10四、AI心型针性优:LGBM与GRU代升级 12LightGBM模专化:态质样加与HuberLoss鲁性强 12GRU构塑注力池与CVaR风导忆网络 14五、险示 14图表目录图表1:2025风因比传统&AI略额值现1 4图表2:2025风因比传统&AI略额值现2 4图表3:AI传线略VS绩优300指产超额值 5图表4:AI传线略VS绩优500指产超额值 5图表5:AI传线略VS绩优1000增超额值 6图表6:相性算图 6图表7:AI子沪深300增金联时图 7图表8:AI子中证500增金联时图 7图表9:AI子中证1000增金联时图 8图表10:GRU模、LGBM模超回阶(2023.11-2024.04) 8图表11:GRU模、LGBM模超回阶(2024.08-2025.02) 9图表12:GRU模、LGBM模超回阶(2025.06-2025.12) 9图表13:传择策构建程 10图表14:择框优化 10图表15:中证A500择时略值 11图表16:中证A500择时略测现(2020.01-2025.07) 11图表17:中证1000择时略测现(2020.01-2025.07) 11图表18:择策持净值表现 12图表19:择策分度表现 12图表20:择策指表现(2022.01-2025.12) 12图表21:因净对比 13图表22:风暴对比 13图表23:因表分析 14图表24:因净对比 14图表25:因表分析 14一、市场微观结构变迁与AI策略的适应性危机回顾2024年至2025年的A股市场演进,我们观察到市场交易逻辑发生了根本性的迁移。2024年,市场主线完成了从价值/低波向小盘/动量的切换;进入2025年,资金配置进一步向一致预期/成长逻辑集中。特别是到了2025年四季度,受宏观环境不确定性上升的影响,市场风险偏好出现显著收敛,资金从追求高弹性转向配置具备确定性收益的资产。这一变化导致前期表现强势的成长与一致预期因子溢价迅速衰减,而质量、价值及低波因子则迎来了估值修复。最关键的转折点出现在2025年8月至9月,由于前期资金过度拥挤在市值因子上,导致该赛道拥挤度达到历史极值,随后触发了剧烈的均值回归。这种微观交易结构的突然恶化,与量化策略集体回撤的时间点在统计上高度重合。图表1:2025风格因子对比传统&AI策略超额净值表现11.31.251.21.151.11.0510.950.90.852025/01/02 2025/02/10 2025/03/24 2025/05/06 2025/06/16 2025/07/28

2025/09/08

2025/10/20 2025/12/01分析师一致预期 成长 动量 质量 传统线性策略 GBDTNN机器学习策略图表2:2025风格因子对比传统&AI策略超额净值表现21.31.251.21.151.11.0510.950.90.852025/01/02 2025/02/10 2025/03/24 2025/05/06 2025/06/16 2025/07/28

2025/09/08

2025/10/20 2025/12/01技术面 价值 波动 市值 传统线性策略 GBDTNN机器学习策略AI893005001000AIAI图表3:AI与传统线性策略VS绩优300指增产品超额净值1.2 11.15 0.81.1 0.61.05 0.41 0.20.95 02025/01/02 2025/02/14 2025/03/21 2025/04/28 2025/06/06 2025/07/11 2025/08/15 2025/09/19 2025/11/03量化策略超额撤段 GBDTNN机器学习策略 传统线性策略 沪深300指增产超额图表4:AI与传统线性策略VS绩优500指增产品超额净值1.25 11.2

0.90.81.15

0.70.61.1 0.51.05

0.40.30.210.10.95 02025/01/02 2025/02/14 2025/03/21 2025/04/28 2025/06/06 2025/07/11 2025/08/15 2025/09/19 2025/11/03量化策略超额撤段 GBDTNN机器学习策略 传统线性策略 中证500指增产超额图表5:AI与传统线性策略VS绩优1000指增产品超额净值1.25 11.2

0.90.81.15

0.70.61.1 0.51.05

0.40.30.210.10.95 02025/01/02 2025/02/14 2025/03/21 2025/04/28 2025/06/06 2025/07/11 2025/08/15 2025/09/19 2025/11/03量化策略超额撤段 传统线性策略 GBDTNN机器学习策略 中证1000指增品额二、策略同质化困局与失效的深层统计学归因模型架构趋同引发的拥挤交易与系统性风险除了市场环境的客观因素,行业内部的策略同质化是导致本次回撤的内生核心原因。随着AI技术在量化投资中的普及,目前神经网络(如GRU)和树模型(如LightGBM)已成为行业通用的基座模型。我们计算了这些主流模型生成的因子与公募指增基金净值的动态相关性,结果显示二者的相关系数不仅持续走高,且长期维持在高位。这意味着,尽管各家机构的代码实现不同,但其策略底层的选股逻辑和持仓结构是高度相似的。特别是在中证1000、中证500等流动性相对敏感的赛道,这种同质化极易引发共振。当市场风格发生逆转时,大量策略同时发出卖出信号,导致拥挤交易,因子的流动性瞬间枯竭,从而在短时间内放大了尾部风险。图表6:相关性计算流程图2023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32025/1/32025/3/32025/5/32025/7/32025/9/32023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32025/1/32025/3/32025/5/32025/7/32025/9/32023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32025/1/32025/3/32025/5/32025/7/32025/9/3图表7:AI3000.250.20.150.10.050-0.05300_GRU300_LGBM图表8:AI5000.50.40.30.20.10-0.1500_GRU500_LGBM7 0.50.40.30.20.12023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32025/1/32025/3/32025/5/32025/7/32025/9/302023/1/32023/3/32023/5/32023/7/32023/9/32023/11/32024/1/32024/3/32024/5/32024/7/32024/9/32024/11/32025/1/32025/3/32025/5/32025/7/32025/9/3-0.11000_GRU 1000_LGBM从算法原理层面分析,AI模型的失效本质上是训练数据分布与当前市场特征的统计学错配。AI模型通过挖掘历史数据中的非线性规律进行预测,其有效性严格受限于训练样本的覆盖范围。回顾2024年初的流动性冲击,以及2025年9月后的高频板块轮动,这些极端行情的特征在历史长周期数据中占比极低,属于典型的长尾样本。依赖常态数据训练的模型,很难在这些特殊时期捕捉到有效的资产联动规律。此外,面对2025年下半年核心资产抱团的二八分化行情,量化模型通常倾向于分散持仓,难以适应这种资金高度集中的特定市场结构,导致预测信号与市场实际走势出现严重偏差,最终引发了策略净值的大幅波动。图表10:GRU模型、LGBM模型超额回撤阶段(2023.11-2024.04)54.84.64.44.243.83.63.43.2202311292023122720240125202403012024032932023112920231227202401252024030120240329GRU LGBM图表11:GRU模型、LGBM模型超额回撤阶段(2024.08-2025.02)54.94.84.74.64.54.44.34.24.12024082620240909202409252024101620241030202411132024112720241211202412252025010920250123202502144202408262024090920240925202410162024103020241113202411272024121120241225202501092025012320250214GRU LGBM图表12:GRU模型、LGBM模型超额回撤阶段(2025.06-2025.12)5.95.75.55.35.14.94.7202506062025062020250704202507182025080120250815202508292025091220250926202510202025110320251117202512014.520250606202506202025070420250718202508012025081520250829202509122025092620251020202511032025111720251201GRU LGBM三、外围风控体系:多种类、多周期事件化的开放式择时框架AI——基于多种类、多周期事件化的全自动开放式择时框架。该框架的设计初衷是为了解决传统择时策略中指标筛选繁杂、参数调整主观性过强的问题,通过标准化的三层处理流程来生成信号。第一层是数据清洗层,我们将量价、宏观HPKalman或DTW配对点方法(频数据)YoYo)事件化处理层,我们将连续变化的数值指标转化为明确的二元多空信号。通过设定突破均线、通道破位、震荡区间突破等规则,系统能够敏锐捕捉指标在不同周期上的非线性拐点。最终,我们依据各细分信Softmax图表13:传统择时策略构建流程图表14:择时框架优化

AI模型风控应用在长周期的实证回测中,这套择时框架表现出了显著的收益增强和回撤控制能力。以中A50020202025710.6144.3011.82,Sharpe0.813100015.89图表15:中证A500合成择时策略净值择时仓位(右轴) 中证A500合成择策略 中证A500合成择策略超额净值 中证A500指数2 110.6 0(注:数据截至2025.7.15)图表16:中证A500合成择时策略回测表现(2020.01-2025.07)买入A500

年化收益率

年化波动率

Sharpe比率

最大回撤率

Calmar比率

Sortino比率

年化超额收益率

信息比率

超额最大回撤

信平均持号有天数次数

看多胜率看空胜率 合成 10.6113.05合成 10.6113.050.81-11.820.901.63 10.24 0.67-22.27 53 9.81 54.72 50.00择时策略中证 0.5719.380.03-44.30-- - - - - - - -

(2025.7.15)图表17:中证1000合成择时策略回测表现(2020.01-2025.07)买入1000

年化收益率

年化波动率

Sharpe比率

最大回撤率

Calmar比率

Sortino比率

年化超额收益率

信息比率

超额最大回撤

信平均持号有天数次数

看多胜率看空胜率 合成 15.8916.48合成 15.8916.480.96-14.151.121.97 14.61 0.78-21.86 38 18.11 63.16 48.65择时策略中证 2.0921.300.10-51.46-- - - - - - - -

(2025.7.15)27GRU风控环节,对策略的多头持仓进行实时监控。回测结果显示,该择时策略成功识别了GRU20242025AI策略的年化超额收益稳定在4.154.127.21辑独立的择时系统,实现了选股与择时的双重保护,是应对极端行情的有效手段。图表18:择时策略持仓净值与表现2.5 12 0.81.5 0.61 0.40.5 0.20 0策略持仓 策略净值 基准图表19:择时策略分年度表现35.00%30.22%24.65%19.38%24.65%19.38%12.81%25.00%20.00%15.00%10.00%5.00%0.00%

2022

2023

2024

2025图表20:择时策略指标表现(2022.01-2025.12)年化收益 年化超额年化波动率 最大回撤 Sharpe Calmar比22.324.1522.324.155.42-3.104.127.219.881.4277.7875.00

Sortino IR 买入胜率 卖出胜率四、AI核心模型的针对性优化:LGBM与GRU的迭代升级LightGBMHuberLoss针对树模型(LightGBM)在训练过程中倾向于对所有样本赋予等同权重导致的噪音干扰与尾部敏感问题,我们提出了从预测端到训练端的双重优化方案。在预测端,核心痛点在于模型容易被大量失效的噪音样本误导。为此,我们设计了基于高质量样本的因子加权方案。具体实施上,我们回溯历史数据,筛选出在策略回撤期间依然保持较高信息系数(IC)的抗跌因子,利用这些因子对训练集中的个股样本进行综合打分,并选取综合得分排名前20的样本定义为高质量样本,在模型训练时赋予其更高的权重。这一机制在数学上强行引导梯度下降的方向向那些在极端行情下仍具有预测效力的样本特征靠拢。(MSE)HuberLoss。HuberLossMSEMAE实证数据显示,经过上述优化的LGBM模型,其多头超额最大回撤从8.845.882.884.07(Size、非线性市值(Nnlinerize)及流动性(Liqidity)等风险因子的暴露度普遍收敛,证明该优化有效抑制了模型为追求短期高收益而过度暴露于投机性风格的倾向。图表21:因子净值对比65432120180103201811012019082620200624202104212022021820221213202310132024080720250610020180103201811012019082620200624202104212022021820221213202310132024080720250610style_factor_lgbm style_factor_lgbm_goodfactor_weighted_3图表22:风格暴露对比0-0.5style_factor_lgbm style_factor_lgbm_goodfactor_weighted_3 style_factor_lgbm_huber_weighted_3图表23:因子表现分析arestyle_factor_lgbm 11.280.9413.0525.491.293.568.842.8882.775.38style_factor_lgbm 11.000.9312.8123.721.243.506.483.6677.375.10style_factor_lgbm 11.010.9913.6123.941.263.745.884.0778.285.34因子名称 ic_meanic_ir ictlong_ec_retlong_sarestyle_factor_lgbm 11.280.9413.0525.491.293.568.842.8882.775.38style_factor_lgbm 11.000.9312.8123.721.243.506.483.6677.375.10style_factor_lgbm 11.010.9913.6123.941.263.745.884.0778.285.34

ls_retls_shap _weighted_huber_weightedGRUCVaR针对GRU时序模型信息利用率低及缺乏历史记忆机制的缺陷,我们进行了根本性的架构重塑。首先,引入AttentionPooling(注意力池化)模块取代取末尾隐状态的简单做法。通过构建一个可学习的Query向量,对GRU输出的全序列隐状态进行加权求和。这种机制赋予了模型自适应聚焦的能力,使其能够根据当前市场状态,自动识别并重点关注时间序列中的关键转折点(如波动率放大点),解决了序列内信息利用不充分的问题。更进一步,我们创新性地引入了Memory模块与CVaRLoss(条件在险价值损失)的闭环机制。Memory模块构建了一个可读写的Key-Value记忆库,用于存储历史上的典型行情模式。而在训练目标上,我们引入CVaRLoss,专门针对预测误差最大的前20样本进行优化。在CVaRLoss的强力引导下,Memory模块被迫重点学习并存储那些最难预测的极端行情特征。当实盘遇到类似危机时,模型以当前状态为Query,从Memory中检索相似的历史极端模式,从而做出更具前瞻性的风控决策。这一以险为鉴的闭环机制效果惊人:相比引入Attention后的中间版本,最终架构将GRU模型的多头超额收益提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论