深度学习选股训练目标的多维优化-深度学习系列之二

上传人：b*** IP属地：北京上传时间：2026-06-01 格式：DOCX 页数：20 大小：823.72KB 积分：15 举报 版权申诉

已阅读5页，还剩15页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

内容目录一、引言 4二、训练目标的系统性测试 5测试框架设计 5Pointwise类 5Pairwise类 6Listwise类 7结果对比 8三、多目标和多任务学习 9从梯度下降到Jacobian下降 9梯度下降的局限性 9Jacobian下降 9聚合器介绍 10案例一：收益预测与换手率的双重优化 11案例二：市值与行业的分域优化 11案例三：跨时间的梯度聚合实现稳健的特征提取 12案例四：收益与风险预测的多任务优化 13案例五：长短周期收益预测的多任务优化 13四、因子与策略表现多频率数据下的模型表现 15模型集成与因子表现 16策略表现 17五、总结六、参考文献七、风险提示图表目录图1：多窗口信息融合模型架构 5图2：单目标函数训练模型的样本外表现 8图3：梯度集合方式的示意图 11图4：收益预测与换手率的双重优化对比 11图5：市值与行业的分域优化对比 12图6：跨时间梯度聚合优化对比 13图7：收益与风险预测的多任务优化对比 13图8：长短周期收益预测的多任务优化对比 14图9：多频率数据下的模型表现对比 15图10：GSM-1min分组回测 15图11：GSM-1minRankIC表现 15图12：GSM-5min分组回测 15图13：GSM-5minRankIC表现 15图14：GSM-15min分组回测 16图15：GSM-15minRankIC表现 16图16：GSM-60min分组回测 16图17：GSM-60minRankIC表现 16图18：GSM-1d分组回测 16图19：GSM-1dRankIC表现 16图20：多频率数据生成因子间的相关性 17图21：合成因子表现 17图22：合成因子与风格因子的相关性 17图23：指数增强策略表现 18图24：沪深300增强策略表现 18图25：中证500增强策略表现 18图26：中证1000增强策略表现 18一、引言随着人工智能技术的飞速发展，深度学习已逐步渗透到量化投资领域的核心环节。相较于传统线性多因子模型，深度神经网络凭借其强大的非线性拟合能力和特征学习能力，能够从高维异构的金融数据中挖掘复杂的非线性定价关系，显著提升了截面选股模型的预测精度。然而，金融时间序列固有的低信噪比、非平稳性以及市场机制的结构性变化，共同加剧了模型训练目标设计的复杂性。首先，现有损失函数与投资目标存在结构性错配。现有训练范式大多基于单一损失函数的经验风险最小化（ERM）框架，如均方误差（MSE）最小化或信息系数（IC）最大化。这种简化处理虽然计算便捷，却与真实投资决策的复杂性存在本质错配，导致模型在样本外实盘或市场环境发生切换时表现出脆弱性，难以持续创造超额收益。金融投资的目标是实现风险调整后的收益最大化或特定约束下的组合优化，而常用的损失函数仅衡量预测值与真实值的偏离程度，未能直接反映组合构建中的交易成本、换手率约束或尾部风险。这种proxyproblem使得模型训练损失函数的选择变得困难，因为研究者往往难以判断哪个训练目标更符合实盘需求。其次，量化投资目标具有多样性，单一损失函数难以同时刻画多维约束。一个可实盘部署的选股模型需同时满足：高精度的收益预测能力、对市场风格切换（如大小盘轮动、价值成长切换）的免疫性、较严格的行业与市值中性约束、低换手率以降低冲击成本，以及对极端行情的稳健性。这些目标往往相互牵制：过度追求预测精度可能导致模型出现显著的风险暴露；强行拟合历史极端行情又可能牺牲在正常市场中的预测能力。传统方法试图通过加权求和将多目标转化为标量优化，但这种"单目标化"处理本质上回避了目标间的权衡关系。最后，多目标间的梯度冲突（GradientConflict）使得简单合并损失函数的策略失效。当模型同时优化多目标时，例如同时优化收益预测与风险控制场景中，预测任务可能要求保留风格相关的梯度分量，而风险控制任务则要求消除该分量，两者梯度方向可能呈负相关甚至正交。直接梯度相加或加权平均可能会导致范数较大的梯度淹没其他目标信号，或冲突梯度相互抵消，最终某些子目标被系统性压制，优化过程陷入次优解甚至发散。（Multi-ObjectiveOptimization,为深度学习选股提供了系统性的理论突破。区别于传统的标量化方法，MOO旨在寻找Pareto最优解，即在无法改进任一目标而不损害其他目标的前提下的最优权衡。特别地，Quinton与Rey（2025）在[1中提出的Jacobian下降（JacobianDescent,）算法及其核心聚合器UPGrad（UcoflicigrjecionfGadiesUGad通过将各目标梯度投影至对偶锥（DualCone）并解析冲突，能够实现多个目标的无冲突优化。基于上述背景，本报告旨在构建面向深度学习选股的训练目标多维优化框架。通过引入Jacobian下降算法与UPGrad聚合机制，建立多目标优化体系，探索如何在不损失预测精度的前提下提取更优的Alpha特征。本报告的内容安排如下：第2章介绍基础模型与三大类型的目标函数，对不同类型的目标函数进行分析，并对比其驱动模型的优化表现。第3章介绍多目标和多任务学习，阐述Jacobian下降的理论基础，进行基于UPGrad梯度聚合的量化选股模型训练案例分析。第4章应用多目标优化方案，对多频率数据源进行训练并集成，生成更优的因子表现。第5章总结。二、训练目标的系统性测试在深度学习选股模型的构建过程中，损失函数的设计与选择直接决定了模型优化的方向和最终性能表现。本章将系统性地测试和比较各类损失函数在量化选股任务中的应用效果，从Pointwise、Pairwise到Listwise三个维度展开并深入测试分析。测试框架设计测试模型如下：图1：多窗口信息融合模型架构,,

,Log-signature

TemporalEncoder,TemporalEncoder,,Average,Transformer,,,

,TemporalEncoderLog-signatureTemporalEncoder

Predictor

,1…,,

,TemporalEncoderLog-signatureTemporalEncoder天风证券研究所详细介绍可参考前期报告《在线学习增强选股模型的适应性——深度学习系列之一[2]中GSM的处理方式，对长序列进行多次窗口期切分，例如最长的窗口对应整个序列，第二个窗口长度为整条序列的1/2，第三个窗口长度为整条序列的1/4，以此类推。窗口之间呈现包含关系，从长中短期不同的角度提取时序特征。每个窗口均包含最新的信息，这在量化选股场景中更为重要。对窗口期序列进行标准化后，经过Log-signature变换并经过编码器降维后得到对应的多窗口期特征。多窗口期特征存在信息冗余，利用Transformer的中注意力机制给不同周期的特征加权并融合，最终由预测器得到输出。这里Log-signature变换为时间序列特征提取算法，详细可参考[2]，计算代码可参考[3]。305minVWAP、成交量以及成交额。标准化方式为窗口期内时序标准化，即价格序列统一除训练标签默认为t+1至t+11的收益率，进行截面z-score标准化处理。2008/1/12017/12/31，在数据集中按照555组模型参数后，将输出结果等权平均作为最终的因子值。测试集为2018/1/1至2026/2/28，测试时剔除ST/ST*、涨跌停以及新股，周度调仓回测，暂未考虑交易费用。Pointwise类Pointwise类损失函数是深度学习中最基础、应用最广泛的损失函数类型。这类损失函数独立处理每个样本，将预测值与真实值之间的差异作为优化目标。均方误差（MeanSquared,MSE）计算预测值与真实值之间差值的平方和的均值。𝑀𝑆𝐸=

𝑁1∑𝑖−̂𝑖,𝑖=其中，为样本数量，𝑖为第𝑖个样本的真实收益，̂𝑖为模型预测值。MSE损失具有实现简单、训练稳定、数学性质良好的优势，且凸函数特性保证优化过程能够收敛到全局最优。然而，其对异常值较为敏感，平方项会放大极端收益的影响，导致模型过度拟合异常样本。平均绝对误差（Mean,MAE）𝑁1𝑀𝐴𝐸=∑|𝑖−̂𝑖|,𝑖=其中，为样本数量，𝑖为第𝑖个样本的真实收益，̂𝑖为模型预测值。MAE损失对极端收益样本不敏感，对数据中的噪声和异常值具有较强的抵抗能力。但其在零点处不可导，这可能导致优化过程震荡，且在接近最优解时收敛速度较慢。Huber损失结合了MSE和MSE，误差较大时采用MAE。11𝑁 𝑖−̂𝑖, |𝑖−̂𝑖|≤𝛿𝐻𝑢𝑏𝑟=

∑𝑖=

2𝛿

−̂𝑖|−

12𝛿), |

−̂𝑖|>𝛿其中，为样本数量，𝑖为第𝑖个样本的真实收益，̂𝑖为模型预测值，𝛿为阈值参数，控制MSE和MAE的切换边界。Huber损失兼顾稳健性和收敛性，其自适应惩罚机制对小误差精确拟合，对大误差稳健处理。𝛿的选择需要权衡稳健性和收敛速度，𝛿较小则更接近MAE，稳健性强但收敛慢；𝛿较大则更接近MSE，收敛快但对异常值敏感。加权均方误差（WMSE）WMSE在MSE基础上引入权重，通过对截面上按收益排序的头部组合与空头组合赋予更高的权重、中间部分组合赋予更低的权重，实现对高潜力Alpha区域的聚焦优化，并期望提升多空表现。1𝑊𝑀𝑆𝐸=

𝑁∑𝑤𝑖𝑖−̂𝑖,𝑖=其中，为样本数量，𝑖为第𝑖个样本的真实收益，̂𝑖为模型预测值，表示第𝑖个WMSE损失在保留MSE类Pointwise类损失关注逐样本的偏差损失，而Pairwise类聚焦于样本对的比较损失，直接优化股票之间的排序关系，而非绝对收益值。RankNetRankNet将截面选股转化为成对概率估计问题。其损失函数遍历所有的𝑖>𝑗的资产对，并惩罚排序错误的情况。𝑅𝑎 =∑log+𝑅𝑎𝑦𝑖>𝑦𝑗RankNet的目标与截面选股目标一致，实现截面相对强弱的排序。然而，其仅关注局部成对极Batch也会增加计算量。MarginRanking间隔排序损失基于最大间隔原则，同样遍历所有的𝑖>𝑗的资产对，要求强势股票的预测值至少高于弱势股票的预测值一个阈值，通过Hinge函数构造具有间隔意识的排序边界。𝑀𝑅𝐿=∑max(0,𝛿−(̂𝑖−̂𝑗)),𝑦𝑖>𝑦𝑗间隔参数控制模型对排序置信度的要求。其对于收益差距较大的资产对与差距较小的资产对给予相同的权重，可能会拟合噪声。Listwise类Listwise类损失函数将整个股票列表作为优化对象，直接优化列表级别的评价指标。这类损失函数与量化选股的最终评价指标最为接近，但设计和优化难度也最大。IC信息系数损失通过最小化负Pearson相关系数，直接优化模型预测得分与真实收益间的线性相关性：𝐼𝐶=−𝜌̂,,其中，𝜌表示相关系数。IC损失将选股模型的优化目标与业界标准的评价指标直接对齐，具有显式的数学解析形式，具有可导性且梯度计算稳定。然而，由于其基于标签与预测的绝对数值进行计算，故对异常收益（如涨跌停个股）较为敏感。Rank秩信息系数损失采用Spearman秩相关系数，通过将原始收益映射为秩来优化预测的排序准确性。𝑅𝑎𝑘𝐼𝐶=−𝜌(𝑅𝑦̂,𝑅𝑦),其中，𝑅̂和𝑅𝑦分别表示第𝑖个股票在截面上预测收益̂和真实收益

的降序排名。𝑖 𝑖 𝑖 𝑖应用RankIC作为损失函数的关键在于近似排序使其可导。Sigmoid软排序实现了这个功能，其使用Sigmoid函数近似排序指示函数：𝑦 ∑

𝑖−𝑗𝑅𝑖=1+𝑗≠𝑖

𝜎( 𝜏其中，𝜎为Sigmoid函数，𝜏为温度参数。当𝜏→0时，Sigmoid趋近于阶跃函数，软排序趋近于硬排序；当𝜏较大时，软排序更加平滑。RankIC损失关注相对排序而非绝对收益数值，对异常值具有天然稳健性，且与量化投资实践中常用的RankIC评价指标完全一致。但基于RankIC目标进行训练可能会丢失目标的绝对大小信息。CCC一致性相关系数损失综合考量预测值与真实值的相关性、尺度一致性与位置偏差，防止模型生成虽相关但存在系统性偏置的预测：CCC=1−CCC=1−

𝜌̂𝑦𝜎+𝜎+(‾̂−‾)𝑦其中，𝜌为ean相关系数，̂和𝑦CC损失不仅要求预测与真实收益趋势一致，还强制二者的均值与方差匹配，有效避免模型产生方向正确但系统性高估或低估收益的预测偏移。然而，同时优化相关性、位置与尺度三重结果对比本节对比各单目标函数训练模型在样本外的表现。图2：单目标函数训练模型的样本外表现目标函数类型目标函数 RankIC ICIR 多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤Pointwise类 MSE10.45%0.9739.72%1.31112.13%7.6014.82%MAE10.25%0.9136.25%1.11100.30%6.2611.74%Huber10.55%0.9337.67%1.25108.56%7.0512.35%WMSE10.14%0.9140.59%1.36117.26%7.7214.58%Pairwise类 RankNet10.78%0.9438.63%1.16115.26%7.4314.40%MRL10.82%0.9436.93%1.25109.44%7.2213.74%Listwise类 IC10.74%0.9939.10%1.32121.64%8.0814.19%RankIC11.09%0.9338.18%1.27115.92%7.2816.48%CCC10.60%0.9539.45%1.29114.93%8.0412.42%深圳米筐RQData基于样本外测试结果isise类目标函数优于传统iie和airiePiie与WMSE头部组合收益的拟合效果相比排序类目标更好，具有更优的多头年化收益。在Pairwise类中RaNet与RL具有相比于inise的表现不如RankNetListwise表现最为均衡，RankICIC与分布差异，具有不错的表现。单目标函数各有侧重，难以简单评判绝对优劣，实际应用更强调与策略目标的适配性。然而单一优化往往难以兼顾多重需求，因此构建多目标优化体系的重要性更加凸显。三、多目标和多任务学习从梯度下降到Jacobian下降梯度下降的局限性在量化选股模型的训练过程中，传统的单目标优化方法往往难以满足实际投资场景的复杂需求。标准的梯度下降算法针对单一损失函数进行优化，其数学表述为：𝜃∗=argmin𝜃,𝜃其中𝜃表示损失函数，𝜃为模型参数。梯度下降的核心更新规则为：𝜃𝑡+=𝜃𝑡−𝜂∇𝜃𝑡,这里𝜂为学习率，∇表示损失函数在当前参数处的梯度。然而，当面对多目标优化问题时，这种简单的梯度下降策略暴露出明显的局限性。多目标冲突问题是梯度下降方法面临的核心挑战。在量化选股场景中，我们通常需要同时优化多个目标，例如：提升预测精准度来实现收益最大化，降低预测信号潜在的风险暴露以控制波动率和最大回撤，提升预测信号的自相关性降低换手率，行业中性约束以避免行业集中度风险等。假设我们有𝑚个目标函数{𝜃,𝜃,⋯,𝜃}，每个目标函数对应的梯度为∇𝑖𝜃。线性加权的目标函数为：𝜃=∑𝑤𝑖𝑖𝜃,𝑖=其梯度为：𝛻𝜃=∑𝑤𝑖𝛻𝑖𝜃,𝑖=当这些梯度方向存在冲突时，简单的梯度加权平均可能导致次优甚至矛盾的更新方向。Jacobian下降Jacobian下降算法为解决多目标优化中的梯度冲突问题提供了一种系统性的框架。该方法通过引入Jacobian矩阵来统一描述多个目标函数的梯度信息（Aggregator）来生成协调的更新方向。对于给定的𝑚个目标函数，这里将其写为向量的形式：⊤𝜃=(𝜃,𝜃,⋯,𝜃).对于多目标函数:ℝ→ℝ，其在点𝜃处的Jacobian矩阵𝒥𝜃∈ℝ×定义为：∂∂𝜃

𝜃

∂

𝜃∇∇𝜃

∂ ∂𝜃

∂𝜃 ⋯

𝜃𝒥𝜃=[

∂𝜃

∂𝜃 ,⋮ ⋮∇𝜃⊤ ∂

⋮ ⋱ ⋮∂ ∂

∂𝜃

𝜃]Jacobian矩阵的第𝑖行对应第𝑖个目标函数的梯度转置，其中𝑚为目标数量，𝑛为参数维度。Jacobian下降算法的核心在于通过聚合器𝒜将Jacobian矩阵映射为一个统一的更新方向。𝜃𝑡+=𝜃𝑡−𝜂𝒜(𝒥𝜃𝑡),其中𝒜:ℝ×→ℝ为聚合器函数，负责将多个梯度信息融合为单一的参数更新方向。聚合器的作用体现在以下几个方面：冲突消解：当不同目标的梯度方向冲突时，聚合器能够识别并缓解这种冲突，生成一个对所有目标都有利的更新方向。尺度归一化：聚合器自动处理不同目标梯度的尺度差异，避免梯度主导现象。权衡控制：通过聚合器的设计，可以灵活地控制不同目标之间的权衡关系。聚合器介绍首先我们参考[1]中的定义，一个良好的梯度聚合器应该具有如下性质：1.非冲突性：令𝒜:ℝ×→ℝ是一个聚合器。如果对于所有𝐽∈ℝ×都有𝒜𝐽⋅𝐽≥0，则称𝒜是非冲突的。非冲突性要求聚合器在进行梯度聚合后，聚合梯度与聚合前任何梯度在方向上都不冲突，𝐶⊆ℝ𝐶（Daloe定义为𝑥∈ℝ:∈𝐶,0≤𝑥⊤}。换句话说，𝒜𝐽在𝐽每个行的对偶锥中，保证了按聚合梯度方向进行参数更新时，所有目标函数在局部均不会恶化。𝒜:ℝ×→ℝ𝐽∈ℝ×0<∈ℝ到𝒜diag𝐽的映射关于是线性的，则称𝒜是缩放线性的。在梯度下降中，更新量与梯度范数成比例。为了与梯度下降保持一致，Jacobian矩阵的行也应该自然地按照其范数成比例地对聚合做出贡献。加权性：令𝒜:ℝ×→ℝ是一个聚合器。如果对于所有𝐽∈ℝ×𝑤∈ℝ满足𝒜𝐽=𝐽⊤⋅𝑤，则称𝒜是加权的。加权性限制梯度聚合器仍然以线性的形式聚合梯度。UPGrad是一种基于对偶锥投影的聚合器，其核心思想是将每个目标梯度投影到所有其他目标梯度的对偶锥中，从而实现非冲突的梯度聚合。UPGrad聚合器定义为：1𝒜𝑈𝑃𝐺𝑟𝑎𝐽=𝑚∑𝜋𝐽𝐽𝑖,𝑖=其中𝐽𝑖表示Jacobian矩阵的第𝑖行（即第𝑖个目标的梯度。𝜋𝐽⋅为投影算子，定义为：𝜋𝐽𝑥=argmin𝑦:𝐽𝑦≥0

∥−𝑥∥,该投影将向量𝑥投影到由约束𝐽≥0定义的可行域中。约束𝐽≥0确保投影后的方向与所有目标梯度都呈非负内积。对偶锥𝐾∗={:𝐽≥包含所有与Jacobian矩阵各行（目标梯度）呈非钝角的方向。将梯度投影到这个锥中，确保更新方向不会与任何目标产生冲突。图3：梯度集合方式的示意图Quinton,P.&Rey,V.JacobianDescentForMulti-ObjectiveOptimization图中绿色部分表示两个梯度的对偶锥，UPGrad将两个梯度投影到对偶锥上，并取平均。得到聚合梯度的大小以及方向，其不与任何一个梯度方向产生冲突。[1]中证明UPGrad满足前面提到的三个性质。UPGrad以及其他类型聚合器的实现可参考TorchJD模块，其与PyTorch无缝衔接，通过简单的数行代码实现了多目标优化的平衡。为量化场景中的应用奠定了基础。案例一：收益预测与换手率的双重优化在前述单目标优化测试中，我们观察到因子的换手率相对较高，这里我们将因子的自相关性纳入到训练目标中，共设计两个优化目标。=

𝑁1∑𝑖−̂𝑖,𝑖==−𝜌̂,̂−,̂−5个交易日前的输出值。这里需注意在训练时，前向传播中输出̂−的过程不生成计算图，并确保̂−与̂对齐。这两个目标中优化因子的选股表现，优化因子的自相关性来降低换手率。目标上存在一定的冲突，TorchJD帮助我们实现了两个目标的优化过程。图4：收益预测与换手率的双重优化对比训练目标RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤收益预测10.45%0.9739.72%1.31112.13%7.6014.82%收益预测与换手率双重优化10.35%1.0138.91%0.92110.32%7.2614.94%深圳米筐RQData在收益预测与换手率控制的双重优化下，得益于Jacobian下降中梯度聚合器的非冲突性，因子的预测能力并未出现较大的衰减，多头换手率降幅显著。案例二：市值与行业的分域优化基于量价信息的深度学习因子通常与市值密切相关，可能具有一定的小市值偏向，或与市值呈现某种非线性关系，例如偏向市值首尾两端。传统的市值中性化难以剔除因子与市值之间的非线性关联。另外，深度学习因子在行业层面也可能具有一定的偏向。所以限制其在市值和行业上的暴露，才能获取更为稳定的Alpha。首先基于市值大小在截面上进行10分组划分，在每个市值域中计算RankNet损失，以实现对每个市值域中股票两两排序精准度的优化，期望在各市值域中均具有较强的排序能力。𝑠𝑖𝑧=𝑅𝑎𝑛𝑘𝑒𝑡̂,, 𝑖=1,2,⋯,10.𝑖 𝑖RankNet损失，期望在各行业分域中均具有较强的排序能力。=𝑅𝑎𝑛𝑘𝑒𝑡̂,, 𝑗=1,2,⋯,𝑛.𝑗 𝑗最后加上在全局中的预测能力目标，𝑁1= ∑𝑖−̂𝑖,𝑖=分域优化的多目标共同实现了对于行业和市值的中性，局部排序和全局预测的共同优化避免了因子在某些域中的显著偏向。图5：市值与行业的分域优化对比训练目标RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤收益预测10.45%0.9739.72%1.31112.13%7.6014.82%市值与行业分域优化11.13%0.9537.75%1.23116.24%7.2611.94%行业市值中性收益预测10.66%0.9836.01%1.34112.25%7.1712.11%深圳米筐RQData在全局优化中加入市值与行业分域的局部排序优化，能够显著增强因子的排序能力，并进一步降低因子对市值与行业的依赖。从回测表现上看多空最大回撤降幅显著。另外相比于中性化标签训练，其在回测指标上具有优势。案例三：跨时间的梯度聚合实现稳健的特征提取传统量化模型训练范式通常采用单日截面批次（dailycross-sectionalbatch）策略，即以单个交易日内全量股票样本构建训练Batch，通过随机采样不同交易日进行梯度下降优化。在此框架下，每次参数更新的梯度方向实质上是该交易日特定市场状态下各股票梯度的算术平均。然而，这种的优化模式存在一定的缺陷：每次参数优化时会向单一市场状态下的平均梯度方向进行偏移，每次更新的梯度方向可能存在冲突。最终在多轮更新抵消后，可能将一些市场状态下的平均梯度视为噪音，缺乏对不同时间维度市场状态的泛化能力，在一些极端状态下表现出脆弱的样本外稳定性。针对上述局限，本节提出跨时间梯度聚合机制。具体而言，我们不再以单日全截面作为独1050010个mini-Batch，每个mini-Batch对应不同的市场状态。关键创新在于：我们将每个mini-Batch视为独立的优化目标，分别计算每个mini-Batch上的损失函数，从而在单次迭代中形成10个并行的优化目标。通过多目标梯度聚合，模型参数更新方向与10个mini-Batch𝑡=

𝑁𝑡1∑𝑡−̂𝑡, 𝑡=1,2,⋯,10.𝑡 𝑖 𝑖𝑡𝑖=这种跨时间梯度聚合的优化范式具有三重核心优势：第一，状态适应性增强。模型不再讨好单一交易日的特殊模式，而是学习跨时间的普适性特征表征，天然具备对牛市、熊市、震荡市等不同市场状态的自适应能力。第二，参数更新的稳健性提升。通过跨交易日梯度信息的正则化效应，模型对极端状态的敏感性显著降低，参数更新方向更加稳定。第三，不变特征提取。多时间维度的联合优化实质上是将模型暴露于多样化的数据分布中，迫使特征提取层捕捉具有时间不变性的特征。在金融预测任务中，市场状态的动态演化是模型失效的主要原因。跨时间梯度聚合将模型优化从单点拟合升级为跨域泛化。这种改进不仅是算法层面的技术创新，更是针对金融数据的必要适应——只有让模型在训练阶段就经历多种市场机制的"压力测试"，才能在实际应用中展现出真正的稳健性。因此，该方法为构建具有长期稳定预测能力的量化模型提供了关键的训练策略支撑。图6：跨时间梯度聚合优化对比训练目标RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤收益预测10.45%0.9739.72%1.31112.13%7.6014.82%跨时间梯度聚合优化10.51%0.9940.39%1.34120.88%8.1214.62%深圳米筐RQData跨时间梯度聚合的训练方法能够实现更加稳健的参数优化，在多头收益以及多空收益上呈现出显著的提升效果。案例四：收益与风险预测的多任务优化多目标优化可进一步延伸至多任务优化场景。需要对模型结构进行小幅调整，将predictor前的特征提取模块保留，作为sharedmodule；将predictor替换为多个任务特定模块即多个taskmodule分别进行输出。多个输出头共享特征提取层得到的中间变量。多任务对应的目标也会驱动中间变量尽可能提取到多个任务所需的信息。这里我们将收益预测与最大回撤预测作为关联的任务对，即希望特征在包含收益预测相关信息的同时，也含有对未来下行风险的预测信息。风险预测的辅助任务驱动主任务生成更稳健的收益预测结果。1=

𝑁𝑖𝑖−̂,𝑖𝑖=1=

𝑁𝑖𝑖−̂,𝑖𝑖=TorchJD在优化时，taskmodule部分会进行普通的梯度下降，sharedmodule部分会进行Jacobian下降，即对于该部分多目标计算的梯度进行聚合。图7：收益与风险预测的多任务优化对比训练目标RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤收益预测10.45%0.9739.72%1.31112.13%7.6014.82%收益风险多任务优化10.60%0.9638.15%1.25114.53%8.0111.72%深圳米筐RQData加入最大回撤预测的辅助任务后，主任务依赖的特征包含了最大回撤的信息，驱动主任务生成更加稳健的预测，多空最大回撤有明显降低，但多头收益也有一定程度的下降。案例五：长短周期收益预测的多任务优化5taskmodule1、3、5、8、10个交易日后的收益率。共同依赖sharedmodule的输出，驱动中间变量包含未来收益率长短周期变化的信息，而并非单周期信息，从而提升信号本身的稳健性。=

𝑁1∑(−̂)

, =1,3,⋯,10.𝑖 𝑖𝑖=图8：长短周期收益预测的多任务优化对比训练目标RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤收益预测10.45%0.9739.72%1.31112.13%7.6014.82%长短周期收益多任务优化10.74%0.9739.64%1.31113.38%7.7912.87%深圳米筐RQData预测未来收益曲线相比于单点预测而言，主要的提升在于RankIC与多空最大回撤改善层面，多周期预测中多个辅助任务驱动主任务生成稳健的预测，UPGrad梯度聚合器来处理多任务间的梯度冲突。四、因子与策略表现考虑到众多训练目标的表现，本章采用跨时间的梯度聚合来进行训练，希望模型学习到跨市场状态的普适表示，以及市场机制的共性。为提升模型表现，训练时使用年度滚动重训105折交叉验证的形式，划55组参数生成因子后平均。多频率数据下的模型表现我们引入多频率的数据分别训练模型，即10日1min数据、30日5min数据、60日15min数据、90日60min数据、120日日频数据，每组数据单独训练模型。下面是各数据集对应的模型表现：图9：多频率数据下的模型表现对比训练数据RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤GSM-1min10.02%0.9335.19%1.41110.77%7.1418.85%GSM-5min11.06%0.9740.62%1.30119.32%8.0314.94%GSM-15min10.34%0.9239.11%1.17111.12%7.3415.46%GSM-60min9.78%0.9140.21%1.05100.55%6.5611.22%GSM-1d9.81%0.8941.71%1.01106.95%6.8014.81%深圳米筐RQData图10：分组回测图11：RankIC表现深圳米筐RQData 深圳米筐RQData图12：分组回测图13：RankIC表现深圳米筐RQData 深圳米筐RQData图14：分组回测图15：RankIC表现深圳米筐RQData 深圳米筐RQData图16：分组回测图17：RankIC表现深圳米筐RQData 深圳米筐RQData图18：分组回测图19：RankIC表现深圳米筐RQData 深圳米筐RQData不同频率数据源生成因子的表现具有较大差异。由于高频数据选择短窗口期，故呈现的特征是换手率较高且波动较大。随着窗口期的拉长与频率的降低，生成因子的RankIC有所下降，但多头收益有所提升。基于多频率多窗口信息生成因子的不同表现为后续集成做进一步优化奠定了基础。模型集成与因子表现下面是多数据集下因子的相关性对比：图20：多频率数据生成因子间的相关性相关系数 GSM-1min GSM-5min GSM-15min GSM-60min GSM-1dGSM-1min175.41%66.62%61.21%56.94%GSM-5min75.41%185.98%75.20%69.13%GSM-15min66.62%85.98%184.52%75.46%GSM-60min61.21%75.20%84.52%181.67%GSM-1d56.94%69.13%75.46%81.67%1深圳米筐RQData多频率数据间相关性较低。接下来我们将多数据集的因子进行合成，表现进一步提升。下面是合成因子的表现及风险相关性情况。图21：合成因子表现因子RankICICIR多头年化收益多头换手率多空年化收益多空信息比率多空最大回撤合成因子12.02%1.0542.75%1.12140.31%8.4115.23%深圳米筐RQData图22：合成因子与风格因子的相关性0.10-0.1-0.2-0.3-0.4-0.5-0.6深圳米筐RQData策略表现本节利用合成因子构建沪深300、中证500、中证1000指数增强组合，构建说明如下：回测区间为2018年1月2日至2026年2月28日，构建周频调仓策略，以次日vwap价格成交，选股范围为全市场不含北交所，剔除ST/*ST股票以及当日停牌、涨跌停的股票。优化目标为指标最大化。个股权重偏离上限沪深300增强组合为1，中证500增强组合为0.810000.580。行业与风格偏离方面，20.310。易费用设定为双边千三。下表为各指数增强策略表现：图23：指数增强策略表现组合年化收益率换手率超额年化收益率超额年化波动率信息比率超额最大回撤沪深300增强14.4511.8712.584.552.775.76中证500增强19.0012.2014.534.793.046.49中证1000增强26.6912.7723.875.374.457.17深圳米筐RQData图24：沪深300增强策略表现深圳米筐RQData图25：中证500增强策略表现

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

深度学习选股训练目标的多维优化-深度学习系列之二

文档简介

温馨提示

最新文档

评论

深度学习选股训练目标的多维优化-深度学习系列之二

文档简介

温馨提示

最新文档

评论

相关文档