学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架

上传人：b*** IP属地：新疆上传时间：2026-02-27 格式：DOCX 页数：16 大小：1.30MB 积分：15 举报 版权申诉

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架_第2页

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架_第3页

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架_第4页

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架_第5页

已阅读5页，还剩11页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

引言 4研究方法 5实证分析 8CHRONOS模型的前瞻性偏差消融研究 14最高的年化收益率总结 16风险提示： 17图表1文章框架 4图表2不确定性感知因子选择的模型架构 5图表3潜在因子预测模型概览 7图表4Q-BOOST模型参数 7图表5CAE和Q-BOOST模型的超参 9图表6CAE模型下样本外的风险收益前沿 9图表7不同模型的表现比较（CAE,IID-BS,Q-BOOST,ZS-CHRONOS）图表82000年至2024年各预测模型在自适应 Κ∗ 选择下的累计收益 12图表9各策略在市场回撤年份的年度收益 12图表102000年至2024年各自适应 Κ∗ 策略样本外收益的相关系数矩阵 12图表11自适应 选择方法构建的投资组合的样本外性能指标与扩展因子回归结果 13图表12数据集构建前后的模型性能对比 15图表13数据集构建前后的性能统计（2011–2017年与2018–2024年） 15引言图表1文章框架整理理解资产收益的截面差异依然是实证金融领域的核心问题。经典的线性因子模型——例如套利定价理论（ArbitragePricingTheory,APT）或Fama–French——假设资产收益由少量潜在或可观测的风险因子驱动，且这些因子载荷在各公司间固定不变。尽管此类模型在理论上优雅且具有经济可解释性，但它们依赖于较强的线性与平稳性假设，并且往往忽视了公司特征中丰富的异质性以及不断变化的市场状态。近期研究已指出这些方法的局限性，尤其是它们在捕捉动态、非线性依赖关系或时变敞口方面的不足。为克服这些局限，我们在文献AutoencoderAssetPricingModels（2020）提出的条件自编码器（CAE）模型基础上展开研究。该模型通过允许因子载荷非线性地依赖于公司特有的滞后特征，推广了线性因子模型。CAE通过神经网络架构联合学习潜在因子与基于特征的敞口，从而对收益生成过程实现更具表达力的刻画。这一结构提升了潜在因子收益的信噪比，并改善了其样本外预测的稳定性。深度潜在因子模型的最新进展也印证了在高维金融环境中对公司层面变量与潜在风险之间交互进行建模的重要性。的一个核心建模选择是潜在因子空间的维度K。K限制在小值（K≈5），以保持可解释性并限制过拟合。相比之下，我们下运作（最高至K=50），并引入一种事后筛选程序，根据因子的样本外可预测性来选择潜在投资组合。对于每个潜在因子，多个预测模型会生成预测分布，我们据此量化预测不确定性。随后，根据预测稳定性对因子进行排序，仅保留那些预测最为可靠的因子。这种不确定性感知的选择制了估计风险。通过基于预测置信度对因子排序，该过程显式地最小化样本外期望效用损失，从而使因子选择与投资组合优化的下游目标保持一致——这与传统上仅依据纯统计重构准则来确定K的做法形成鲜明对比。我们的贡献兼具方法学与实证两方面。首先，我们提出了一种新颖的感知因子投资组合选择框架，将经由CAE提取的高维潜在投资组合与来自多种先进预测模型的预测信号相结合。其次，我们证明，当高维CAE普比率（Sharpe）、索提诺比率（Sortino）和欧米伽比率（Omega），同时将最10%（如Chronos）和分位数梯度提升回归树生成的预测能够提供互补的预测信号，大幅增强CAE（IID）产生稳健的、市场中性的投资组合，具备优异且稳定的样本外表现。我们的研究结果凸显了预测不确定性作为因子可预测性的实用指标的价值，并验证了深度潜在模型与现代前沿预测技术在现代资产定价应用中的有效性。研究方法我们采用一个两阶段流程：使用CAE（）；预测不确定性指导筛选具有可预测收益的投资组合。图表2不确定性感知因子选择的模型架构研究所

ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》，华安证券说明：首先，条件自编码器（CAE）模型从公司特征中提取高维潜在因子投资组合。接下来，时间序列预测模型为每个因子生成点预测与分位数预测，并据此进行不确定性量化。随后，根据不确定性对因子进行排序，选出最具可预测性的子集，在因子空间中进行切点投资组合优化，之后再映射为可交易资产的权重。令𝑟i,s∈R表示资产i在时间s的超额收益，𝑧𝑖,𝑠−1∈𝑅𝑃表示其滞后的公司特征。CAE将资产收益建模为：其中𝛽𝑖(𝑧𝑖,𝑠−1)∈𝑅𝐾∈𝑅𝐾𝑢𝑖,𝑠∈𝑅𝛽𝑖(⋅)ReLU潜在因子𝑓𝑠∈𝑅𝐾通过对收益在公司特征上的横截面投影提取：其中𝑍𝑠−1∈𝑅𝑁×𝑃∈𝑅𝐾×𝑃}𝑠=1𝑠训练成，CAE为潜在κ=}𝑠=1𝑠训练成，CAE为潜在κ=1,…,K生成间列{𝑓(𝑘)𝑡 ，我们𝑡+1𝑡+1̂𝑘)∈𝑅𝑄∈(0,1)t+1的预𝛼∈𝑄𝑡+1̂,𝛼)}该通用公式适用于我们考虑的所有预测模型。利用预测不确定性估计U(𝑘)，我们将所有K该通用公式适用于我们考虑的所有预测模型。利用预测不确定性估计U(𝑘)，我们将所有K个潜在因子按不确定性升序排列。𝑡+1矩阵算因协差阵，切投组w= 𝑓 𝑡+1。随后过(5)∑−1𝜇f,t1𝑇∑−1𝜇𝑓 𝑡+1κ∈𝑅𝑘𝑋𝑘𝜇𝑡+1∈𝑅𝑘κ∈{1,K}κ将其映射为资产权重：为实现公式(7)为实现公式(7)–(8)中的预测与不确定性估计，我们考虑三种模型：基于样本IID-BSQ-BoostZS-Chronos。𝑓𝑓其中W(𝑘)𝜖𝑅𝑘𝑋𝑃CAEWκ=1,2,K不确定性类型跨2个Bootstrap分位数的均值MeanAbsoluteDeviaacross2Boo基于XGBoost的中位数(使用RAPIDS训练)不确定性类型跨2个Bootstrap分位数的均值MeanAbsoluteDeviaacross2Boo基于XGBoost的中位数(使用RAPIDS训练)XGBoost-BasedRAPIDS)基于CZS-ChronosQ-Boost基于IID(样本均值)IID-Based(SampleMean)IID-BS预测模型缩写ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》（α（α此，Q-Boost能有效捕捉局部非线性动态，且计算效率高。𝑡+1𝑡+1𝑡+1U(𝑘)(7)̂f(𝑘,0.05)̂f(𝑘,0.95)𝑡+1𝑘 𝑡𝑘 𝑡+1拟合一个分位数回归树Q(𝛼)：̂f(𝑘,𝛼)=Q(𝛼)(x(𝑘))。中位数预测̂f(𝑘,0.5)作为点预测估3节α∈Q={0.05,0.5,0.95}}s=1𝑠𝑡𝒕+𝟏计每个潜在因子𝐟(𝒌)的条件位数函数。令x(𝑘)∈𝑅𝑑表示历史{f(𝑘)𝑡 中提的第二种模型，分位数梯度提升回归树（Q-Boost），利用滞后时间序列特征估𝑡+1𝑡+1算经验分位数̂f(𝑘,𝛼)，再利用公式(7)计算预测离散度得分U(𝑘)。不确定性，我们从该窗口生成B个自助重采样样本，并在水平α∈{0.05,0.95}上计𝑠=1𝑠𝑡𝑡+1𝑡+1分布取。预测̂f(𝑘)取滚动口的本̂f(𝑘)=1∑𝑡 𝑓(𝑘)。为评预测}s=1𝑠定性的因子选择的制它假潜因收益{f(𝑘)𝑡 是一个稳布独同第一种模型，记作IID-BSCAE加入了基于预测不确ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》𝑡+1 𝑡+1𝑡+1 𝑡+1该值的平均绝对偏差。Chronos以零样本（ZS）配置运行，无需任务特定微调，利用预训练知识生成跨领域的竞争性预测。其在GIFT-Eval基准上的有效性已得到验证，在金融与经济预测任务中名列前茅。这一强劲性能与高速度是我们选择Chronos作为核心预测组件的原因。综上，这些模型提供了丰富的预测信号集合，以支持稳健的投资组合构建：IID-BSQ-BoostZS-Chronos中Q={0.1,0.2,…,0.9}。中心预测为中位数̂f(𝑘)=̂f(𝑘,0.5)，不确定性按(7)计算为，其𝑡+1𝛼∈𝑄}s=1𝑠们输其史列{f(𝑘)𝑡 ，并得一分数测̂f(𝑘,𝛼)第三种模型，ZS-Chronos，是一个基于Encoder-DecoderT5架构的2.05亿参数的预训练时间序列基础模型（TSFM）。我们特别选用Chronos-Bolt变GPUChronosκ，我实证分析2000月度收益票在每个滚动估计窗口期末按市值排序。所有收益均已对股息和拆股进行调整。CAE框架中使用的预测因子按照文献IsThereaReplicationCrisisinFinance?（2023）构建，涵盖153个多空投资组合，覆盖美国股票市场，时间跨度为1962年2月至2024年12月。为确保方法的严谨性并消除潜在的前瞻偏差（look-aheadbias），我们严格遵循文献中详述的时间规范。具体而言，因子构建所用的所有公司层面特征均至少滞后六个月，以反映真实的数据可得性约束。这一滞后结构确保时刻t的因子投资组合仅基于不晚于t-6时可观测的信息构建，从而在预测框架中保持因果解释的合理性与实际可实施性。我们的实证分析采用扩展窗口预测方案，以尽可能贴近现实投资环境。最初，CAE在1962年2月至1999年12月（38年）的数据上进行训练，以提取潜在因子表征和基于特征的敞口。在每个扩展的训练窗口内，我们利用最近12年作为滚动验证期200012024年12（25年）CAE。对于所有绩效分析——包括集成策略——我们将投资限制在绝对权重最高的300只股票束，结合我们的月度再平衡策略以及对流动性强的大盘股的聚焦，确保所报告策略具有稳健性、可实施性，并能抵御市场摩擦的影响。我们在多个潜在维度下评估基于CAE的模型表现。具体而言，训练了六种CAEK∈{5,10,20,30,40,50}。该设计使我们能够系统地考察模型的可扩展性及预测效能随潜在复杂度变化的情况。对于每个K2节详述的预测性的成分用于投资组合构建。为降低估计方差并提高稳健性，我们对多个CAE模型进行集成，这些模型采用不同的随机权重初始化，相关模型构建与实现细节可参见文献（Shihao,BryanKelly等，2020）CAE。5Q-Boost模型的超参ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》我们看到，将预测不确定性6风险收益前沿κ下生成的投资组合，结果表明，利用不确定性感知选择始终优于基准CAE模型。图中绘制的配置涵盖了在K=50设定下，由IID-BS、Q-Boost和ZS-ChronosCAE图表6CAE模型下样本外的风险收益前沿ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》我们的分析显示，随着κ的变化，前沿曲线呈现平滑的曲率，反映出所选潜在因子数量与投资组合表现之间的稳定关系。这一行为表明，该过程对κ的小幅扰动并不高度敏感，从而降低了过拟合的风险。因此，观察到的性能提升可归因于对数据中持久结构的利用，而非虚假变异。我们的研究结果表明，即便不使用全部潜在因子，也能实现强大的样本外表现。κ<50的配置常常优于完整的CAEκ∈{20,…,40}通常能提供最佳的收益7图表7不同模型的表现比较（CAE,IID-BS,Q-Boost,ZS-Chronos）研究所

ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》，华安证券𝑡尽管前述分析表明，事后选择κ可获得稳健表现，但它隐含假设了κ的未来最优性，这限制了实际应用的可行性。为弥补这一局限，我们引入了一种潜在因子数量的自适应选择程序，记作κ(𝑚)∗，该程序仅依赖决策时点t可获取的信息。这一自适应方法在保留不确定性感知因子选择方法论的同时，提供了现实且可实施的预测。𝑡具体而言，我们采用扩展窗口框架，为每个预测模型m∈{1,2,3}（分别对应𝑡IID-BS、Q-Boost、ZS-Chronos）κ(𝑚)∗κ，我们基于过去的风险调整表现，采用时间正则化目标来自适应优化。我们选择索提诺比率𝑡（Sortinoratio）作为主要选择标准，因为它强调下行风险，从而相较于对上行与下行偏差均等惩罚的夏普比率，能够促成更为积极的κ自适应选择。尽管夏普比率可作为替代方案，但我们的目标是优先考虑不易受负收益影响的投资组合。𝑡形式上，令r(m,κ)∈RH表示模型m在使用κ个因子的过去H个周期内的样本外收益向量。定义经验下行偏差、平均收益以及索提诺比率如下：𝑡由于在每一步直接对κ最大化索提诺比率会因偶尔出现的负收益所引发的高方差而导致不稳定，因此我们提出一种平滑、可微的离散优化近似方法，采用log-sum-exp(LSE)形式。引入潜变量𝜃(𝑚)=logκ(𝑚)∗（取对数尺度以保证正值），目标函数变为：

𝑡 𝑡其中λ>0控制平滑程度，二次项对在对数空间中的偏差施加惩罚，从而提供一种局部化效应以稳定选择过程。为增强时间稳定性，我们加入一项正则化项，鼓励因子复杂度随时间逐步演化(η>0)：在每个窗口内求解的最终优化问题为：由此我们得到：这种log-sum-exp近似遵循文献Nesterov，2005）的平滑优化框架，能够实现稳定的基于梯度的优化。此外，我们的正则化项在概念上与Follow-The-Regularized-Leader(FTRL)EladHazan（2016）H.BrendanMcMahan𝑡（2013）λ=1、η=2H=12，并在前12κ(𝑚)∗K/2。我们对所提出的自适应选择方法进行了实证评估，发现在一系列参数选择（λ、η、𝑡下结果均具有稳健性，从而证实了我们框架的实际有效性与泛化能力。自适应策略（IID-BS、Q-Boost与ZS-Chronos）在2000年至20248的累计收益均跑赢市场（SPY）。在市场下行期的韧性也很明显，图表9突出显示，即使在市场出现回撤的年份，几乎所有模型仍能产生正收益。图表82000年至2024年各预测模型在自适应 κ∗ 选择下的累计收益ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》，华安证券研究所

图表9各策略在市场回撤年份的年度收益ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》，华安证券研究所尽管共享相同的CAE潜在因子空间（K=50），自适应策略之间的成对收益相关性较低，如图5所示。这种多样性表明，每个预测模型捕捉了不同的信号，并对底层因子动态与市场条件作出不同反应。图表10 2000年至2024年各自适应策略样本外收益的相关系数阵ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》受各单独策略互补性表现的驱动，我们基于切点投资组合框架构建了两种集成组合。在每次再平衡时点t，我们计算样本均值收益向量μt∈Rn与样本协方差矩阵Σt∈Rn×n，其中n表示组成策略的数量。这些估计量通过截至时点t的所有可用样本外收益数据的扩展窗口推导得出。随后，通过最大化夏普比率确定投资组合∑−1𝜇

= 𝑡 𝑡。wt∈Rn1𝑇∑−1𝜇合权重向量。

𝑡 𝑡我们考虑该集成构建的两种变体：集成)（SPY），集成(B)完全市场中性。如图表所报告，两种集成策略在广泛的评价指标上均表现出卓越性能成(A)夏普比率（2.20）（5.95）年化波动率（6.52%）和最大回撤（9.22%）。集成(B)则取得了最高的索提诺比率（4.22），同时保持负的贝塔值（对市场呈负相关）。11自适应 ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》为了评估考虑交易成本后的模型表现，我们将月度换手率计算为ℓ1范数：wt†t再平衡之前的投资组合权重，该权重由上一次配置在收益实现后结转而来。用线性交易成模型计，其中p,t𝑅Gross总收益，p,tκ>0为交易成本比例常数κ=0.001对应102000大盘股和中盘股10在投资组合总风险敞口约束为2.0的条件下，理论上的最大月度换手率为4.0，对应于对多头与空头头寸的完全清仓与重建。观测到的平均月度换手率约为2.0，表明模型每月大约会再平衡其一半的头寸，显示出相对于最大可能水平的适中交易强度。面板B。Chronos模型的前瞻性偏差消融研究我们考察一个同时交易无风险资产和风险资产的市场，无风险利率设为0（不失一般性）。鉴于ZS-Chronos模型在整个评估期内表现强劲，我们有必要探讨：其成功是否可能源于预训练过程中引入的隐藏偏差，尤其是接触金融数据所带来的偏差。这一问题对于在广泛且异构数据集上训练的基础模型尤为重要，因为在复杂数据集上训练时，信息泄漏（informationleakage）往往难以追踪。为了解决这一疑问，我们开展了消融研究（ablationstudy），分析两个方面：我们评估过程中所用输入数据的来源；（2）Chronos模型预训练数据的详细特征。值得注意的是，在我们的框架中，输入给ZS-Chronos的并非原始市场时间序列由模型生成的合成潜在因子收益序列CAE学到的因子载荷，对股票收益进行加权线性组合构造而成，因而在我们实验设置中是独有的。由于这些潜在因子是在模型内部推导得到的，在模型训练之前并不存在，因此ZS-Chronos在预训练阶段不可能接触到这些数据。此外，我们还分析了Chronos预训练过程中所使用的特定金融数据。根据文献的记载，训练语料库中唯一包含的金融数据集是M4数据集，该数据集是为M4预测竞赛开发的，来源于ForeDeck数据库，包含10万条历史时间序列，并于2017年12月28日正因如此，Chronos模型在训练时没有2018年1月1日之后的任何金融不会受到2017年之后市场信息的影响。为了评估这一点，我们对比了ZS-Chronos与基准模型在两个独立时期的表现：M4数据集可用前）M4数据集可用后（2018–2024）这两个七年窗口为我们提供了在不同市场机制下表现的均衡视角，使我们能够检验ZS-Chronos模型在训练截止点之后是否会出现性能下降。如果基于M4数据集的预训练引入了任何前瞻性偏差（forward-lookingbias），我们应预期在2018年之后其性能会出现可衡量的下滑。图表12数据集构建前后的模型性能对比研究所

ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》，华安证券图表12比较了每个预测模型在M4数据集发布前后于Chronos2018（见图表13）相当接近。这一结果表明，在接触M4数据集之前，ZS-Chronos并未比其他模图表13数据集构建前后的性能统计（2011–2017年与2018–2024年）ScalingConditionalAutoencodersforPortfolioOptimizationviaUncertainty-AwareFactorSelection》与此形成对比的是，在2018年之后的时期（详见图表13），模型间的性能差异变得尤为明显。具体而言，ZS-Chronos取得了最高的年化收益率（11.79%），并且在风险调整指标上表现优越，实现了1.826的夏普比率与3.898的索提诺比率。相反，其他预测模型无论在绝对收益还是在风险调整表现上都相对较弱。M4ZS-Chronos在2018ZS-Chronos之后这一实证证据有力地支持了以下结论：ZS-Chronos在2018年之后的优越表现并

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架

文档简介

温馨提示

最新文档

评论

学海拾珠系列之二百六十四：不确定性感知因子选择驱动的高维CAE资产定价框架

文档简介

温馨提示

最新文档

评论

相关文档