版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、引言:隐形成的实挑战 4二、经典模型回顾从论基石到实践框架 4(一)本探:内究进与献 5(二国前:典论与新态 5三、创新突破:基机学习的冲击建模实践 8(一)因量建 8(二特工程 91、时击价越冲击大 102、时击市比的流性耗 103、久击市比期价影响 (三模构:LightGBM的练表现 121、时击关驱子 132、时击主变量 133、久击核因素 14(四模优:式归与解性正 14四、结论 15五、风险提示 15六、参考文献 15图表1 型数表 4图表2 本算辑 9图表3 击本算法 9图表4 征表 10图表5 时击本特征关性 10图表6 时击本特征关性 图表7 久击本特征关性 12图表8 型练果 12图表9 时击型子的要度 13图表10 临冲模子的要度 13图表永冲模子的要度 14一、引言:隐形成本的现实挑战随着我国资本市场的不断成熟,高频交易、算法交易已成为市场交易的重要组成部分,交易行为的复杂性与时效性显著提升,市场参与者对交易成本的敏感度也日益提高。在实际交易过程中,无论是机构投资者的大额下单,还是中小投资者的批量交易,都会对IC本次研究报告,我们创新性地引入了人工智能模型对冲击成本进行建模,因为在样本量足够大,覆盖场景足够广的情况下,机器学习模型能够有效建立特征与冲击成本之间的关系。二、经典模型回顾:从理论基石到实践框架当前,国内外学者对价格冲击与冲击成本的研究已取得一定成果。下表给出了一般冲击模型涉及的相关变量定义:图表1 模型参数表变量定义X订单委托量V股票当日预期成交量EIV母单交易时段预期成交量ADV日均成交量PoV订单全天市占比,X/VPOV订单区间市占比,X/(X+EIV)σ当日波动率:对数收益的标准差,实际应用时可以使用过去10个交易日的平均日内波动率作为当日波动率的预测T母单交易时长,分别为母单开始结束时刻θ股票自由流通股数tfrac交易时长占一天(4h)的百分比Sspread股票的平均买卖价差创证券整理(一)本土探索:国内研究进展与贡献王若昕与马锋(2021)(Intraday杨世超等(2021)从市场质量视角出发,系统分析了投资者交易频率对市场流动性与价格波动的动态影响。文章通过构建交易频率与市场微观结构指标(如买卖价差、市场深度)之间的关联模型,探讨不同交易频率行为对市场均衡的影响机制。研究表明,交易频率的提升在一定程度上能够增加市场流动性,但在特定市场环境下也可能加剧价格波动,并引发所谓的流动性幻觉。然而,该研究模型参数多基于历史均值估计,缺乏对极端市场环境下参数突变的自适应能力,同时难以识别多种交易特征之间可能存在的复杂交互关系。刘志东等(2017)(Jump在处理多资产和高维交易特征(如撤单行为、订单流毒性等)总体来看,国内相关研究大多延续了传统计量模型的建模思路,通常假设市场变量之间满足线性关系或简单函数形式。虽然这些方法在解释交易规模、市场波动率以及交易行为对价格变化的影响方面具有一定作用,但在高频交易环境下,市场冲击往往受到多种微观结构因素的共同影响,其作用机制往往呈现出显著的非线性特征。因此,仅依赖线性模型难以充分刻画交易行为与价格冲击之间的复杂关系。(二)国际前沿:经典理论与最新动态国外研究中,Hasbrouck(1991)提出了价格冲击的信息含量测量方法,通过构建向量自回归(VAR)模型分析价格与成交量的动态关系,量化交易行为的价格冲击效应。文章试图回答一笔交易中究竟包含多少信息这一核心问题,并通过构建向量自回归(VAR)模型来刻画交易行为与价格变化之间的动态关系。设rt为资产收益率,xt为交易方向变量(买入为+1,卖出为−1),则模型可以表示为:𝑘 𝑘𝑟𝑡=∑𝑎𝑖𝑟𝑡−𝑖+∑𝑏𝑗𝑥𝑡−𝑗+𝜀𝑡𝑖=1 𝑗=0其中𝑟𝑡−𝑖表示滞后收益率,𝑥𝑡−𝑗表示滞后交易方向,𝜀𝑡为随机误差项。通过VAR模型,可以利用脉冲响应函数(ImpulseResponseFunction)分析一笔交易对未来价格变化的动态影响:𝐼𝑅𝐹(𝑘)=
∂𝑟𝑡+𝑘∂𝑥𝑡在此基础上,文章提出了重要指标InformationShare(IS),用于衡量交易信息对价格变化的贡献比例:𝐼𝑆=
𝑉𝑎𝑟(tradeinnovation)𝑉𝑎𝑟(priceinnovation)研究结果表明,交易行为对价格变化具有显著且持续的影响,交易中包含的重要信息会逐步反映在价格之中。然而,该研究的局限在于其样本主要基于较低频率数据,并未考虑高频交易环境下的微观结构特征,同时模型结构对线性VAR框架存在较强依赖。Bouchaud(PropagatorModel)𝑝𝑡=∑𝐺(𝑡−𝑡′)𝜖𝑡′𝑣𝑡′𝑡′<𝑡研究发现市场冲击具有随时间衰减的特征:𝐺(𝜏)∼𝜏−𝛽同时订单流具有显著的长记忆特性:𝐶𝑜𝑟𝑟(𝜖𝑡,𝜖𝑡+𝜏)∼𝜏−𝛾(FlowVPIN(Volume-synchronizedProbabilityofInformedTrading)。该方法将交易按照成交量而非时间进行划分,并计算买卖成交量差异。其基本形式为:𝑉𝑃𝐼𝑁=
∣𝑉𝑏𝑢𝑦−𝑉𝑠𝑒𝑙𝑙∣𝑉其中𝑉𝑏𝑢𝑦为买入成交量,𝑉𝑠𝑒𝑙𝑙为卖出成交量,𝑉为总成交量。在实际计算中通常采用滑动窗口形式:1𝑉𝑃𝐼𝑁=
𝑛∑∣𝑉𝑏𝑢𝑦−𝑉𝑠𝑒𝑙𝑙∣𝑖=1VPIN(争议。Hoffmann与合作者(2013)则研究了高频金融数据中的领先-滞后关系(Lead–LagRelationship)𝑡与𝑡𝑌𝑡=𝑋𝑡−𝜃+𝜀𝑡其中𝜃表示领先-滞后参数。为解决非同步交易问题,文章采用Hayashi–Yoshida协方差估计量:𝑌=∑Δ𝑡𝑖𝑗𝑖,𝑗其中只有当时间区间满足[𝑡𝑖−1,𝑡𝑖]∩[𝑠𝑗−1,𝑠𝑗]≠∅时才计入协方差计算。通过在不同时间偏移下计算协方差函数:𝜃̂=argmax𝐶𝑜𝑣(𝑋𝑡,𝑌𝑡+𝜃)𝜃RobertAlmgren与NeilChrissXMI=0.5∙γ∙σ∙ ∙ADV
θ )
X+η∙σ∙|
3/5|其中,
ADV
ADV∙T1、γ,η为参数需要通过交易母单数据估算。20.5∙γ∙σ∙
∙(θ
1/4) ADV ADV与波动率、订单市占比X及个股当日换手率的倒数相关。V3、η∙σ∙|X
3/5| ADV∙T短期价格影响,与波动率、下单速率相关。该模型为后续最优执行研究提供了重要理论基础,但其主要基于硬性幂函数形式的经验假设,对于复杂市场环境下的非线性关系刻画仍存在一定局限。在实践层面,投资银行和量化交易机构通常会基于经验数据构建市场冲击模型。J.P.Morgan(2010)提出了一种结合订单流比例的市场冲击模型,其基本形式为:2PoVMI=ω∙1+PoV∙I+(1−ω)∙I+𝑆𝑠𝑝𝑟𝑒𝑎𝑑其中,1、I=𝛼∙𝑃𝑜𝑉𝛽∙𝜎𝛾,ω,𝛼,𝛽,𝛾为参数需要通过交易母单数据估算得到;2、ω∙2PoV1+PoV
∙I为永久性冲击;3、(1−ω)∙I为临时性冲击;4、𝑆𝑠𝑝𝑟𝑒𝑎𝑑为瞬时冲击。𝑆𝑠𝑝𝑟𝑒𝑎𝑑ωRobertKissellMortonGlantz(2004)市场冲击=f(市场不均衡程度,波动率,交易风格,流动性)MI=b1∙I∙POVa4+(1−b1)∙I其中,I=a
∙(X)a2∙σa3,aa
aab为参数需要通过交易母单数据估算,b
∙I∙1
12341 1POVa4b1)∙I为综上所述,传统市场冲击模型通常基于线性或幂函数形式假设,虽然能够在一定程度上解释交易规模、波动率与市场冲击之间的关系,但其模型结构相对简单,难以刻画高频交易环境下复杂的非线性关系。因此,近年来越来越多研究开始引入机器学习方法,通过非线性模型对市场冲击进行预测,以提高交易成本估计的准确性。三、创新突破:基于机器学习的冲击建模实践市场冲击模型基于特定的价格运动假设(如几何布朗运动)及冲击函数(数(一)因变量构建价为avcebd1和ak1=b+ak1。𝑖𝑛𝑠𝑡𝑎𝑛𝑡𝑖𝑚𝑝𝑎𝑐𝑡=
𝑚𝑎𝑥(𝑚𝑖𝑑1,𝑚𝑖𝑛(𝑎𝑣𝑔𝑃𝑟𝑖𝑐𝑒,𝑎𝑠𝑘1))−1𝑚𝑖𝑑1也就是说,当成交均价低于中间价时,瞬时冲击为0中间价临时性冲击定义为𝑡𝑒𝑚𝑝𝑜𝑟𝑎𝑟𝑦𝑖𝑚𝑝𝑎𝑐𝑡=
𝑚𝑎𝑥(0,𝑎𝑣𝑔𝑃𝑟𝑖𝑐𝑒−𝑎𝑠𝑘1)𝑚𝑖𝑑1也就是说,临时性冲击成本衡量的是成交价格大于对手盘的部分瞬时冲击和委托激进程度,股票流动性,弹性正相关。母单瞬时冲击成本、临时性冲击成本为子单对应项目按成交量加权求和。对于母单的永久性冲击成本,我们认为它是用来衡量母单的交易执行过程对市场价格造成影响,需要剔除市场自身的趋势,这里的做法是用母单区间涨幅减去股票对应申万一级行业指数的区间涨幅乘以母单区间实际市占比作为代理,即𝑝𝑒𝑟𝑚𝑎𝑛𝑒𝑛𝑡𝑖𝑚𝑝𝑎𝑐𝑡=max(0,股票区间涨跌幅度−申万指数区间涨跌幅)∗母单区间市占比图表2成本计算逻辑创证券整理图表3冲击成本计算方法名称计算方法瞬时冲击成本子单价差成本之和临时性冲击成本子单冲击成本之和永久性冲击成本股票区间涨幅减指数区间涨幅乘以实际市占比创证券整理(二)特征工程计算市场冲击时应该合并相同母单,这里如果两个母单的买卖方向、股票、交易日、算法类型相同且母单开始时间结束时间相差不超过1分钟,则合并;总共有2425646个母单,特征与Label(预测目标)的相关性如下。特征释义如表4。图表4特征列表名称定义类型intervalPOV21预估母单区间市占比母单特征TwSpread卖一价减买一价除以中间价微观结构ClosePriceDaily前收盘价母单特征TickPeriod平均盘口价格变动时间微观结构TurnoverPeriod订单平均执行时间微观结构algo算法名称母单特征dailyPOV预估母单全天市占比母单特征SpreadPeriod平均价差微观结构TradePeriod平均交易时间微观结构side母单方向母单特征Ats平均交易量母单特征QuoteSize订单簿中买卖订单数量均值微观结构orderDurInPct母单持续时间占比母单特征Mdv21过去21天交易量中位数微观结构Adv20过去20天交易量平均值微观结构AccVolumeDaily累计成交量微观结构orderStartTimeInPct母单开始时间母单特征创证券整理1(TickPeriodDaily)特征相关性TwSpreadDaily0.3756TwSpread0.3560TickPeriod特征相关性TwSpreadDaily0.3756TwSpread0.3560TickPeriod0.2876TickPeriodDaily0.2514Ats0.2074AtsDaily0.2003actualPov0.1407TurnoverPeriod0.1347QuoteSize0.1314orderDurInPct0.0686Mdv210.0604Adv200.0580TradePeriod0.0579QuoteSizeDaily0.0567TradePeriodDaily0.0517AccVolumeDaily0.0435TurnoverPeriodDaily0.0069orderStartTimeInPct-0.0024SpreadPeriodDaily-0.0283SpreadPeriod-0.0376ClosePriceDaily-0.0953AdjustedCloseDaily-0.0953创证券2、临时冲击:市占比主导的流动性消耗(TickPeriodDaily)图表6特征相关性actualPov0.1139SpreadPeriodDaily0.0419SpreadPeriod0.0384ClosePriceDaily0.0266AdjustedCloseDaily0.0266TradePeriod0.0125TradePeriodDaily0.0099orderStartTimeInPct0.0022orderDurInPct0.0015TurnoverPeriodDaily0.0000QuoteSizeDaily-0.0039AccVolumeDaily-0.0047Mdv21-0.0091Adv20-0.0093QuoteSize-0.0130TurnoverPeriod-0.0155TwSpreadDaily-0.0248TwSpread-0.0285AtsDaily-0.0294Ats-0.0322TickPeriodDaily-0.0344TickPeriod-0.0386创证券3、永久冲击:市占比的长期价格影响整体上看,永久冲击与TickPeriod负相关;与股票价格正相关,价格越大永久冲击成本越大;与母单市占比正相关。图表7特征相关性actualPov0.5813SpreadPeriodDaily0.0700SpreadPeriod0.0667ClosePriceDaily0.0398AdjustedCloseDaily0.0398orderDurInPct0.0217orderStartTimeInPct0.0211TradePeriod0.0145TradePeriodDaily0.0122TurnoverPeriodDaily-0.0009QuoteSizeDaily-0.0083AccVolumeDaily-0.0110Mdv21-0.0163Adv20-0.0165QuoteSize-0.0175TurnoverPeriod-0.0182TwSpreadDaily-0.0342TwSpread-0.0404AtsDaily-0.0420TickPeriodDaily-0.0452Ats-0.0465TickPeriod-0.0501创证券特征可分为两类,分别是母单自身特征和市场微观结构,我们构建了如下特征,用于模型训练。(三)模型构建:LightGBM的训练与表现LightGBM1961690300804R0.6017。预测目标数据集MSER方预测目标数据集MSER方准确率相关性瞬时冲击训练集5.70760.387578.16%0.5356瞬时冲击测试集3.90410.279673.45%0.4165临时冲击训练集4.94940.064617.18%0.1591临时冲击测试集0.59710.447728.81%0.5419永久冲击训练集2.09750.614936.73%0.6311永久冲击测试集3.25880.619333.13%0.5898冲击成本训练集13.55800.381486.67%0.5233冲击成本测试集8.45400.441884.67%0.6017创证券测试集各模型因子重要度情况如下:1、瞬时冲击的关键驱动因子重要度最高的3个因子分别是:收盘价ClosePriceDaily、区间市占比intervalPOV21及算法类型。500450400350300200150100500特征瞬时冲击重要度图表500450400350300200150100500特征瞬时冲击重要度创证券2、临时冲击的主导变量3intervalPOV21ClosePriceDaily。特征500450400350300250200特征500450400350300250200150100500临时冲击重要度创证券3、永久冲击的核心因素3dailyPOV21TradePeriod及成交活跃性TurnoverPeriod。500450400300250200100500特征永久冲击重要度图表500450400300250200100500特征永久冲击重要度创证券(四)模型优化:显式回归与可解释性校正LightGBM模型的有效性依赖于训练样本的代表性,对于那些离训练样本距离很远的数据,模型给出的预测结果将失真,比如尝试去预测一个市占比为90%的全天单,那预测结果会显著偏小,因为实际交易数据中不存在这样的样本。另外模型给出的冲击可能不符合预期,比如保持其它输入参数一样,只增加下单量,得到的冲击可能反而变小。为了解决这些问题,我们在LightGBM模型基础上再增加一个显式表达式模型,基本逻辑是在LightGBM模型能够很好工作的区间求取预测值,再对这些预测值用显式表达回归建模。以瞬时冲击为例,LightGBM模型用到的特征为sidealgoTradePeriodTurnoverPeriodTickPeriodClosePriceDailySpreadPeriodintervalPOV21其中TradePeriodTurnoverPeriodTickPeriodClosePriceDailySpreadPeriodSide、algointervalPOV21intervalPOV21[0.0010.15]范围内,为此我们使用模型预测区间市占比在[0.0010.15]povimpact𝑖𝑚𝑝𝑎𝑐𝑡=𝑎∗√pov+𝑏执行OLS回归得到参数a和b,在使用时就按上式给出冲击预测值。临时冲击的特征集合和瞬时冲击一致,回归方法也完全一致。永久冲击特征集合是sidealgoTradePeriodTurnoverPeriodTickPeriodTwSpreadClosePriceDailySpreadPerioddailyPOV21,即区间市占比变成了当日市占比。回归方法类似。总冲击为三类冲击的线性求和。四、结论委托激进程度对瞬时冲击影响最大,一般的,被动单能够显著降低瞬时冲击,但其成交概率更低,容易导致进度落后及撤单率过高问题,使得算法被迫提高委托激进程度以追赶进度和降低撤单率,最终母单的瞬时冲击可能较大。算法执行过程需要综合市场流动性、波动性、实时执行进度以及状态确定最优委托价格。单笔委托量对临时冲击影响最大,一般的,显著小于对手盘一档量的委托不会产生临时冲击,但实际交易过程中因为风控约束,单笔委托不可能特别小,算法必须综合股票历史盘口信息、母单信息以及实时盘口状态,确定最优单笔委托量。母单市占比对永久冲击影响最大,实际交易中应尽可能避免市占比极高的订单(如大于10控制冲击成本是一个较为复杂的决策过程,包括事前的预估、执行过程的动态优化以及事后的分析等。市场冲击模型在制定交易计划以及IS算法中均有重要作用。五、风险提示基于历史结果计算,不代表未来收益。六、参考文献陈燕文.算法交易-投资交易的利器[R].2025年3月.上海证券交易所研究中心.上海股市的流动性和市场冲击成本分析[R].2006.刘道明.市场微观结构之一冲击成本模拟[R/OL].2012.冯亮.如何计算冲击成本[R/OL].2010.华创智能算法.绩效评估模块(TCA)[R].2023.王若昕马锋.日内收益可预测性:基于日内跳跃与动量[J].系统工程理论与实践202141(8):2004–2014.杨世超刘善存张强.投资者交易频率与市场质量[J].系统工程理论与实践202141(9):2271–2283.刘志东黄雨婷刘雯宇.基于跳跃滤波与动态参数估计的中国股市微观结构分析[J].系统工程理论与实践201737(6):1393–1419.O’HaraM.Highfrequencymarketmicrostructure[J].JournalofFinancialEconomics2015116(2):257–270.HasbrouckJ.Measuringtheinformationcontentofstocktrades[J].TheJournalofFinance199146(1):179–207.BouchaudJPBonartJDonierJetal.Tradesquotesandprices:Financialmarketsunderthemicroscope[M].Cambridge:CambridgeUniversityPress2018.EasleyDL´opezdePradoMMO’HaraM.Flowt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届山东省临清市中考联考英语试卷含答案
- 2026届浙江杭州余杭区重点中学中考语文考前最后一卷含解析
- 2026届安徽省合肥五十中学(新校和南校)中考语文全真模拟试卷含解析
- 2026届山东潍坊临朐达标名校中考英语全真模拟试卷含答案
- 防蝎子消防安全管理规定
- 2026年经济师经济基础知识模拟试题及答案
- 商砼运输车辆事故应急演练脚本
- 2026年校园纠纷人民调解员考试题库
- 安徽省宿州地区2026届中考一模语文试题含解析
- 2026届山东省莒北五校中考四模英语试题含答案
- 2025江苏张家港经开区国有资本投资运营集团有限公司招聘工作人员19人笔试参考题库附带答案详解
- 2026年2年级袋鼠竞赛试题答案
- 2024年石嘴山市卫生系统考试真题
- 2026届云南省普通高中学业水平选择性考试调研测试生物试题(解析版)
- 地理俄罗斯课件 -2025-2026学年人教版地理七年级下册
- 第十九章 二次根式 数学活动 纸张规格的奥秘 教学设计 -2025-2026学年人教版数学八年级下册
- 2025广东佛山市南海区大沥镇镇属公有企业管理人员招聘3人笔试历年参考题库附带答案详解
- 华宁县华电磷业有限责任公司大新寨磷矿矿山地质环境保护与土地复垦方案
- 全过程工程咨询服务方案
- XXXXX水库工程蓄水安全鉴定安全监测自检报告
- GB/T 21354-2008粉末产品振实密度测定通用方法
评论
0/150
提交评论