“量价淘金”选股因子系列研究:基于订单聚集现象的高频量价因子研究_第1页
“量价淘金”选股因子系列研究:基于订单聚集现象的高频量价因子研究_第2页
“量价淘金”选股因子系列研究:基于订单聚集现象的高频量价因子研究_第3页
“量价淘金”选股因子系列研究:基于订单聚集现象的高频量价因子研究_第4页
“量价淘金”选股因子系列研究:基于订单聚集现象的高频量价因子研究_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录一、言 4二、单集子建整体架 6因构的系路 6因高生的思路 7三、骤解订分类聚集别 9订分:在集 9聚识:时集 10定口法 10态口法 10四、骤解统量取&内合 13统量取关种量特征 13种度委征 13种度成征 14托成交比特征 15价关特征 164.1.517日聚:何为日因子 17五、单集子的现 19因的量产选 19订聚综因例 20指增组的现 21六、结 23风险示 24图表目录图表1:因簇究报告述 4图表2:订聚因建的系思路 7图表3:基逐委据的单类 10图表4:固窗法态窗法对示图 12图表5:固窗法态窗法集件发内分图 12图表6:各维的特征意图 14图表:..图表8:委托成交值特示图 16图表9:量相性示意图 17图表10:常聚与间聚示图 18图表11:订聚效因子回绩示例 19图表12:订聚综因子10组多对值 20图表13:订聚综因子年表现 20图表14:沪深300指增强合值 21图表15:中证500指增强合值 22图表16:中证1000指增强合值 22一、前言alpha在国盛金工“量价淘金”选股因子系列报告的“因子簇”研究中,我们提出了一套体系化的因子投研理念:即对于某一研究想法,在不修改因子构建参数、不做算子自由组合的前提下,遍历所有底层逻辑层面的可能性,多维度、多视角地刻画同一交易行为,再辅以因子生产技术层面的提升,系统性、批量、快速生产选股因子,最终通过有效性、相关性的检验和筛选,留下一些有效且相对低相关的因子,称之为这一研究想法对应的因子簇。图表1

ideaalpha报告标题因子构建方式报告主旨报告外发日期MemoryMap在因子生产加速因子簇为例分钟离散围绕羊群效应的idea,在分钟数据层面进行大批量离散化因子挖掘;通过MemoryMap数据存储结构+Torch算子优化,大幅提升分钟数据因子挖掘的效率2024年11月20日订单簿资金流因子簇的构建与生产加速——基于MemoryMap的分段读取性能优势分钟连续考察日内某段时间分钟资金流数据的特征,进行大规模因子挖掘;重点展示了MemoryMap分段读取数据的性能优势2025年02月11日“高频数据+离散化构建方式”在因子研究中的重要性逐笔离散方式的重要性2025年05月14日基于流动性冲击事件的逐笔羊群效应因子——“高频数据+离散化”理念的具体实践逐笔离散idea大批量离散化因子挖掘;进一步优化因子生产框架,大幅提升逐笔数据因子挖掘的效率2025年11月13日制基于流动性冲击事件的逐笔羊群效应因子)二、订单聚集因子构建的整体框架因子构建的体系化思路为了批量挖掘订单聚集因子,我们采取一种“四维流水线”式的因子生产架构。具体而言,因子构建围绕订单分类、聚集识别、统计量提取、日内聚合这四个关键步骤展开,通过这四个环节的交叉遍历,我们可以系统性地繁衍出众多的订单聚集因子。因子构建的具体流程如下:()10(如偏度、峰度0图表2:订单聚集因子构建的体系化思路制因子高效生产的优化思路(I/O(in2MemoryMa(AD9654处理器、24DDR5(1.2TB)4KSSD(I/OI/O)数据的网络读取频次,在配备MellanoxConnectX-3(CX3)56GbpsI/Oalpha三、步骤详解:订单分类&聚集识别订单分类:谁在聚集(其次订规与进的高提了捉对市微结具有重影响“关键资们上基分入规激进的方我们据委托量否过日类订的90%位出大订此定资金交易动向;一方,我们据对订激进度的,提取最激进的挂这类挂的特征是单价格、挂都大于前盘的买卖一,达交所后会速成交推动价跳跃类进单的集现往意着极的边势动(关订单激进度具定细可参考 于性冲事的笔群应因显而见“激只针挂,单此别。1515图表3:基于逐笔委托数据的订单分类制聚集识别:何时聚集固定窗口法09:3014:56时段内,以10秒为固定步长划分时间区间,分别汇总计算每个区间内的总委托量;1090%10股U动态窗口法为了克服固定窗口法“早晚盘居多”的统计偏差,我们设计了动态窗口法,其核心思想在于从“寻找全天绝对高位”转向了“以近期历史为基线、识别相对异常”。同样以“不区分买卖方向的全部挂单委托量”为例,动态窗口法通过一套双阈值状态机制进行运作:(55(单/秒。(0000𝜇𝜎(为20。(𝜇+(迟滞机制:当瞬时委托强度游走于上、下阈值之间时,系统保持前序状态不变。相比于固定窗口法,动态窗口法的核心优势在于其较强的自适应性。该方法本质上是一种微观结构层面的相对异常检测,通过环境基准的动态漂移,较好地规避了全局绝对阈值带来的“早晚盘居多”的日内时段偏差。同时,无论是高换手的热门股还是交易冷清的边缘股,该模型都能依托股票自身的动态环境特征实现自适应判定,捕获订单流相较于常态节奏的突然偏离,避免了对绝对数值与人工经验调参的依赖。图表4:固定窗口法和动态窗口法的对比示意图制2026A了实证检验,详见图表3030U图表5:固定窗口法和动态窗口法聚集事件触发日内分布图通联数据四、步骤详解:统计量提取&日内聚合统计量提取:关注何种量价特征(alpha73可(3种特征。73(集区;第三(。图表6展示了上述各细分逻辑的示意图,通过各种因素的交叉遍历,我们可以提取上千6图表6:各种维度的委托特征示意图制从逐笔成交数据中提取量价统计特征,逻辑与上一小节完全类似,此处不再展开详细论述,具体可参考图表7。与上一小节逐笔委托数据的不同之处在于,成交单类型中不再有激进程度的概念,我们用订单规模进行了替换,可分为超大单、大单、中单、小单。图表7:各种维度的成交特征示意图制委托前两小节分别站在逐笔委托、逐笔成交各自的视角,提取聚集区间内的统计特征,两者的分析框架相互独立。然而,委托是交易意图的表达,成交是交易意图的兑现,若将两者进行交叉比较,能够刻画订单从“挂出”到“成交”的转化效率。本小节尝试将两类数据进行交互,以成交端数据作为分子、以委托端数据作为分母,构建跨数据源的比值型统计量。具体构建思路如下:4.1.2划分的成交单,共5种选择。4.1.1程度细分的挂单,共7种选择。34((。图表8展示了上述构建思路的示意图,通过成交单类型、委托单类型、方向、统计特征这4个因素的互相搭配,我们一共可以计算420种不同的委托-成交交叉比值。图表8:委托-成交交叉比值特征示意图制量价相关性特征本小节内容考察变量之间的依赖结构,即当订单在短时间内高度聚集时,量、价、方向等逐笔指标之间是否呈现出显著的协同效应。具体地,我们通过计算某两个逐笔指标之间的相关系数,来衡量两者之间的依赖关系。+34得到12种逐笔量价指标。9图表9:量价相关性特征示意图制小结-当然,上述框架还存在很大的拓展空间,比如在“量价相关性”维度,若我们对挂单按照激进程度、对成交单按照大小单做进一步细分,又可衍生出至少上千种不同的构建方式;再比如在订单聚集区间内,我们还可以通过信息熵的方式、刻画量价指标的分布均匀程度,构建额外的统计量。关于这些衍生细节,本文不再做过多讨论,我们的主要目的在于展示上述体系化的思维与框架,各位读者可结合实际情况,在本文框架的基础上进行有效拓展。日内聚合:如何降频为日度因子经过上一节的“统计量提取”步骤,我们已经在每只股票的每个聚集区间内构造了丰富的微观结构特征指标。由于股票在全天交易中通常会多次触发订单聚集现象,而传统多因子模型往往以日频信号为输入源,因此我们需要对多个聚集区间的信息进行汇总,最终得到股票的日频因子值。本节内容就将详细讨论不同的“日内聚合”方式。10常规聚合:将当日所有观测值视为无序集合,不考虑其发生的先后顺序,共有5种方法:20%20%(头部)20%20%(尾部)时间聚合:引入聚集事件发生的时间维度信息,也可分为5种方法:图表10:常规聚合与时间聚合示意图制五、订单聚集因子簇的表现因子的批量生产与筛选结合前述第三节和第四节的内容,我们通过订单分类、聚集识别、统计量提取、日内聚合这四个步骤,批量构建订单聚集因子。通过进一步分时段筛选,留下有效且相关性较低的因子,得到“订单聚集因子簇”:2016/01/01-2018/12/31ICICIR因子;2019/01/01-2021/12/31IC、ICIR50(2022。2016/01/01-2026/04/30A50ICIR21110图表11:订单聚集效应因子簇回测绩效示例IC信息10分组多空对冲绩效指标因子名称月度IC均值年化ICIR月度RankIC均值年化RankICIR年化收益率年化波动率信息比率月度胜率最大回撤率因子10.0733.120.1013.793.21因子2-0.054-2.74-0.089-3.5432.543.04因子30.0642.650.0923.042.95因子40.0532.640.0823.4327.252.74因子50.0482.700.0653.002.54因子60.0522.650.0622.6825.342.46因子70.0502.640.0632.902.43因子80.0492.410.0763.2223.722.39因子90.0492.040.0722.582.37因子10-0.035-2.06-0.059-2.7224.402.36通联数据以图表11中的因子5为例,我们详细介绍该因子是如何构建的:101090%日的订单聚集强弱指标;2020。订单聚集综合因子示例以选取样本内(2016-2021年)信息比率最高的20个因子等权合成为例,展示订单聚集2016/01/01-2026/04/30AICIR3.42RankIC0.10611.03%84.55%11.14%。图表1213图表12:订单聚综合子10分组多对冲净值 通联数据图表13:订单聚集综合因子分年度表现年化收益率分组10对冲分组1绩效指标年份分组1分组10分组10对冲分组1年化波动信息比率月度胜率最大回撤20165.932017-33.444.262018-45.90-20.266.1520191.3320203.212021-11.045.302022-35.816.95100.002023-16.107.09100.002024-32.212.5720253.242026(截至4月底)5.4036.7831.646.305.0275.001.09通联数据指数增强组合的表现300、5001000沪深0%(0(3。300300指数的超额年化收益为7.39%,跟踪误差为3.59%,信息比率为2.06,日度胜率为58.06%8.28%。图表14:沪深300数增组合值 通联数据中证0%(0(03。500500指数的超额年化收益为11.20%,跟踪误差为3.81%,信息比率为2.94,日度胜率为58.83%5.83%。图表15:中证500指数增强组合净值通联数据中证000%(.%.%。20160101-0//07.8%100指数的超额年化收益为15.58%,跟踪误差为4.72%,信息比率为3.30,日度胜率为59.95%7.02%。图表16:中证1000指数增强组合净值通联数据六、总结针对“订单聚集”现象,本文提出了一套“四维流水线”式的因子生产架构,通过订单分类、聚集识别、统计量提取和日内聚合这四个关键步骤的交叉遍历,系统性地繁衍出众多的订单聚集因子。因子构建的具体流程如下:15105050个ICIR22016/01/01-2026/04/30内,AC008CR为34,RankIC0.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论