




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、宏观因子体系下的资产配置框架与观点更新我们构建了自上而下从宏观大类资产到细分板块的研究跟踪体系。包括跨市场的全球宏观因子体系,基风险平价策略的战略配置组合,基于普林格周期理论的策略的战术配置组合。对债券类资产构造了中债久期时策略;对股票类资产构建了A股上市公司业绩跟踪体系。、宏观因子跟踪:中国上行有所折返,美国欧洲中期回落不变经济增长类因子中,美国增长最新值为0.8,近四周小幅上行0.1,分项驱动信号主要来自汇率、权益场,短期震荡下行;欧洲增长最新值为0.5、近四周小幅上行0.2,驱动信号来自汇率、权益市场;结合制业PMI来,欧美增长中期回落趋势不变,体现的是库存周期下行的力量。中国增长反弹收敛,最新值为1.2,近四周下行0.,分项信号来自汇率、商品等市场,结合PMI来看,短期经济修复有所折返,中期仍是内生上行趋势。图表:美国增长因子短期震荡下行 图表:美国增长因子同比s美国IM制造业PI同比长 SPM()5.00 70
SM制造业PM同比4.004.00 653.00 602.00 1.00 0.0050-.00 45-.00 -.00 4030252015105002430252015105002468-5-0-5-010-2-46子同比增长美国62R=图表:欧洲增长因反弹回落 图表:欧洲增长因子同比s欧元区制造业PI同比长 PMI4.00 65
欧元区制造PM同比3.003.00 602.00 1.00 550.0050-.00 45-.00 -.00 40403020100024640302010002468-0-0-0因子同比欧洲增长7R=图表:中国增长因子近期回落 图表:中国增长因子同比s官方制造业PI同比中国增长 官方制造业PMI
官方制造业PM同比2.002.00 531.50 521.00 510.50 0.0050-.50 -.00 48-.50 47-.00 -.50 46-.00 452015105002468-5-0-5-0因子同中国增0R=wd wd金融条件类因子中,美国、欧洲、中国的金融条件指数最新值分别为.2、2.2和0.,近四周分别上升0、.1、0.3,总体来看,在海外加息预期小幅上升,国内资金利率短期上行的背景下,金融条件略有收紧。图表:金融条件因子:短期均平稳波动美国CI 中国CI 欧洲CI65432106543210 wd、战略配置组合:过去1年收益3,区间最大回撤0.1%选取对涵盖股票、债券、商品三大类的7种国内资产,构建基于资产和基于主成分宏观因子的月频调仓险平价策略,其中后者是宏观因子在资产配置中,仅基于风险进行配置的应用。选取的具体标的为:权益资产中的沪深300全收益、中证0全收益指数,债券资产中的中债国债总财富13年指数、中债国债总财富35年指数、中债国债总财富-0年指数及中债信用债总财富指数,商品期货中的金指数。每月末求解各资产的权重,使得各资产对组合的风险贡献相等,具体参见《理论与应用指南:风险平价解》一文。从策略的表现来看,自010年3月以来,风险平价策略取得了88%的年化收益率,年化波动率1.%,最大回撤.7,夏普比率2.1,月度胜率7,双边年化换手率8.6%。策略最近2个月收益率3.3,最大回撤-0.31。表:基于资产的风险平价策略——权重序列及策略净值100%90%80%70%60%30%20%10%0%
沪深300 中证1000 中债国债总财富13年 中债国债总财年 沪金 策略净右)
1.71.61.21.110.9wd图表:基于资产的风险平价策略表现年化收益%)年化波动%)夏普比率最大回撤%)绝对胜率%)双边年换手率3.8801.7802.179-2.37373.88538.6%wd3年5月,策略在沪深30、中证0上的权重分别为.5和1.21%,在债券资产中选择中债国债总财富3年35年、-0年指数和中债信用债总财富指数上的权重分别为.%、.8、12.8和3.9,在沪金上的配置比例为.8。、普林格周期配置模型跟踪普林格周期脱胎于美林时钟模型,在美林时钟模型增长通胀的基础上加入信贷指标来更好的适应货币主义时代。在普林格周期中,使用先行指标(M、M2同比,同步指标(P同比、工业增加值同比,滞后指标(PPI同比)三个指标来衡量经济周期,将经济周期划分为六个阶段,并计算了在上述各个阶段中各类资产的回报率和股票不同风格回报率,结果表明,在经济周期各个阶段的轮换中,不论是大类资产还是股票风格其收益率均有所分化,优势品种有超越大市的表现,具体周期划分以及表现如下图。图表:普林格周期划分规律wd在经济周期第一阶段,央行仍实行宽松的货币政策,继续增加货币供应量,推行各种财政政策刺激经济从资产配置的角度看,此时一般短期利率会上行,同时债市经历熊市之后也将迎来拐点,因此债券与现金成这一时刻的优质资产。但是在这一阶段,生产与通胀仍处于下降区间,高波动资产依然有相当高的风险,不议配置。在经济周期第二阶段,通货膨胀继续回落,P增长率开始上升,虽然闲置的生产力还没有完全的利用来,但企业的利润率已企稳开始回升,同时央行为了使经济全面恢复会持续增加货币供给。从资产配置的角度看,这时权益市场筑底完成,是配置的最佳时期,建议高配。在经济周期第三阶段,三指标同步上行,经济全面恢复,企业利润率高速上行。从资产配置角度看,此各行各业生产力火力全开,对原材料需求较高,商品迎来行情,此使股票受益于企业基本面快速抬升以及经上行的预期会获得普涨,此阶段建议高配股票和商品。在经济周期第四阶段,生产增长开始减缓,通货膨胀上升。GP增长虽然在上升,但增速已明显放缓,抑制过热的投资,央行开始加息减少货币供应量。从资产配置角度看,由于股票投资收益依赖企业的利润率和利率水平,商品是最佳的资产配置选择,同时股票也有一定的配置价值,但是需要重点关注盈利支撑。在经济周期第五阶段,P增长降低到长期增长趋势以下,但是通货膨胀依然继续上升,经济进入滞胀段。从资产配置角度看,权益市场已经疲态初现,不建议配置,而商品处于最后的疯狂,可以配置但是有一定的风险,此时黄金成为最优资产。在经济周期第六阶段,三指标同步下行,经济增长严重乏力,从而导致了通货膨胀开始下降,企业利润也遭遇滑铁卢。从资产配置角度看,此时建议配置避险属性明显的黄金与债券,其中债券以现金更优。改进版普林格周期配置建议跟踪根据我们的改进版普林格周期,普林格六周期信号更新:阶段,预计持续到6月前后。当前市场流动性有所改善,先行指标预计上行。2年2月以来,疫情快速过峰,全国各行各业开始复苏,春节期间第三产业相关行业迎来报复性反弹,预计同步指标触底回升,正式进入上升区间。当前物价开始回落,滞后指标下行。建议配置股票。根据我们改进的普林格周期理论构建的策略,过去7年年化收益2.3,夏普比率.,最大回撤-6.38%,分年来看,过去7年策略均获得正收益。图表:改进版普林格周期战术资产轮动策略理论净值 4.00 3.50 3.00 2.50 2.00 1.50 0.00201-01 201-01 201-01 201-01 202-01 202-01 202-01 202-01wd图表:改进版普林格周期战术资产轮动策略分年表现收益率波动率最大回撤31.56%15.49%-3.91%11.94%11.88%-5.84%0.99%6.05%-5.87%39.85%16.04%-1.49%45.71%16.74%-5.54%9.29%11.01%-4.67%19.64%9.79%-1.96%-421.33%12.88%-6.38%wd、中债久期择时策略中债久期择时策略为季度调仓,每季度末选择未来一年预期收益率最高的期限品种进行集中持仓,当策一段时间表现不佳时选择将持仓信号改为动量信号,即选择过去一段时间表现较好的品种进行集种持仓。图表:中债久期择时策略历史净值表现中债国债总指数 中债久期择时1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 214//1214214//1214//1215//1215//1215/1/1216//1216//1217//1217//1217/2/1218//1218/0/1219//1219//1220//1220//1220/1/1221//1221//1222//1222//1222/2/1223//1wd2年1月0日开始样本外跟踪,截至2023年4月底,中债久期择时策略累计绝对收益1.03。我们基于2023年3月底模型信号对2023年二季度持仓进行决策,中债久期择时策略选择货币型市场基金(银华日利)进行持仓。图表:222年以来中债久期择时策略持仓明细时间持仓202年一季度中债-70年国开行债券202年二季度中债-70年国开行债券202年三季度中债-70年国开行债券202年四季度中债-70年国开行债券203年一季度银华日利EF203年二季度银华日利EFwd、上市公司业绩跟踪体系根据A股上市公司业绩跟踪体系,沪深0,创业板指超预期值低于同期均值,中证0超预期值高于同期均值,但正向超预期来自少数个股的集中贡献,指数整体超预期情况并不稳定。从一季报来看,三大指数超预期程度并不乐观,尤其主板一季报低于预期说明中美经济分化下海外经济对主板影响也比我们此前预期高,不过考虑到四月份中国P等指标迎来利好,上市公司业绩有望在二季度持续回升。一季报情况显示当前基本面尚不支持全面牛市的到来,建议精选受益于中国经济内生增长的超预期个股。通过回测,最近5年(2018年2022年)我们的A股指数择时模型沪深0择时准确度为75%,中证500择时准确度为0,创业板指择时准确度为4%。图表:沪深30指数择时回测结果wd二、量化视角下的行业比较与展望我们根据自上而下的宏观财务指标行业量化基本面分析师预期机构持仓量价等多维信息构建六维度综合行业配置体系。、宏观因子跟踪体系我们的宏观因子跟踪体系综合选择了多维度的宏观因子,包括:反映房地产开发进度的房地产开发投资累计同比,反映工业企业利润的PI和工业增加值,反映国内物价情况的PI和生猪均价,反映美国物价指数的B指数反映国内经济增长情况的名义GDP和实际GDP反映国内货币发行情况的M1,2和社融增速反映国内债券市场流动性的10年期国债收益率,信用利差,期限利差,反映美国债券市场流动性的10年期美收益率,反映A股市场估值水平的EP(除金融市盈率倒数,DP(上证红利指数股息率,反映A股市场活跃度的上证指数波动率。我们模型构建的方法采用逐步回归法,对每个中信一级行业(除综合金融)构建对应模型,按照预测值前3行业组合,2018年1月到3年4月相对行业等权累计超额190.5%,年化超额22.13。图表1:近五年组合超额收益资料来源:,、行业基本面跟踪体系行业的一个基本面信息来自中观的量化基本面。我们通过构造量化基本面指标,对单个行业进行择时,体方法为:通过阅读行业研究深度报告,厘清行业逻辑和重要指标,构建待选指标池,测试其中的指标和的相关性,选取和E相关性高的指标计算和行业相对万得全A指数超额收益的相关性;最后选择和E、行业超额收益都高相关的指标构造单行业择时策略。此前已经完成了包括煤炭、钢铁、有色金属、农林牧渔、建材、化工、家电等行业的中观择时研究,其应的择时指标概览如下表,各行业的多空年化收益率均高于2。图表:六个价格型周期行业的基本面指标择时指标一级行业子行业指标类型逻辑择时起点煤炭-下游需求、产品价格2010.9钢铁-下游需求、企业盈利2008.8有色金属-下游需求2010.9农林牧渔-产量、产品价格2010.11建材水泥制造产品价差或价格2009.3玻璃制造产品价差或价格2010.5化工石油化工产品价差或价格2014.5聚氨酯产品价差或价格2014.4家电-预估净利润同比符号2007.2,、财务指标跟踪体系财务因子对应行业基本面信息的实际值。根据最新可得的实际财务数据,我们梳理了涵盖偿债能力、成长能力、收益质量、现金流量、盈利能力营运能力、资本结构等七个维度,总计9个财务指标。由于多数财务指标的逻辑对金融地产相关行业适用性较低,针对中信一级行业构建财务因子(包括下文分析师预期指标)时,不包含银行、非银行金融、房地产、综合金融四个行业。考虑权益市场边际定价的特征,并且财务指标都是比率值或增长率类数值,其一阶差分和二阶差分计方便且可以横向比较。因此对每个财务指标,在使用指标原始数值作为因子的基础上,我们进一步计算其环增量因子、二阶差分因子。总体来看,对财务指标因子的测试表明,就行业之间的横向比较和优选而言,较为有效的财务指标类别括盈利能力和成长能力类的环比增量因子,以及成长能力类的原始因子;即盈利和成长能力相关指标及其边变化对行业的选择有重要参考意义。图表:各类型财务因子表现(符号分组的行业组合表现及数值五分组单调性、C中位数)中位数正向组合年化超收益()符号分组多空年收益()符号分组多空普比率分5组单性因子C中位数原始因子偿债能力1.04.40.670.55.9%成长能力2.95.40.510.06.3%收益质量-2.8-1.5-0.94-0.0-1.2%现金流量0.30.10.010.01.8%盈利能力-0.2-1.2-0.780.04.8%营运能力0.2-0.9-0.19-0.5-4.0%资本结构-2.4-4.9-0.76-0.5-0.9%环比增量因子偿债能力0.3-0.5-0.74-0.0-0.2%成长能力2.13.00.880.06.6%收益质量0.4-0.3-0.34-0.0-0.9%现金流量-0.7-1.7-0.690.01.7%盈利能力4.88.60.670.07.8%营运能力0.00.30.350.01.7%资本结构0.70.80.66-0.06.3%二阶差分因子偿债能力-0.3-2.8-0.64-0.50.6%成长能力0.7-0.5-0.760.00.9%收益质量-1.7-3.1-0.13-0.0-0.4%现金流量-0.1-2.0-0.60-0.0-0.5%盈利能力1.92.60.440.02.6%营运能力-0.00.90.800.00.4%资本结构0.90.80.02-0.01.1%,复合财务因子上述财务单因子中,对同一指标类型、同一构建方式下的不同因子,存在相关系数较高的情况下,保留中夏普比率较高的多头组合,及夏普比率、胜率综合较高的第1或5组组合。根据表中的组合构建符合因子的方式为:对符号多头组合,各组合的持仓行业赋予权重,非持仓行业值,对分组组合,各组合的持仓行业赋予权重0.5,非持仓行业赋值0,从而得到单期各行业的复合财务因子。根据复合财务因子对行业从高到低分5组测试,当出现单期排名相同的情况时,向前追溯往期得分,直可以完全区分各因行业的排序为止,将最终的排名作为分组依据。从下图来看,复合财务因子整体呈较好的单调性,7年8月以来,第一组组合年化超额收益率最高,为6夏普比率达6,最大回撤相对更小;第五组表现最差,严格的单调性在第三四组之间被打破,二者的表现在历史大部分时间中非常接近。图表:复合财务因子分组表现年化收益()年化波动()夏普率最大回撤()调仓胜率()超额收益()第1组 9.230420.26-647459097.6第2组 6.830320.04-690756823.8第3组 1.328770.43-69064545-1.7第4组 2.530680.90-670145450.4第5组 -5.22943-0.74-7201301-7.8行业等权 2.728700.97-6755Wnd,中信建投、分析师预期跟踪体系我们分别计算单季度ROE数值、单季度E环比增量、TM数值、-TM环比增值四种类型的实际行业E因子,并使用不同的报告期作为数据计算节点:历史报告期(与实际财务数据完全可得的最新报告期、未来_报告期1(历史报告期0的下一报告期、未来_自然季/(计算时点所属季度对应的报告期或以此向后顺延2个报告期。其中,历史报告期0为实际类因子,其余四种报告期的计算均使用了未来信息。我们对未来的E,计算行业预期E的上调比例环比变化因子,选择取值前4的行业构造多头策略,各因子的多头组合表现如下表。预期调整类的E因子的表现明显好于行业预期ROE数值因子,其中各有一个因子的年超额收益率超过,夏普比率接近.。图表2:自然季2的预期E调整因子行业多头组合表现预期E因子年化收益()年化波动()夏普比率最大回撤()调仓胜率()超额收益()预期ROE_上调比例7.729520.43-677257954.3预期ROE_上调比例8.029720.89-652761935.0预期ROE_环比变化8.929960.97-687258525.2预期ROE_环比变化7.728930.72-674856824.9朝阳永续、,、基金经理跟踪体系在行业轮动的探索上,我们认为公募股票型基金的基金经理对板块仓位的看法体现着市场关注的焦点,如果能够构造指标反应基金经理对板块轮动的方向把握并跟踪,就可以跟随市场上最优秀的基金经理进行行业动从而获取超额收益。而公募基金的全持仓披露存在两个问题:一是存在滞后性,公募基金半年报及年报披露期相较于披露时点有两个月以上的延迟,二是频率过低仅有6月和2月披露,这导致很难使用现有数据构造模型。因此我们基于基金仓位估算结果构造行业轮动模型,在基金仓位估算部分,基金池选择并入二级分类个月以上的普通股票型基金和偏股混合型基金。由于中信一级行业分类共有0个,短期内会出现同涨同跌情况,使用回归时共线性问题会导致对行业仓位的估算出现较大误差,所以我们将30个中信一级行业分类人为降维至0个板块进行分析。图表2:中信行业分类的板块划分II我们使用估算板块仓位构造动量策略,使用过去半年至过去一个月板块变动最大的板块构造持有一个月多头,为了防止通道效应,策略分为4通道。策略相对十个板块平均持有,从2011年至今年化超额收益率7.84%,多空收益年化14.55。今年以来多头相对板块基准超额收益1.5,多空收益5.23。图表2:板块轮动策略多空收益(截至223年4月0日):w三、中美分化情景的量化基本面分解本节主要容是我们各体系之外,是康波视角下中美独立经济分化下的大胆推演和模型补充。、从中美I分化,自上而下看A股行业趋势变化2020年9月中国房地产“三条红线政策”拉开了中美PI彻底分化的序幕,2023年中国官方制造业P正在刷新10年新高美国PI则持续下行至2008年次贷危机以来最低水(除2020年4月新冠事件两者正呈现A股33年历史上最大分化,经济分化仍将继续拉大。图表2:中美PMI:w我们选取各中信一级行业较大市值的1/2个股作为行业大市值代表并计算2018年3月中美贸易战以来行业大市值月度收益与中美PMI的相关性,结果发现:大市值中,交运,传媒,农牧,医药,商贸,家电,建材机械,汽车电子计算机轻工通信,非银金融,食品饮料与中国PI正相关基础化工汽车石油石化,钢铁与美国PI正相关,通信与美国PI负相关。其中2018年3月中美贸易战以来,通信是唯一行业表现与中国PI正相关,与美国PI负相关。这一现象也一定程度解释了今年以来三大运营商较为优异的表现。图表2:各行业大市值与中美PMI关系:w我们选取中信一级行业绝对收益作为各行业代表计算2020年9月以来与中美PI相关性,结果表明:钢铁建材商贸零售家电纺织服装食品饮料银行非银行金融房地产交通运输与中国PI正相关石油石化,煤炭,有色,电力,钢铁,基础化工,电力设备及新能源,电子与美国PI正相关。从中信一级各行业指数月度表现分析2020年9月以来以家电地产为主的地产链以及以食品饮料为主的消费板块继续维持了与中国PI的正相关关系但以煤炭有色为代表的上游周期行业则呈现与美国PI的正相关。需正确面对本轮中国经济复苏的行业受益特征与历史的显著变化。图表2:中信一级行业与中美PMI相关性:w、季报业绩整体低于预期导致指数4月中期调整在4月12日外发的报告《A股重大变局,中美PI大分化后的行业配置浅思》中,我们采用超预期因子作为衡量当期宽基指数表现的指标,以是否超过超预期因子季节性阈值为目标来确定宽基指数整体表现是否超预期截止4月10日2023年一季报预告及公告信息沪深300中证500创板指和创业板综的业绩披露及各自阈值对比结果显示主板超预期而中小市值板块低于预期具体表现为沪深300板块超预期中证500业板均低于预期。主板的业绩情况较为乐观,值得重点推荐,中小市值板块一季报业绩初现不及预期的趋势需重点跟踪关注。而后4月21日的超预期结果主板最终低于预期出乎我们预料中证500超预期值高于同期均值但正向超预期来自少数个股的大幅超预期,指数整体超预期情况并不稳定,创业板综和创业板指依然处于低于预期态。图表2:宽基指数超预期情况:4月2日s4月21日:w整个4月份沪深300当月绝对收益0.54%中证500当月绝对收益1.55%创业板指当月绝对收益3.12%,创业板综当月绝对收益2.60%4月份随着一季报发布期的密集到来之前表现低迷的主板相对表现优异之前表现亮眼的中小市值板块受业绩压力表现有所回调。图表2:223年4月众指数表现:w、季报业绩兑现分化逻辑:金融板块亮眼,传媒等部分子板块独立崛起图表22231风格板块业绩弹性对比风格 2022Q4 2023Q1 业绩增速变化周期二-13.1%1.47%14.78%-1.8%9.41%11.23%成长-7.5%-2.1%5.41%消费二11.24%11.21%-0.0%稳定-29.2%-30.5%-0.5%新能源车48.15%46.99%-1.1%制造19.96%9.77%-10.9%消费一-0.7%-14.2%-13.9%周期一-4.3%-19.6%-15.2%全市场-0.7%4.30%5.08%资料来源:W,我们将A股市场个股按照内在相关性划分为10个风格板块,在业绩增速计算上采用剔除亏损样本后的体法进行评估在20231中业绩增速环比正增长的风格板块包括周期二金融和成长其中周期二和金融板块业绩增速环比增长在10以上。周期二板块包括建筑,建材,轻工制造三个行业。金融板块包括地产,非银金融,地产三个行业。成长板块包括传媒,电子,计算机,通信四个行业图表2223中信一级行业行业弹性对比W在中信一级行业中在业绩增速计算上继续采用剔除亏损样本后的整体法进行评估20231业绩增速环正增长的前五行业为非银行金融,房地产,电力及公用事业,电力设备及新能源,传媒,以上行业业绩增速环比增长均在20以上。其中还应注意部分风格子版块的独立崛起现象,比如传媒在今年行情表现突出的TT板块中业绩增速比表现尤其领先,电力及公用事业在交通运输板块业绩增速环比表现突出,建筑在周期二板块中业绩增速环比表现具备优势。四、选股策略一一机构博弈下的技术破局在市场alpha难度大幅提升的背景下下,我们仍根据机构博弈市场的潜在规律挖掘到了继续高度有效的股策略,并大胆尝试新I技术的投资应用。、沪深00量化精选组合的多因子组合基于常见的大类因子以及分析师因子构建,通过有效性检验精选有效因子,并结合的六维度行业轮动ETF组合结果,从实现对好行业+好个股的优中选优。沪深0内量化精选组合从6年2月至今,年化收益5.88,相对沪深0年化超额收益0.79,最大回撤2.19%,信息比5%。今年以来(截止4月0日,策略绝对收益.55,相对超额34%。图表3:沪深30内量化精选组合(截止223年4月8日):W、摩根持仓等选股策略表现跟踪摩根持仓策略基于北向机构托管持仓因子的检验,筛选出具有显著alpha收益的机构,定期追踪其持仓以及增持股票构建的复合策略。表3:摩根持仓策略表现:W光伏增强策略在光伏行业中,对0大类30多个因子进行检验,筛选出表现较好的风格中最突出的因子,构建光伏业多因子组合,策略具有显著的收益。图表3:光伏增强策略表现:W基本面NFE策略基于opnE基本面因子挖掘,将三大报表的数据以及基础算子之间按照一定的结构进行排列组合,构建出0万个不同风格类型的因子,再利用opnE的两步筛选法,筛选出不同风格类型下表现最好的合成因子。利用构造的合成因子以及基础因子,训练月频的选股模型,策略收益较为显著。图表3:基本面PENFE策略表现:W图表3:策略表现统计近一收益近一收益今年来收率近一收益近一相对益率近一相对益率今年来相收益率近一相对益率摩根持仓0.6%-0.8%8.9%23.5%0.8%0.1%2.4%11.9%光伏增强-1.5%-1285%-4.8%11.7%-0.7%-5.8%4.3%10.4%基本面OPENFE2.2%-2.0%6.8%38.5%2.4%-1.1%1.8%26.8%:W、laeo:基于oL-eo的高频数据低频化因子挖掘框架简介在量化研究中,因子构建是模型的基石,因子的好坏直接决定了策略的收益率,因此因子挖掘历来是量研究的重点。传统的经验为主的因子挖掘方式经历几十年的发展,早已进入了瓶颈期,因子拥挤度不断增加在经历市场风格切换时非常容易发生踩踏,导致大幅回撤。对于人工智能在因子挖掘中的应用,目前主要还是停留在遗传规模的方法基础上。近几年机器学习发展速,以AuoML为代表的特征工程以及模型搭建也早以在工业界实现了广泛应用。本文我们尝试将oogleBain团队提出的uoMLeo模型应用与因子挖掘领域,结合实际情况对模型做了相应的修改,构建了Alphao框架。Alphao主要是对因子的可解释性,因子挖掘的效率,以及因子的多样性上做了相应的优化,最终的框架不仅能够应用于批量因子的生成,也能够应用于现有因子的改进。ro传统的因子挖掘以人工构建和以遗传规划为代表的机器挖掘为主,我们在之前的报告中也曾尝试过将遗规划与分析师因子结合进行因子挖掘。uoMLo为因子挖掘提供了新的思路,本文我们在AuoMLo的基础上,构建了Alphao的因子挖掘框架。与所有进化算法面临的问题一样,Alphao同样面临适应度,进化效率以及物种多样性三者之间的不可能三角问题,即不能够同时满足种群适应度较高,进化效率快,以及种群具有较好的多样性的条件。在实际题中,需要做相应的取舍。在Alphao中,对于三者我们分别采取了一定的优化,从而能够在较高的效率下实现因子的挖掘。与传统的遗传规划以及AutoML-ero相比,Alhaeo在挖掘的效率以及因子的可解释性上做了更多的优化,首先,我们对所有数据采用了量纲化处理,避免了在因子挖掘中经常出现的不同量纲之间的因子运算,且我们要求最终生成的因子为无量纲因子,这样使得因子可解释性问题有所缓解。其次,对于合成因子的长我们也进行了限制,避免了因子计算过于复杂,容易导致的过拟合问题。与AutoL-eo不同的是,由于计算效率的差距,以及金融数据的实际问题,我们并没有简单的四则运算作为基础算子,而是在此基础上,加入了更多因子构建时常用的算子。在搜索空间上,不同于AutoM-Zro无关联搜索,我们限制了所有的变异均需要与原有的代码有关联,即所有在图结构上的改动均与原有的边或者节点相关联。通过这两项改动,能够极大的提高进化的效率。算子及因子与AuoMLo类似,我们将基础数据分为三类;标量:常数2,,1,0,(仅用于分钟数据)向量:中证全指日频涨跌幅,振幅,换手率,上涨股票占比矩阵:股票日频最高价,最低价,开盘价,收盘价,成交量;分钟频率最高价,最低价,开盘价,收价,成交量为了使得合成的因子具有一定的可解释性,每类数据都标有相应的量纲(高开低收量纲为元,成交量量为手,其他无量纲,在后续计算中,只有特定的量纲之间能够进行合法运算。所有算子分为三类,分别是元素运算符,时间序列运算符以及横截面运算符。在算子的构建上,尽量选基础算子,通过个体在搜索空间内的不断进化,构建出最终适应度较高的种群。图表3算子集合算子 解释 量纲元元素运算符add1,2) 1+2 输入相同量纲,输出不改变量纲(,1-输入相同量纲,输出不改变量纲protecteddi(,)1/v输出不改变量纲igoid(1/(1pow(e,-))输出无量纲时间序列运算符ts_ean(,过去v期m的平均值输出不改变量纲ts_std(,过去v期m的标准差输出不改变量纲ts_se(,过去v期m的偏度输出无量纲ts_urt(,过去v期m的峰度输出无量纲ts_ax(,过去v期m的最大值输出不改变量纲ts_in(,过去v期m的最小值输出不改变量纲ts_corr(,,过去v期1与2的相关性输入相同量纲,输出不改变量纲ts_dif(,过去v期m的变化输出不改变量纲ts_delay(,过去v期m的值输出不改变量纲idx_in(,过去v期m的最小值的序号输出无量纲idx_ax(,过去v期m的最大值的序号输出无量纲横截面运算符interal(,op,1,2) op([v1横截面运算符cs_nor() m的横截面标准化 输出无量纲资料来源:在矩阵数据中,存在不同频率的数据,需要首先通过时间序列算子将分钟频率的数据降频的日频,然后一步进行运算。因子挖掘结果对于种群而言,我们更关注整个种群的统计值,下图展示了进化轮数与种群个体的平均IC以及最大个体IC的关系,可以看出,随着轮数增大,种群的平均IC会不断增加,而IC最大的个体变异导致的IC增加存在一定的几率发生,因此会出现几轮不变的情况。种群的平均IC会出现定期下滑的情况正式由于我们的灾难算法删除了部分相似个体导致的结果但是快种群的IC会得到恢复。图表3种群进化数据来源:从整体种群的表现来看,Alphao能够有效的批量生成因子,对于个体而言,样本内适应度最高的个体IC达到了0.0。因子在样本外的表现同样突出,以以下因子为例:pha1因子一的定义为: tnorm(cnorH因子一的定义较为简单,为改进后的反转因子,代表了股票最高价的横截面排序的0日时间序列标准化,排序相对于过去0天的排名越低,未来收益越高。因子的IC均值为0.036,IR为4.3。因子胜率为61.22(小于0占比。从IC的时间序列来看,因子在大部分时间均处于负向IC区间,在4月份有过明显的反转。从因子的分组收益率可以看出,多头组自9年起,累计收益118,空头组的累计收益为16,多空年化收益26.17,多头组的年化收益为23.77%。pha2因子二的定义为:tsx(ts_inral(olum,,9:30,1000)ME,2)t_orrhigh,olum,240),5)因子二是开盘后半小时成交量占比的两日最小值与日内的最高价与成交量的相关性求和之后取五日最大得到的因子,很明显,此因子是由原始开盘后半小时成交量占比因子与最高价成交量相关性两个因子的基因化得到的合成因子。因子二的IC均值为0.0367,IR为7.33,因子胜率为68.21%,因子二的稳定性和胜率显著高于因子一。从因子的分组收益率可以看出,多头组自9年起,累计收益103,空头组的累计收益为7,多空年化收益22.51,多头组的年化收益为21.39%。、基于oE的基本面因子挖掘框架简介深度学习,启发式算法以及枚举法分别代表了三种因子挖掘中的方法,深度学习法的优点在于效率较好样本内效果最好,缺点是生成的因子无法解释且要求算子可导。启发式算法效率介于枚举法和深度学习之间能够生成批量因子,因子解释性一般,无法保证找到全局最优。枚举法是一种暴力算法,一般生成的因子形都较为简单,可解释性较好,生成因子数量较多,导致逐一检验时效率较低,因此需要对因子检验的效率进优化。opeFE是一种基于枚举法的Expad-ndReue框架,能够高效的检验大量因子(>106图表3因子挖掘方法深度学习启发式枚举法代表算法B,AaoAa360,E单次生因子量100101103104适合场景中高频子中频中低频因子复度10阶10阶5阶可解释性最差一般最好样本内果最好较好较好算子要求严格(导)无无效率最快较快最慢资料来源:证券E不同于Alphao用于量价因子挖掘,opnE生成的因子结构较为简单,可解释性较好,因此非常适合用于基本面因子挖掘。本文采用三大报表中的数据作为基础特征,在此基础上构建合成因子,通过opnE进一步筛选,保留表现较好的因子作为新的合成因子。pnE是一个基于枚举法的EpandAndduce框架,首先通过基础特征以及算子的排列组合构建具有一定结构的风格因子。而后通过两步的筛选步骤,对因子进行筛选,保留最终特征重要性最高的因子。因子Expnd基础特征采用三大报表中的数据(资产负债表,损益表,现金流量表,其中资产负债表为时点数据,益表和现金流量表为时期数据,我们将损益表和现金流量表中的数据均转为季频数据。三大报表中的字段共计有100多,大部分字段缺失值较多,对于缺失值大于10的字段,予以剔除。利剩下的所有字段训练一个GBM模型,保留每张报表内重要性排名前5的因子。在这些因子的基础上,再加入市值,行业,动量(过去一个月收益率)三个对股票收益解释度非常高的因子。共计5个基础特征以及3个额外添加的特征。为使得因子具有较好的可解释性,采用一些较为简单的算子,包括四则运算(,-,,/、同比算子(、环比算子(QOQ、以及横截面排序算子(SRank如果采用暴力方式进行排列组合,即使是简单的二阶因子,以上因子以及算子能够组合出109个因子难以进行处理。不同类型的风格因子往往具有一定的结构特征,例如常见的PE,P,PS等估值因子均为简单的一阶因子,子端净利润净资产主营业务收入来自三大报表,分母端为总市值。在构造估值类合成因子时,我们将其扩展为二阶因子,具体做法为分子端的单因子改为a±b的形式,其中a,b∈损益表/现金流量表资产负债表,分母端为总市值,当a=b,且算子为时,此二阶因子等价于PE。同理,借鉴资产负债率,OE,净利润现金比率,PE,净利润同比增长率等因子结构,本文构建了杠杆子,收益因子,质量因子,估值因子,成长因子共5类风格因子,因子结构如下表所示。因子均为二阶因子(不考虑Rank,总因子数量70万左右。图表3风格因子结构风格因子结构说明杠杆因子CSAK(a±±)a,b,,资产债表收益因子CSAK(a±±)a,b∈损益表,∈资产债表质量因子CSAK(a±±)a,b∈损益表,∈现金量表估值因子CSAK(a±maa)a,b∈损益/现流量/资产债表成长因子CSAK(xa±)a,b∈损益/现流量/资产债表,f∈QQ,y∈[,5]资料来源:证券因子Rdue原始的0万因子逐一检验效率较低,opnE采用两步的筛选方法,极大的提高了筛选效率。在第一步筛选中,采用了uccesiehaling(连续二分法)进行单因子检验。具体做法是首先采用部分小样本,对每一类风格的所有因子进行单因子模型GBM的训练,计算特征的模型表现。下一轮增加样本数量,保留第一次训练中表现较好的部分因子,再此进行训练,以此类推,不断增加样本数量,减少因子数量,直至用全样本训练得到最终筛选的因子列表。IeiIei012…nees111…12na 12n 12-1 12-2 … 1资料来源:证券经过第一轮的单因子筛选后,保留约16的因子,此时因子数量依旧较多(103),为了进一步筛选因子,且剔除因子间的相关性问题,第二轮用所有保留的合成因子以及原始的48个基础特征进行多因子模型BM的训练,最终利用GBM输出所有因子的重要性排序。BM在计算特征重要性时有两种方式,分别为ain和plit,其中ain是通过计算总的gini增益来得到特征重要性,plit是计算模型中特征出现的次数来计算得到特征重要性,本文采用ain来计算特征重要性。在利用BM进行训练时,opnE采用tuebooing的方法计算因子的边际贡献,即首先利用基础特征计算模型的预测值y1以及效果tric1,将y1作为新的训练的初始值,用新因子训练得到y2和tric2,新子的边际贡献为tric2etric1。因子回测利用OPENFE的方法挖掘出10个基础因子以及50个合成因子,构建选股模型。具体做法是从2020年1月31日至2022年12月31日,每月滚动训练LGBM模型,模型的输入为过去10年的月频因子,预测目标为未来一个月收益率。训练集长度为9年,测试集为1年,按照时间先后进行切分。股票池为全A股票,剔除其中次新股,ST股,涨跌停股票以及流动性过低的股票(日成交金额<500万或者换手率<0.02%。每次调仓等权买入得分最高的400只股票。最终策略的表现如下图所示:图表4策略回测1.210.80.6
21.81.61.41.20.40.20-0.2
10.80.60.2
超额最大回撤 总回报 WID全A 最大回撤 ala(右轴)WIND,证券策略的表现较为稳定,过去不到3年的时间累计收益达到91.%,,累计超额收益达到79.4%。策略的具表现如下表所示:图表4策略收益统计年化收益249%年化波动率0.2超额收益210%最大回撤205%超额最大回撤167%SHRP1.9资料来源:WIND,证券、如何部署本地版大语言模型提高研究效率简介基于网页交互模式的tPT对于人类的生活以及工作方式带来的极大的便利,然而这只是tGPT的冰山一角。API以及插件系统的开放,使得tPT能够结合各种程序以及软件,让tGPT的应用空间充满无尽的可能性,这是真正意义上I的iphone时刻。对于金融工程研究而言,除了日常的网页版交互完成一定的指令之外,通过API接口能够使研究工作效极大提高。同时,随着各类技术的应用,本地化部署开源大语言模型框架也得以实现。本地部署icunaENAI虽然提供了强大的API支持,能够极大的拓展ChtGPT以及其他模型的应用领域,但是大部分模型均未开源,而且在使用时存在诸多限制。除了ENAI的tGPT之外,各大互联网企业也纷纷推出了自己的大预言模型,例如百度的文心一言,阿里的通义千问,商汤的商量等,与ENAI的战略一致,这些模型也均未开源。除此之外,a开源了LaMA模型,清华开源了LM模型,使得一般企业和个人能够部署和训练自己的“tGP但是大语言模型对于硬件要求极高,限制了个人用户部署自己的“tPT,随着一系列优化技术的提出,例如eO、eini、oRA、Auounk等,使得训练和部署模型的成本极大下降。各个优化模型也纷纷提出,包括oalI,Alpaa,cuna等,能够以较低的成本训练或者部署对话模型。使得在个人电脑上部署成为可能。本文以icuna模型为例,介绍如何在个人电脑上部署模型。una模型是基于LaMA的微调模型,是由加州大学伯克利分校、MU、斯坦福大学和加州大学圣地亚哥分校的成员共同提出的。他们从haePT收集了大约7万个对话,借鉴Alpaa的微调方式,将LaMA模型进行微调。最终实现了tGPT大约90的质量,但是训练成本仅0美元左右。在本地运行以下命令加载模型:单PU模式:python3macht.sri-odlpthpthoicuna/igts单U模式:python3macht.sri-odlpthpthoicuna/igts-dicecpu多PU模式:python3macht.sri-odlpthpthoicuna/igts-nugpus28bit模式python3macht.r.cli-odelpthpthoicuna/igts-load8bit五、量化策略应用场景实战化案例根据前文的思路和独立的模型,我们的最终目的是实现多策略的有效融合,以及适合机构规模的实盘化试,本章列举了相关的实战化案例。5、六维度行业轮动策略及历史表现根据自上而下,结合宏观、量化基本面、财务因子、分析师预期、机构偏好、量价技术和资金流等维度我们构建了六维度综合行业配置模型,并自22年2月开始对外跟踪。自8年至初022年4月0日,模型年化收益率为15.21,相对行业等权组合的年化超额收益率为.9,除2008年以外,其余年度均获得正超额收益。3年以来(截至4月0日,六维度行业轮动模型累计收益率为12.30%,相对行业等权超额收益率为6.78%。自022年2月对外跟踪以来,模型累计收益率17.30,相对行业等权超额收益19.06。图表4:六维度综合行业轮动模型净值及超额收益(截至2234.0)六维度综合行业轮动累计净值 行业等权累计净值 超额收益109876543210数据来源:,图表:六维度综合行业轮动模型历史表现及分年收益率六维度综合行业轮动策略行业等权组合超额组合年化收益率1521%3.5%169%年化波动率2967%2777%9.6%夏普比率0.310.551.64最大回撤-6672%-6735%-1447%分年收益208-598%-610%3.1%20910.2%1.3%-5.2%200140%5.1%8.5%201-206%-284%109%202171%3.3%133%203333%137%172%204512%480%2.2%205642%504%9.2%2064.1%-133%200%207145%1.1%132%208-252%-289%5.2%209449%283%130%200565%207%297%201456%121%299%202-7.4%-140%7.6%203(截至4月30日)1230%5.6%6.8%,、六维
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国考题库综合及答案详解【必刷】
- 焊工国考题库【基础题】附答案详解
- 贵州行测国考题库附完整答案详解(必刷)
- 国考题库附完整答案详解【易错题】
- 国考行测题库比例及完整答案详解【全优】
- 国考行测题库比例及答案详解(新)
- 航天常识国考题库及参考答案详解一套
- 国考题库文件下载附答案详解【预热题】
- 国考行测题库结构含答案详解(b卷)
- 计算机国考题库及完整答案详解【各地真题】
- 第2单元第6课《认识操作系统桌面》课件 【甘少版】《信息科技》四年级上册
- 2024-2025学年陕西省西安市碑林区部分学校北师大版四年级上册期中测试数学试卷(含答案)
- 2025年及未来5年中国电梯维保行业市场前景预测及投资战略研究报告
- 生成式人工智能培训
- 2025年高考真题分类汇编必修三 《政治与法治》(全国)(解析版)
- 机器学习原理及应用课件:回归分析
- 手绘植物花卉课件
- 土耳其移民合同范本
- 执法员压力与情绪管理课件
- (2025)营养指导员考试真题库(含答案)
- 小升初道法复习课件
评论
0/150
提交评论