Chinascope数库多因子量化投资平台_第1页
Chinascope数库多因子量化投资平台_第2页
Chinascope数库多因子量化投资平台_第3页
Chinascope数库多因子量化投资平台_第4页
Chinascope数库多因子量化投资平台_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。数库多因子量化平台,是数库团队依托金融大数据开发的量化平台,克服了传统策略开发过程中的种种问题,力求做到数据权威、因子丰富、回测精准、评价全面、个性化功能更加丰富。传统策略开发过程中的问题1. 数据维护耗时耗力:数据量庞大,从原始数据到因子数据,任何环节出错就会造成策略失真2. 计算处理能力受限:个人电脑在处理批量计算时,速度缓慢3. 回测结果无法有效保存:无法有效的形成统一规划的可视化输出,策略结果随意保存4. 策略不能及时跟踪:策略更新需重复运行代码,无法

2、有效跟踪策略绩效数库能做到的1. 更高效、权威、及时的原始数据2. 更加全面、丰富的因子库、3. 更加精准的回测算法4. 更加权威、全面的因子评价指标5. 更丰富的自定义功能因子分类【因子目录】财务因子: 估值、盈利能力、成长能力、资本结构、运营、流动性技术因子: 动量型、趋势型、波动型、成交量型、超买超卖型财务因子的计算逻辑YTD逻辑:利润表和现金流量表数据为年初到报告期值,资产负债表数据(非平均)为最近报告期报告值,资产负债表数据(平均)为年初与最近报告期的平均值)LTM逻辑:利润表和现金流量表数据为最近12个月值,资产负债表数据(平均)为本期值与上年同期值取平均 YTD因子:即后缀为YT

3、D的因子,表示该因子计算所需指标的取值逻辑为YTD1. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(无需平均)时:所有指标取最近报告期值即可2. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(需平均)时:资产负债表平均指标=(期初值+最近报告期值)/2,其他指标取最近报告期值3. 同时涉及利润表(或现金流量表)指标和资产负债表指标(无需平均)时: 资产负债表非平均指标直接取最近报告期值; 利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.4. 同时涉及利润表(或现金流量表)指标和资产负债表指标(需平均)时:资

4、产负债表平均指标=(年初值+本期期末值)/2;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1. LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM1. LTM因子同时涉及利润表(或现金流量表)指标和资产负债表指标时: 利润表指标取最近12个月数值; 资产负债表指标取平均值,平均值=(本期报告值+上年同期值)/22. LTM因子仅涉及利润表和现金流量表指标时:利润表和现金流量表指标取最近12个月数值。财务因子数据映射说明由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公

5、布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑: 1、2、3月底采用上一年Q3的数据; 4、5、6、7月底用本年Q1的数据; 8、9月底用本年Q2的数据; 10、11、12用本年Q3的数据。(注:此处Q为财务季度,区分后文Q1,Q5)基本参数设置股票池: 沪深300 中证500 中证800 创业板综指 全部A股调仓期: 周 月 季IC计算方法: normalIC rankIC组合加权: 平均权重 市值权重因子方向: 升序 降序起止时间: 2007.01.01至今选择组别: 5组 10组 15组 20组 30组.首页 多因子平台首页热力图呈现各类因

6、子近12个月表现排名对比,通过选择指标可选择想要对比的指标(Q1收益率或Q1-Q5收益率); 单击热力图上因子名称,可呈现该类因子近12月的表现; 页面下方统计表格为近12月各类因子的信息系数、收益率及换手率等相关评价指标,指标说明详见算法说明; 单击风格因子名,可切换到该类风格因子的因子目录界面。.因子目录因子目录有两种呈现方式,即因子列表和因子筛选。因子列表,即以列表形式展示全部或某类因子的名称、释义及公式;因子筛选,即以列表形式展示各因子近期表现指标,且可通过设定指标取值范围进行因子筛选。因子列表与因子筛选页面均可进行收藏、加入组合及加入对比操作。1 .因子列表 通过类型选择进行因子类型

7、切换,默认显示全部因子; 单击因子名,可进入该因子数据概览界面,见 . 单因子有效性评价; 通过右侧按钮进行收藏、加入组合、加入对比等操作.2 .因子筛选 参数设置:股票池;IC计算方法;类型选择; 通过右侧按钮进行收藏、加入组合、加入对比等操作; 单击因子名,可进入该因子数据概览界面,见 . 单因子有效性评价;.单因子有效性评价工具栏凡是界面上出现的工具栏,均可通过其对进行相应的操作: 收藏、加入组合、加入对比在单因子有效性评价页面,可通过收藏、加入组合、加入对比进行相应的操作; 对比栏右侧悬浮对比栏,显示当前已加入对比的因子列表,上限为5个;通过对比、清空、删除可对对比栏因子进行相应操作。

8、1. 数据概览单因子有效性评价首页为数据概览界面,基本参数设置同上,该界面呈现如下内容: 近12期所选股票池的因子值分布箱形图 近12期所选股票池的收益率分布箱形图 近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比) 单期因子值分布直方图 单期股票收益率和因子值散点图 单期各档收益率分布:横轴为按照所选因子方向排序后划分为10组,纵轴为每组内股票收益率的分布箱形图又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。2 . IC分析信息系数相关算法点击IC分析,进入IC界面,基本

9、参数设置同上,通过IC计算方法选择不同的信息系数(默认为normalIC); 图-IC: 柱状为每期的IC值,曲线为IC的12期移动均值; 图-IC分布: 呈现所选起止时间内IC值的分布图、及IC的均值和标准差; 图-IC衰退: 主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,.,12;其次,分别对因子每隔i期的信息系数计算均值; 图-IC统计指标: 即各分组IC的均值、P值均值、标准差和IR值; 图-因子自相关序列:即所有股票当期

10、因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,.,12;其次,分别对因子每隔i期的相关系数计算均值。3 . 收益率分析收益率相关指标算法点击收益率分析切换到收益率界面,基本参数设置同上,该页面呈现: 累计收益率:即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同); 收益率分布:呈现选择组别在所选起止时间内收益率的分布、及收益率均值和标准差; 收益率对比: 呈现选择组别在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益; 收益率

11、统计指标:即因子收益率相关的评价性指标。4 .换手率分析换手率算法点击换手率分析可切换到换手率界面,基本参数设置同上,该页面呈现如下内容; 图-换手率:即所选时间段中各组的换手率序列,选择计算方法可切换不同的换手率,复选Q1-Q5可对比不同组的换手率序列; 图-平均换手率:即所选起止时间内换手率序列均值; 图-换手率对比:即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别可切换Q1至Q5; 图-买入信号衰退和反转:买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为中性信号;衰退指TOP组中股票近12期仍保持买入信号的比率逐渐减少,反转指TOP组中股

12、票近12期每期变更为卖出信号的比率逐渐增加; 通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。(注:若无反转信号,则买入信号反转图为空。)5 . 选股结果选股结果,即按因子值排列选出的Top组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别可查看不同组别的市值和行业占比。6 .月历效应金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。 因子月历效应页面,按月份展示各年各月的收益

13、率情况,通过横向纵向对比,可进一步研究因子的月历效应; 因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。 因子对比点击单因子界面的悬浮窗对比按钮,可进入因子对比界面(对比因子上限为5个),且可通过生成组合建立组合;设定相关参数后,可呈现以下内容: 统计指标对比表:即所选各对比因子起止时间内的信息系数、收益率、换手率等相关指标(详见算法说明); 累计收益率对比图:即所选各对比因子的累计收益率曲线对比,通过按组查看可切换至 Q1、 Q2、 Q3、 Q4、 Q5 或 Q1-Q5组; IC对比:即所选各对比因子(不分组)信息系数序列对比,通过IC计算方法选择norm

14、al IC 或者 Rank IC; 换手率对比:即所选各对比因子所选组别的换手率序列对比,通过换手率计算方法可选择个数算法或者市值权重法; 平均市值对比:即所选各对比因子各组股票的平均市值序列对比,通过选择组别可切换至 Q1、 Q2、 Q3、 Q4、或 Q1-Q5组; 滚动相关系数:即所选N个对比因子两两因子值间的截面相关系数序列,通过选择因子设定基准因子,该图呈现N-1条滚动相关系数曲线; 因子相关性矩阵:每两因子的相关系数,即所选起止时间内两因子滚动相关系数序列均值。 因子收藏 点击因子收藏切换到因子收藏页面如下图,通过因子收藏可更加快捷地进行因子选择; 点击因子名称,可进入该单因子有效性

15、评价界面; 通过右侧工具栏,可进行取消收藏、加入组合、加入对比等操作。 因子组合点击因子组合可切换到因子组合界面,可对多组合进行编辑,如创建组合、删除组合、重命名组合等;选择因子组合名称,如因子组合1,或者点击因子对比界面右侧的生成组合,则均进入组合界面。因子组合界面由回测设置、回测结果、策略跟踪三部分组成。1. 回测设置起止时间:开始时间、结束时间股票池: 沪深300、 中证500、 中证800调仓期: 周、月、季因子加权:等权法、IC加权法、IC_IR加权法、收益率加权法IC计算方法:NormalIC、RankIC组合加权:平均权重、市值权重分组组数:5组、10组、15组、20组、30组

16、添加因子:点击右侧添加因子,出现因子库界面,在左侧因子列表中选择因子并设定因子方向(默认因子降序),构建因子组合,选择生成策略或另存为可保存因子组合。2. 回测结果:在回测设置页面选择生成策略则对其进行回测计算,回测结果由IC分析(信息系数算法)、收益率分析(收益率相关指标算法)、换手率分析(换手率算法)、月历效应、选股结果五部分组成。 选择IC分析、收益率分析、换手率分析、月历效应、选股结果,则进入相应页面,因子组合评价页面与单因子评价界面类似,算法详见因子组合评价逻辑。3. 策略跟踪:策略跟踪由累计收益率、策略历史表现、股票信息、相关资讯四部分组成。 累计收益率:呈现回测期间Q1与基准指数

17、的累计收益率曲线,及累计收益率(%)和最大回撤(%)指标; 策略历史表现:呈现Q1、Q5、Q1-Q5、基准指数的累计收益率和当期收益率,以及年化收益率、最大回撤、标准差、胜率、最大单期涨幅、最大单期跌幅、夏普比率和信息比率指标; 股票信息:呈现当前持仓股票所属行业、因子值、最新价、昨日收盘价、涨跌幅、仓位,以及该组合的历史调仓记录等; 相关资讯:即当前持仓股票的相关新闻资讯。算法说明单因子评价算法逻辑因子数据获取与处理流程: 根据回测起始日期确定所涉及到的财报报告期; 根据起始日期与调仓频率确定回测期间的调仓期(具体的日期); 根据调仓期与财务数据映射原则确定所用到财报报告期; 跟据用户输入的

18、参数从数据库中提取原始数据,原始数据有三个维度:报告期,股票名,因子值; 对原始数据进行去极值和标准化处理; 将原始数据的频率转换至用户设定的调仓周期。MAD去极值处理去极值算法的主要目的是为了使因子数据在一个合理的范围之内。去极值的方法主要有两种:MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。fi=fm+nfMADfmnfMADfiiffiu+nfMADiffifmnfMADiffmnfMADfiu+nfMADfmnfMADiffifmnfMADfiiffmnfMADfiMi)THitRatio=num(RiMi)Tnum(RiMi)为组合收益率战胜市场平均收益率的次数num(

19、RiMi)为组合收益率战胜市场平均收益率的次数夏普比率(Sharp Ratio)夏普比率,表示每承受一单位风险,会产生多少超额报酬,这里风险被定义为波动率,即组合收益的标准差。 夏普比率越高,每单位风险创造的超额收益越多。SharpRatio=RiRf(Ri)SharpRatio=RiRf(Ri)Ri为组合年化收益率Ri为组合年化收益率Rf为年化无风险收益率Rf为年化无风险收益率(Ri)为组合年化收益的标准差(Ri)为组合年化收益的标准差信息比率(Information Ratio)信息比率,即组合年化超额收益的均值与标准差的比值;IR=avg(RiRm)(RiRm)IR=avg(RiRm)(

20、RiRm)Ri为组合年化收益率Ri为组合年化收益率Rm为基准指数年化收益率Rm为基准指数年化收益率(RiRm)为组合年化超额收益的标准差(RiRm)为组合年化超额收益的标准差组合换手率计算方法T=12i=1N|wnewiwoldi|T=12i=1N|winewwiold|Wnew=(wnew1,wnewN)Wnew=(w1new,wNnew)Wold=(wold1,woldN)Wold=(w1old,wNold)(1)个数法换手率即每期各分组中股票数目变化百分比:Turnovert=i组t期较t-1期股票变动数量i组股票数量Turnovert=i组t期较t-1期股票变动数量i组股票数量(2)权

21、重法换手率即各组股票权重值变化绝对值加总的一半,基于市值权重和平均权重分别得到市值加权的换手率(权重法cap)和平均加权的换手率(权重法equal):Turnovert=12s=1n|weights,tweightss,t1|Turnovert=12s=1n|weights,tweightss,t1|weights,t为t期s股票在组合中所占权重weights,t为t期s股票在组合中所占权重多因子组合算法逻辑多因子组合分析时的相关评价指标与单因子分析时的指标一样,唯一的区别是因子(因子组合)暴露值不同: 单因子分析时,股票因子暴露值就是股票当期的该因子值; 多因子分析时,某股票在多因子组合下的

22、暴露值是该股票根据该因子组合内各因子加权得到的综合因子值。相关术语 股票原始因子值:即股票在各因子上的暴露值; 股票调整因子值:即股票在各原始因子值乘以对应的因子权重所得值; 股票综合因子值:即股票各调整因子值的加总; 股票综合得分:即股票按照各原始因子值(或调整因子值)进行排序打分,股票在各因子上的得分与对应因子权重乘积的加总。因子组合部分主要包括因子加权、计算综合因子值、综合打分、股票加权等部分,整体思路如下图:(1)因子加权方法: 等权法每个因子赋予相同的权重,即若该类别共有N个因子,则每个因子权重为1/N。 因子IC加权:根据每个因子最近N个月的IC绝对值的均值进行加权,N默认为12个

23、月。步骤如下:o 计算回测开始期前12期至回测结束期每个因子的IC值(IC值默认为NormalIC);o 从回测开始期$t_0$至回测结束期$t_N$每个因子$f$每期的权重计算如下:Wtf=mean(ICtf:ICt12f)fFmean(ICtf:ICt12f)Wft=mean(ICft:ICft12)fFmean(ICft:ICft12) 因子收益率加权法根据因子最近N个月平均收益率而分配不同权重,N默认为12个月。步骤如下:o 计算回测期开始至结束期每个因子的收益率;按照因子值排序并分组,Top组股票(平均权重)的综合收益率;o 从回测开始期$t_0$至回测结束期$t_N$每个因子$f$每期的权

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论