多因子选股模型系列一:因子筛选与综合打分_第1页
多因子选股模型系列一:因子筛选与综合打分_第2页
多因子选股模型系列一:因子筛选与综合打分_第3页
多因子选股模型系列一:因子筛选与综合打分_第4页
多因子选股模型系列一:因子筛选与综合打分_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

陈健宓陈个指(2指数选取901证券研研究报告/海海外研究/数数量化选股日期::2012年10月31日金融工工程 袁冠群

021-535198888x1922 centauray@

执业证书编号号:S08705120090001 021-535198888x1951 jianmi.chen@@报告编号号:YGQ12-XXG01首次报告告日期:2012.10.31

多因子子选股模模型系列一一:因子子筛选与综合打分

模型型概述因子选取本模型整整理计算得到能能反映未来股股价变动的五五大类指标::估值类(7个指标)、财务成长类类(14个指标标)、财务质量量类(10指标)、价量类(6个指指标)、分析析师预期类(个指标),并对各因子子在不同的股票池中的的显著程度作了了判别,筛选选出对未来股股价具有影响响力的因子。股票池划分模型用第n-1个月的各各项因子指标标来给股票池池中的每个股股票综合打分分,给出第n个月的选股股名单,因此模模型的股票池池为所有A股。我们又对代表大大盘股的沪深300指数和中中小盘股的中中证500数进行了单独研究。兼顾顾股票池中必必须保持一定定样本数量,,和周期性行行业具有的波动性特点点,我们把所有有股票、沪深300和中证500三个股股票池进一步划分为周周期性行业和非非周期性行业业,股票分类类细化到三级级行业。得到9个股票池池。模型时间选择考虑到样样本数据的有效效性,过早的的数据代表性性差,我们选2005年4月-2011年10月为分分析建模区间间,2011年11月至2012年9月为模型检验区区间,分析建模模区间和模型型检验区间随随着时间的推推移而每月更新。模拟拟组合结果

该组合每每月均能跑赢基基准指数,且且抗系统性风风险的能力相相当强,在绝 大部分月月份中都取得了了正收益率,,具有良好的的实际应用价价值。表1:2005年4月至2012年9月各模拟组合收益益率所有A

股所有周期 性A股

所有有非周期性A股HS300HS300非 周期HS300周 期ZZ5000ZZ500非 周期ZZ500周 期跑赢基准等权 指数胜率月收益率差平 均值绝对月收益率 平均值负收益率概率

100%23.73%26.32% 3/90

100%24.64%27.34% 3/90

100%22.61%25.10% 3/90

100%200.27%222.22% 3/90

100%19.03%20.75% 3/90

1000%20.117%22.228% 5/90

1000%21.533%23.933% 6//90

100%20.16%22.47% 6/9

100%23.00%25.55% 6/90

数据来源:上海海证券研究所重要提提示:请务必必阅读尾页分分析师承诺和和重要声明。RGSRGPCFGS2

数量化选股

多因子选股模型简介

多因子选股模型的要点在于通过收集大量的股票基本面、技术面 和市场预期类数据,对这些数据进行计算和筛选优化,找出对未来股 价具有影响力的指标,这些指标也称为因子;并通过一系列统计方法 确定各因子在给股票打分时的权重,从而给股票池中的所有股票打分, 选出评分前列的股票作为模拟组合,观察这些股票相对于基准指数的 收益,考察模型的有效性。

1、因子计算方法

我们从wind中导入各月度的单因子数据,经筛选整理计算得到 能反映未来股价变动的五大类指标:估值类(7个指标)、财务成长 类(14个指标)、财务质量类(10个指标)、价量类(6个指标)、分 析师预期类(2个指标)。各因子的计算方法如表1所示。对于估值 类因子中的负值,我们将该指标剔除。在计算涉及增长率的指标时, 我们取分母的绝对值,避免了两期均为负数的指标的增长率转正。表2:因子计算方法列表

因子指标 估值类

PETTM PETTMCUT PEGTTM PSTTM PCFTTM PBTTM EVEBITDA

财务成长类

RGTTM NPGS NPGP NPGTTM2012年10月31日

名称市盈率扣除非经常损益的市盈率市盈率相对盈利增长率市销率市现率市净率企业价值倍数营业收入增长率-单季营业收入增长率-同比营业收入增长率-1年(TTM)净利润增长率-单季净利润增长率-同比净利润增长率-1年(TTM)经营性现金流增长率-单季

计算方法市值/最近4个季度归属母公司净利润市值/最近4个季度扣除非经常收益的净利润PE/最近4个季度净利润增长率市值/最近4个季度营业收入市值/最近4个季度净现金流量市值/最近4个季度归属母公司权益剔除货币资金后的企业价值/最近4个季度税息折旧及摊销前利润当年单季度营业收入/上年同期营业收入-1当年当期营业收入/上年同期营业收入-1最近4个季度营业收入/上期4个季度营业收入-1当年单季度归属母公司利润/上年该季度归属母公司利润-1当年当期归属母公司利润/上年同期归属母公司利润-1最近4个季度归属母公司利润/上期4个季度归属母公司利润-1当年单季度经营性现金流/上年该季度经营性现金流-1CFGPROEROA3数量化选股经营性现金流增长率-同比当年当期经营性现金流/上年同期经营性现金流-1CFGTTMROEGSROEGPROEGTTMROAGSROAGP财务质量类GPMPGPMTTMNPMPNPMTTMEMDRCF/NPEBITDA/revenue价量类PM1PM3PM6TM1TM3TM6分析师预期类INSNUMRATENUM经营性现金流增长率-1年(TTM)ROE增长率-单季ROE增长率-同比ROE增长率-1年(TTM)ROA增长率-单季ROA增长率-同比资本回报率(TTM)资产回报率(TTM)毛利率-同比毛利率-TTM净利率-同比净利率-TTM股权乘数有息负债率单位净利润现金流含量税息折旧及摊销前利润率1个月收益率3个月收益率6个月收益率1个月换手率3个月换手率6个月换手率机构覆盖数量评级调整最近4个季度经营性现金流/上期4个季度经营性现金流-1(本年单季度归属母公司净利润-上年该季度归属母公司净利润)/平均归属于母公司的净资产(本年当期归属母公司净利润-上年同期归属母公司净利润)/平均归属于母公司的净资产(最近4个季度归属母公司净利润-上期4个季度归属母公司净利润)/平均归属于母公司的净资产(本年单季度归属母公司净利润-上年同期归属母公司净利润)/平均总资产(本年当期归属母公司净利润-上年同期归属母公司净利润)/平均总资产最近4个季度归属母公司净利润/平均归属于母公司的净资产最近4个季度归属母公司净利润/平均总资产当年当期营业毛利润/当年当期营业收入最近4个季度营业毛利润/最近4个季度营业收入当年当期净利润/当年当期营业收入最近4个季度净利润/最近4个季度营业收入当期总资产/当期净资产(当期短期借款+一年内到期借款+长期借款)/当期净资产单季度经营性现金流量/当期净利润最近4个季度税息折旧及摊销前利润/最近4个季度营业收入当前收盘价/1个月前收盘价-1当前收盘价/3个月前收盘价-1当前收盘价/6个月前收盘价-1过去1个月平均换手率过去3个月平均换手率过去6个月平均换手率该季度内覆盖该只股票的卖方机构总数该季度内分析师评级上调次数减下调次数数据来源:Wind;上海证券研究所

2、月度匹配原则

我们用第n-1个月的各项因子指标来给股票池中的每个股票综合2012年10月31日4

数量化选股打分,给出第n个月的选股名单。考虑到财务报表数据取得的滞后性,每个月选择的最新财务季报日期有所不同,具体见表2。

表3:财务报表数据匹配方法

月份

t年1-3月

t年4-7月

t年8-9月t年10-12月

所用财务数据t-1年3季报及之前数据

t年1季报及之前数据

t年半年报及之前数据

t年3季报及之前数据

数据来源:上海证券研究所3、股票池

我们建立的多因子选股模型可以给每一个股票进行因子评分,因此模型的股票池为所有A股。考虑到股票的市值不同对因子指标本身的影响,和后续指数研究的需要,我们又对代表大盘股的沪深300指数和中小盘股的中证500指数进行了单独研究。兼顾股票池中必须保持一定样本数量,和周期性行业具有的波动性特点,我们把所有股票、沪深300和中证500三个股票池进一步划分为周期性行业和非周期性行业,股票分类细化到三级行业。得到9个股票池。

表4:周期性行业划分行业分类

一级行业 二级行业 三级行业

非周期行业采掘、黑色金属、建筑建材、房地产、金融服务石油化工、有色金属冶炼与加工、电气设备、通用电力、机械、金属制品Ⅱ、交运设备服务、汽车零部件Ⅱ、汽车整车、港口Ⅱ、机场Ⅱ、航空运输Ⅱ、航运Ⅱ、物流Ⅱ、铁路运输Ⅱ、景点、酒店Ⅱ、旅游综合Ⅱ金属新材料Ⅲ、工程机械、重型机械、冶金矿采化工设备、楼宇设备、航空航天设备、船舶制造、铁

路设备、珠宝首饰

数据来源:Wind;上海证券研究所2012年10月31日5我们分析分析数量化选股图1:模模型股票池划分数据来源源:上海证券研研究所4、时间间选择

考虑虑到样本数据的的有效性,过早的数据代代表性差,们选取2005年4月-20011年10月为分析建模区区间,2011年11月至2012年9月为模型检检验区间,析建模区间和和模型检验区区间随着时间间的推移而更新。5、单因因子有效性分

(1))将股票池里里的样本股票票按每一个待待测因子由高高到低的顺序排列,平均均分成五组。。每组的因子子数值排序为1,2,3,4,5。。每月排列一次,分别计计算每一组的的次月平均收收益率,按从从高到低排序序,为R1,R2,R3,R4,R5。(2)计算组间月月平均收益率差差,分别是R1-R5;(R1+R2-R4-R5)/2。(3)计算2005年1月-2011年10月间所所有月平均收收益率差的平均值。如果果平均值>0,,则该因子的的影响总体是是正向的,即即因子值越大收益趋于于越大;如果平平均值<0,则则反之。(4))计算每个因因子的有效性正向向(负向)因子的的有效性=月月平均收益率差差为正(负))的月份数/总月份数数。(5))计算每个因因子的相关系系数和P值:根据据每一组的自变变量因子数值值排序1,2,33,4,5和因变变量收益率按2012年10月31日6数量化选股其数值大小顺序编号1-5进行一元回归可得该回归的相关系数和P值。6、度量因子有效性的标准(1)收益率差有效性标准:在收益率排序和因子排序相关性检验P值<0.05的前提下,“√√+”表示第1组-第5组和第1、2组-第4、5组平均收益率差均大于0.5%,有效性大于60%。“√√-”表示第1组-第5组和第1、2组-第4、5组平均收益率差均小于-0.5%,有效性大于60%。“√+”表示第1组-第5组和第1、2组-第4、5组平均收益率差有一个大于0.5%,且有效性大于60%。“√-”表示第1组-第5组和第1、2组-第4、5组平均收益率差有一个小于-0.5%,且有效性大于60%。(2)收益率排序和因子排序的相关系数有效性标准:在收益率排序和因子排序相关性检验P值<0.05的前提下,“√√+”表示第1组-第5组和第1、2组-第4、5组平均收益率差均大于0,相关系数大于0.2。“√√-”表示第1组-第5组和第1、2组-第4、5组平均收益率差均小于0,相关系数小于-0.2。“√+”表示第1组-第5组和第1、2组-第4、5组平均收益率差均大于0,相关系数大于0.1。“√-”表示第1组-第5组和第1、2组-第4、5组平均收益率差均大于0,相关系数小于-0.1。7、因子有效性汇总根据第6节中度量因子有效性的标准,我们得到了估值类(7个指标)、财务成长类(14个指标)、财务质量类(10个指标)、价量类(6个指标)、分析师预期类(2个指标)在9个股票池中的有效性:2012年10月31日7

数量化选股表5:所有A股因子有效性汇总

所有A股指标整体周期非周期收益率差相关系数收益率差相关系数收益率差相关系数PM1PM3PM6TM1TM3TM6PETTMPETTMCUTPEGTTMPSTTMPCFTTMPBTTMEVEBITDARGSRGPRGTTMNPGSNPGPNPGTTMCFGSCFGPCFGTTMROEGSROEGPROEGTTMROAGSROAGPROEROAGPMPGPMTTMNPMPNPMTTMEMDRCFNPEBITDAREVINSNUMRATENUM√√- × ×√√-√√- √- × × ×√√-√√- √- × √√ √√ √ √√ √ × × × × √√ √√ √√ √√ √√ × × × × × × × × × × × √√√- √- √-√√- √- √- √- × √- √- √- √- × √√ √ √ √√ √ √ × √ √ √√ √√ √ √√ √√ × × × × × × × × × × × ×√√- √- √-√√- × × × × × × × × × √√ √ √ √√ √ × × × × √√ √√ √ √√ √√ × × × × × × × × × × × √√√√- √- √-√√- √- √- × × × × × √- × √√ √ √ √√ √ √ × × × √√ √√ √ √√ √√ × × × × × × × × × × × ×√√-√√- ×√√-√√-√√- √- × ×√√-√√- √- × √√ √ √ √ × × × √ × √√ √√ × √√ √√ × × × × × × × × × × × ×√√-√√- √-√√-√√- √- √- √- × √-√√- √- × √ √ √ √ √ × × √ √ √√ √ √ √√ √ × × × × × × × × × × × ×

数据来源:上海证券研究所2012年10月31日8

数量化选股表6:HS300因子有效性汇总

HS300指标整体周期非周期收益率差相关系数收益率差相关系数收益率差相关系数PM1PM3PM6TM1TM3TM6PETTMPETTMCUTPEGTTMPSTTMPCFTTMPBTTMEVEBITDARGSRGPRGTTMNPGSNPGPNPGTTMCFGSCFGPCFGTTMROEGSROEGPROEGTTMROAGSROAGPROEROAGPMPGPMTTMNPMPNPMTTMEMDRCFNPEBITDAREVINSNUM

× × ×√- × ×√- ×√- ×√- × ×√√√√ ×√√√√√√ √ × ×√√√√√√√√√√√√ √ × × × × × × × × ×√- × ×√- × × × ×√- ×√- × ×√√ √ √√√√√ √ √ × ×√√√√ √√√√√ √ × × × × × √ × × × ×

× × × × × × × ×√- × × × ×√√√√ ×√√√√√√ √ × √√√√√√√√√√√ × × × × × × × × × × ×

× × × × × × ×√-√- × × × × √ √ √√√ √ √ √ √ ×√√ √ √√√√√ × × × × × × × × × × ×√√- × × √- × × × × × ×√√- × × √√ √ × √√ √√ √ × × × √√ √√ √ √√ √ × × × × × × × × × × ×√- × ×√- × × ×√- ×√-√- × × √ × × √ √ √ × × ×√√√√ √ √ √ × × × × × × × × × × ×2012年10月31日9数量化选股RATENUM√×√√×××数据来源:上海证券研究所表7:ZZ500因子有效性汇总

ZZ500指标整体周期非周期收益率差相关系数收益率差相关系数收益率差相关系数PM1PM3PM6TM1TM3TM6PETTMPETTMCUTPEGTTMPSTTMPCFTTMPBTTMEVEBITDARGSRGPRGTTMNPGSNPGPNPGTTMCFGSCFGPCFGTTMROEGSROEGPROEGTTMROAGSROAGPROEROAGPMPGPMTTMNPMPNPMTTMEMDRCFNP√√- √- ×√√- √- √- × × ×√√- √-√√- × √√ √√ √ √√ √√ √√ × × √ √√ √√ √√ √√ √√ × × × × √ × × × ×√√- √- ×√√- √- √- √- √- √- √-√√- √- × √√ √ √ √√ √ √ √ × √ √√ √√ √ √√ √√ × × × × √ × × × ×√√-√√- √- √- √-√√-√√- √- × × √- × × √ √ × √√ √√ √ × × × √√ √√ × √√ √√ × × × × √ × × × ×√√-√√- √-√√- √- √- √- √- × √- √- √- × √ √ × √√ √ √ × × × √ √ × √√ √ × × × × √ × × × ×√√- × ×√√-√√-√√- √- × × √- √- × × √√ √√ × √√ √√ × × × √ √√ √√ √√ √√ √√ × × × × × × × × ×√√- × ×√√-√√- √- √- × × √- √- × × √ √ × √√ √ × × √ √ √√ √ √ √√ √√ × × × × × × × × ×2012年10月31日数量化选股EBITDAREVINSNUMRATENUM×××××××××××××××

×√- ×

数据来源:上海证券研究所

8、因子赋权

我们按因子的有效性的强弱对各因子赋予不同权重,在每一个股 票池中: 因子1:收益率差和相关系数均为“√√+”或“√√-”。 因子2:收益率差和相关系数为“√√+”和“√+”,或者“√ √-”和“√-”。 因子3:收益率差和相关系数为“√+”和“√√+”,或者“√-”

和“√√-”。 因子4:收益率差和相关系数为“√+”和“√+”,或者“√-”

和“√-”。 因子1-4的权重分别为4倍、3倍、2倍、1倍。 对一致预期类因子的修正:由于获得的分析师预期类数据不完全, 该类因子的有效性在之前的测算中较低,但根据该大类因子的收益率 回归分析,我们对该类因子赋予的权重为7%,单个因子为3.5%。我 们得到各股票池的因子权重分布见下表表8:所有A股因子权重因子大类指标财务成长类

58%

RGS7.3%NPGS7.3%ROEGS

7.3%ROEGP

7.3%ROAGS

7.3%ROAGP

7.3%RGP5.5%ROEGTTM

5.5%RGTTM

1.8%NPGP1.8%

价量类

22%

估值类

13%一致预期类

7%

PM1

7.3%

PSTTM

5.5%INSNUM

3.5%

TM1

7.3%

PCFTTM

5.5%RATENUM

3.5%

TM3

5.5%PBTTM

1.8%TM61.8%数据来源:上海证券研究所2012年10月31日10

数量化选股表9:HS300因子权重因子大类指标财务成长类

80%RGS8.5%NPGS 8.5%NPGP 8.5%ROEGS 8.5%ROEGP 8.5%ROAGS 8.5%ROAGP 8.5%RGP6.3%价量类

2%NPGTTM 6.3% TM1 2.1%ROEGTTM 6.3%CFGS 2.1%

估值类

4%财务质量类

6%一致预期类

7%PEGTTM 2.1% ROE 6.3%INSNUM 3.5%

PCFTTM 2.1%RATENUM 3.5%数据来源:Wind;上海证券研究所表10:ZZ500因子权重因子大类指标财务成长类

61%RGS6.4%NPGS 6.4%ROEGS 6.4%ROEGP 6.4%ROAGS 6.4%ROAGP 6.4%RGP4.8%NPGP 4.8%NPGTTM 4.8%ROEGTTM 4.8%RGTTM 1.6%CFGTTM 1.6%价量类

18%估值类

13%

PM1 6.4%PSTTM 4.8%

TM1 6.4%PBTTM 4.8%

PM3 1.6%PCFTTM 3.2%TM31.6%TM61.6%财务质量类

2%NPMP 1.6%一致预期类

7%INSNUM 3.5%RATENUM 3.5%数据来源:上海证券研究所

9、因子打分

正向有效因子的打分,按因子值由高到低排序为5,4,3,2,1分,负 向因子的打分按因子值由高到低排序为1,2,3,4,5分。

PE和PETTMCUT两个因子,按因子值由高到低排序,第四组收 益率最高,并且比较显著,因此这两组因子的打分从高到低为1,2,3,5,4

分。2012年10月31日11扣除研究所

数量化选股

10、模拟拟组合收益益率比较

由于于我们的模型每每月换仓一次次,因此每月月收益率要扣0.5%的 交易成本本。但模型结果果是各个股票票池中的模拟拟组合都相对对于各股票池 的等权指指数取得了超额额收益率。而且该组合抗抗系统性风险险的能力相当 强,在绝大大部分月份中中都取得了正正收益率,因因此具有很好好的实际应用 价值,模模拟组合各月的的收益率见以以下图表:表11:2005年4月至2012年9月各模拟组组合收益率所有A股所有有周期 性A股所有有非周期性A股HS3300HS300非 周期HS300周 期ZZ500ZZ500非 周期ZZ500周 期跑赢基准等权指数100%100%1000%1000%100%100%100%100%100%胜率月收益率差平均值23.73%244.64%22..61%20.227%19.033%20.17%21.53%20.16%23.00%绝对月收益率平均26.32%277.34%25..10%22.222%20.755%22.28%23.93%22.47%25.55%值负收益率概率3/903/903/903/9903/905/906/906/906/90数据来源:上上海证券研究所图2:所有A股中选股模模拟组合收益数据来源::上海证券研究

2012年10月31日图3:所有周期期性A股中选股股模拟组合收益数据来源:上海海证券研究所12研究所研究所数量化选股图4:所有有非周期性A股中选股模拟组组合收益数据来源::上海证券研究图6:HSS300

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论