【基于因子模型的量化选股方案案例5400字】_第1页
【基于因子模型的量化选股方案案例5400字】_第2页
【基于因子模型的量化选股方案案例5400字】_第3页
【基于因子模型的量化选股方案案例5400字】_第4页
【基于因子模型的量化选股方案案例5400字】_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

–PAGE28–基于因子模型的量化选股方案案例目录TOC\o"1-3"\h\u32669基于因子模型的量化选股方案案例 121081(一)样本确定 16985(二)指标选取 119391(三)主成分分析 327774(四)因子提取 614343(五)因子分析结果 8(一)样本确定化工行业对一个国家的总体经济结构而言,始终占据着重要地位。而对我国而言,现阶段化学制品行业正处于转型升级的关键阶段,其股票市场也在证券市场中占有关键地位。团队基于宏观经济条件以及我国化学工业行业正与世界前列水平齐头并进大背景,并经过综合多方因素考虑后,决定选取化学制品这一对国家基础工业产生巨大影响的行业板块入手,进入虚拟仿真交易市场。通过数据统计与收集得出,截至2020年三季度,化学制品板块主要包含234只股票,团队通过对板块各只股票围绕主要财务表现及指标的深入分析与讨论,筛选出30只行业内龙头企业及具有利好概念前景的企业股票。在确保所收集数据清晰准确的前提下,综合抓取了所选股票经营与财务方面的重要指标,并列于下表中。样本数据选择截止至2020年第三季度。(二)指标选取通过相关知识理论的学习,以及通过对相关论文文献、已有实践研究成果的深入研究。团队总结出如下十个分析企业股价预期前景的备用指标,此类指标覆盖并体现了企业未来的成长能力、盈利能力、市场竞争力、运营能力以及应对财务风险等多方面能力。运用此类指标可以更好的更为全面的反映企业在所处行业板块较其他企业的相对股票投资价值。其中企业的成长能力由营业总收入的环比增长率(本文选取数据为2020年第三季度,单季度营业收入环比增长率)、净利润的环比增长率(本文选取数据为2020年第三季度,单季度净利润环比增长率)两项指标体现,盈利能力由净资产收益率(ROE)与总资产净利率(ROA)(本文选取2020年前三季度数据)两个指标来体现。收益质量由经营活动产生的现金流量净额对营业收入比率和销售商品提供劳务收到的现金对营业收入比率两个指标来体现(本文选取2020年前三季度数据),抗财务风险能力由资产负债率和流动比率两个指标来体现,营运能力由总资产周转率、应收账款周转率两个个指标来体现,(本文选取2020年前三季度数据)。通过搜集计算得到数据的统计结果如下图所示。表SEQ表\*ARABIC1统计结果分析表公司名称营业收入环比增长率(%)净利润环比增长率(%)净资产收益率(%)总资产收益率(%)销售净现金流/营业收入(%)经营净现金流/营业收入(%)资产负债率(%)流动比率(%)总资产周转率(%)应收账款周转(%)恩捷股份28.4965.558.844.2460.4610.1747.141.980.161.51天赐材料3.28-20.3817.058.8356.6918.0741.551.300.482.50两面针26.42208.412.972.41104.16-3.2815.285.610.196.50龙蟒佰利35.5565.5013.956.9688.6612.1153.351.010.355.74华鲁恒升0.52-18.548.846.8896.1123.9622.571.000.48320.78三棵树11.16-9.5715.915.2790.27-19.9868.091.090.742.48新宙邦20.86-1.069.386.6892.0220.8223.902.480.352.42正丹股份19.733491.871.901.54109.706.2516.483.560.566.01扬农化工-26.10-48.3918.909.8395.2217.4848.451.290.765.18鲁西化工14.0617.974.321.54113.3516.7365.240.170.40133.14珀莱雅16.835.6113.478.89103.599.0330.822.150.7410.63安迪苏-1.26-18.467.995.83103.5925.7723.322.230.435.84联泓新科-5.8246.3912.425.44110.8718.9853.920.640.5028.11杭氧股份7.38-15.7610.745.3962.118.9650.111.450.573.99雅化集团10.20-53.286.603.9576.1518.4636.472.280.423.64中核钛白32.8433.417.925.0376.0513.4132.311.990.386.19巨化股份3.77131.500.300.26111.673.4319.812.240.7022.17彤程新材14.7229.6314.308.1569.154.7741.641.070.362.62华谊集团5.38-3.160.270.07115.132.2553.321.090.438.65江南化工6.02-3.086.443.8287.6723.2643.652.200.221.56华昌化工-0.69435.010.940.3264.634.9557.540.430.6639.54亚邦股份-18.64-21.81-8.87-6.42117.00-2.0034.581.060.124.15赛特新材38.14-7.3513.449.8276.4613.0721.224.210.472.82四川美丰-14.84-20.372.491.0990.525.3225.242.240.5442.45新化股份-14.30-64.1911.217.1577.308.8438.401.760.729.55润禾材料37.9990.057.545.7568.678.9125.772.260.632.81建新股份-22.79-96.493.473.2168.9939.918.349.430.246.22康达新材29.8412.208.356.4478.98-9.5425.512.490.471.79贝斯美-36.38-77.741.501.20116.223.6518.533.550.213.00(三)主成分分析现在采用以下指标代码来表示以上指标名称:X1表示单季度营业总收入环比增长率,X2表示单季度净利润环比增长率,X3表示净资产收益率,X4表示总资产净利率,X5表示销售商品提供劳务收到的现金对营业收入比率,X6表示经营活动产生的现金流量净额对营业收入比率,X7表SEQ表\*ARABIC2相关矩阵分析表相关性变量XXXXXXXXXX相关X1.000.150.240.31-0.31-0.170.03-0.08-0.04-0.10X0.151.00-0.21-0.190.19-0.11-0.200.110.13-0.05X0.24-0.211.000.94-0.420.140.31-0.200.41-0.05X0.31-0.190.941.00-0.450.270.03-0.030.370.01X-0.310.19-0.42-0.451.00-0.17-0.09-0.09-0.060.18X-0.17-0.110.140.27-0.171.00-0.230.29-0.200.23X0.03-0.200.310.03-0.09-0.231.00-0.710.220.00X-0.080.11-0.20-0.03-0.090.29-0.711.00-0.32-0.23X-0.040.130.410.37-0.06-0.200.22-0.321.000.06X-0.10-0.05-0.050.010.180.230.00-0.230.061.00Sig(单侧)X1.000.210.100.050.050.180.450.340.420.30X0.211.000.130.160.160.280.140.280.250.39X0.100.131.000.000.010.230.050.150.010.39X0.050.160.001.000.010.080.430.430.020.49X0.050.160.010.011.000.190.320.320.380.17X0.180.280.230.080.191.000.120.060.140.11X0.450.140.050.430.320.121.000.000.120.50X0.340.280.150.430.320.060.001.000.040.11X0.420.250.010.020.380.140.120.041.000.37X0.300.390.390.490.170.110.500.110.371.00由上图十个原始变量间的简单相关系数矩阵可以看出,变量间约半数相关系数值大于0.3,即各个变量间大多存在较强相关关系,数据间存在较强的信息重叠,因原始变量的个数较多,我们可以将原始变量继续降维以进行分析。表SEQ表\*ARABIC3降维分析表KMO和Bartlett的检验取样足够多的Kaiser-Meyer-Olkin度量0.57Bartlett的球形度检验43.71145.1921.0045.000.000.00对上述是7个原始变量进行Bartlett球形度检验和KMO检验来判断变量之间是否具有相关性。Bartlett球形度检验和KMO检验来判断变量之间是否具有相关性。KMO统计量和巴莱特球形检验主要用于检验因子分析的适用性的检验。巴特利特球度检验与KMO检验主要用于因子分析适用性的检验。巴特利特球度检验依据对相关系数矩阵是否为单位阵的判断来确定原有变量是否适合做因子分析。巴特利特球度检验的检验统计量近似服从卡方检验,由上表数据得出巴特利特球度检验对应的显著性为0.000,说明各变量独立性建设不成立,即各变量之间具有较强的相关性,故因子分析巴莱特球形检验适用性检验可以通过。对于KMO检验而言,KMO检验统计量主要用于检验变量间的偏相关性,KMO检验统计量的取值在0-1之间。依据理论与实践的论证研究总结,KMO值越接近1,意味着变量间的相关性越强,原有变量适合做因子分析;当所有变量间的简单相关系数平方越接近0时,KMO值越接近0.KMO值越接近0,意味着变量间的相关性越弱,原有变量越不适合做因子分析。一般认为:当KMO值大于0.9时表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。上表显示原有变量KMO值为0.570,因子分析效果好,说明各变量之间存在一定程度的信息重叠,可以尝试降维进行因子分析。(四)因子提取图SEQ图\*ARABIC1各成分累计贡献率碎石图如图,是为模型各成分累计贡献率碎石图,我们可以看出前4个因子特征值显著的大于1,对解释原有变量贡献率大。第五个因子特征值与数值1较为接近,从第五个因子后各因子特征值开始逐次向下递减,且特征值显著小于1。折线图整体保持着平稳下降的趋势,最后归于平坦。这说明在第5个因子之后所包含信息较少,即成分1,2,3,4所包含信息较多,对于是否取第五个因子待定,需要进行进一步的检验。表SEQ表\*ARABIC4解释的总方差分析表成份初始特征值提取平和载入旋转平方和载入合计方差的%累计%合计方差的%累计%合计方差的%累计%12.7627.5827.582.7627.5827.582.5125.0825.0821.9819.7947.371.9819.7947.372.0520.5045.5831.4314.3161.681.4314.3161.681.3113.0758.6541.1711.7273.391.1711.7273.391.2212.2270.8750.959.4582.840.959.4582.841.2011.9882.8460.636.3389.1770.555.5294.7080.302.9997.6990.222.1699.85100.020.15100.00提取方法:主成份分析法。由上表可知,特征值比1大的因子数为4,且前四个因子的累计方差贡献率为73.393%。然而根据因子的累计方差贡献率确定因子数,通常选取累计方差贡献率大于0.80的特征值个数为因子个数。结合特征值判断法与累计方差判断法,团队决定除了选取特征值大于1的四个因子外,外加上特征是接近于1,且对因子累计方差贡献率做出较大影响的第五个因子。由于第五个因子的加入前五个因子的方差贡献率达到了82.84%.最终团队决定选取前五个因子来描述团队此前选中的30只指标优质的化工产品制造公司的投资价值总体水平。旋转后的五个因子各自的相对大小顺序仍然保持,累计方差贡献率没有改变,却重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献率,进一步佐证了选取的前五个因子已经足够描述我们选中的30只优质化工制造公司股票投资价值的总体水平。表SEQ表\*ARABIC5公因子方差分析法初始提取营业总收入环比增长率(%)1.000.91净利润环比增长率(%)1.000.77净利润环比增长率(%)1.000.91总资产收益率(%)1.000.93销售净现金流/营业收入(%)1.000.62经营净现金流/营业收入(%)1.000.74资产负债率(%)1.000.80流动比率(%)1.000.87总资产周转率(%)1.000.85应收账款周转率(%)1.000.88提取方法:主成份分析。如上表所示,对原有十个变量采用主成分分析法的方法提取了5个因子,可知因素的大部分信息是可以解释变量的,除了应收账款周转率的信息丢失较为严重(约40%),其余变量信息均可以得到70%以上程度的反应,说明以上5个因子对各项财务指标的解释能力较强,本次因子提取的总体效果很理想。(五)因子分析结果表SEQ表\*ARABIC6成份矩阵分析表成份矩阵a系数成份12345X0.930.160.040.10-0.11X0.860.380.050.20-0.03X-0.57-0.410.170.32-0.07X-0.390.81-0.140.05-0.21X0.46-0.690.10-0.330.03X0.060.610.590.090.11X-0.02-0.160.650.410.52X-0.28-0.04-0.510.640.13X0.51-0.33-0.070.56-0.40X0.360.12-0.59-0.040.65提取方法:主成份a.已提取了5个成份依据上图初始成分矩阵分析表,团队得出初始的因子载荷矩阵系数大小分布不集中,变量X1、X2在第一个因子上有较高的载荷,第一个因子极大的解释了上述变量。而变量X3、X表SEQ表\*ARABIC7旋转成份矩阵分析表旋转成份矩阵a系数成份12345X0.95-0.05-0.060.090.16X0.930.18-0.09-0.010.09X0.570.340.54-0.04-0.34X-0.530.090.360.22-0.39X-0.06-0.91-0.04-0.20-0.03X0.120.86-0.20-0.060.00X-0.16-0.200.820.000.19X-0.050.130.050.93-0.05X0.26-0.51-0.370.51-0.11X0.190.080.15-0.050.92提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。a.旋转9次迭代后收敛。依据上图可知,旋转后的因子载荷矩阵,各个公因子反映的载荷系数向0与1分离。五个公因子极大的解释了某一原变量,且原有变量的解释集中于一至两项公因子。如变量X1、X2、X3集中被第一个公因子所解释,第一个公因子对以上变量载荷率高。而这三个原变量集中体现了企业的盈利能力与运营能力,所以说明第一个公因子越大,企业运用水平与盈利能力越高。变量X5、X6、集中被第二个公因子所解释,第二个公因子在变量X5接下来对五个成分对各变量的解释程度进行分析,即生成成分得分系数矩阵分析表。如下表所示:表SEQ表\*ARABIC8成份得分系数矩阵分析表成份12345X1-0.01-0.130.640.070.17X0.370.030.00-0.02-0.04X-0.030.44-0.20-0.050.01X0.05-0.450.00-0.18-0.08X0.320.080.46-0.07-0.39X-0.160.050.250.16-0.25X0.12-0.25-0.220.39-0.08X-0.040.050.120.100.80X0.39-0.090.040.070.02X-0.040.080.070.780.11提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。依据上述数据结论,本文依托回归法来估计因子得分系数,从而得到因子得分函数。上表为依托SPSS软件与方差分析法所得到的成分得分系数矩阵,从而因子得分矩阵可以用是个原有变量财务指标线性表示,四个因子的得分函数如下:F1(公式1)F2(公式2)F(公式3)F(公式4)F(公式5)计算所选择30支优质股票的因子得分,结果如下:表SEQ表\*ARABIC9因子得分表序号公司名称FFFFF1恩捷股份-6.33-13.8911.5019.1346.582天赐材料1.95-16.8317.9622.5443.183两面针-18.14-1.15-4.219.0784.004龙蟒佰利-8.22-18.7214.3824.3668.585华鲁恒升-20.7910.824.09-2.5152.356三棵树-10.95-29.1613.9027.1565.277新宙邦-7.29-13.527.0616.4475.818正丹股份-47.89166.09-5.131.3375.659扬农化工-2.10-23.8818.0327.0274.2510鲁西化工-22.05-15.797.4916.1380.2111珀莱雅-8.58-16.779.4220.1181.7612安迪苏-8.54-14.835.7616.1286.1713联泓新科-11.38-19.8712.2123.3886.4814杭氧股份-4.18-19.3413.7921.3447.0815雅化集团-6.71-17.868.0816.9862.1216中核钛白-8.02-12.687.5416.1060.8517巨化股份-19.66-6.82-4.948.5290.2018彤程新材-3.88-16.2114.1521.4952.1219华谊集团-19.80-24.232.2218.5092.1520江南化工-8.54-18.069.1419.3671.8821华昌化工-16.264.477.6915.1944.9922亚邦股份-24.87-20.49-9.888.0397.2923赛特新材-3.43-11.6110.1117.4961.0024四川美丰-13.99-12.19-0.369.3370.7325新化股份-4.38-19.7211.7820.0159.8826润禾材料-7.53-7.846.6214.4454.4727建新股份-1.80-7.012.538.9361.6628康达新材-9.86-13.904.8315.0160.9229贝斯美-15.43-18.39-3.7110.9496.3030中核钛白-8.02-12.687.5416.1060.85接下来对于原变量进行综合评价,这里采用计算因子加权总分的方法,以上述五个因子的方差贡献率为权数。利用因子分析可以对各个因素的影响程度进行加权和综合评价,通过构造评价函数算出各个因子的综合影响程度。综合评价函数如下:F=0.30综合评价具体排名如下:表SEQ表\*ARABIC10因子综合影响程度排名表得分排名公司名称FFFFFF原序号1正丹股份-47.89166.09-5.131.3375.6536.9282扬农化工-2.10-23.8818.0327.0274.2511.0393珀莱雅-8.58-16.779.4220.1181.769.53114联泓新科-11.38-19.8712.2123.3886.489.52135安迪苏-8.54-14.835.7616.1286.179.49126赛特新材-3.43-11.6110.1117.4961.009.09237新宙邦-7.29-13.527.0616.4475.818.9578天赐材料1.95-16.8317.9622.5443.188.8329龙蟒佰利-8.22-18.7214.3824.3668.588.66410建新股份-1.80-7.012.538.9361.668.352711彤程新材-3.88-16.2114.152

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论