版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
量化投资投资的定义特定经济主体为了在未来可预见的时期内获得收益或资金增值,在一定时期内向一定领域投放一定数额的资金或实物的货币等价物的经济行为。投资回收期限短期投资长期投资资产性质货币性资产投资实物资产投资无形资产投资投资方式间接投资直接投资常见投资品种品种优点缺点股票操作简便,可能获得较高收益价格不稳定,风险较高债券收益稳定,风险相对较低收益率低,投资周期长基金交易灵活方便,风险相对较低成本相对较高,收益依赖于基金经理能力银行理财相对安全可靠,购买方便收益相对较低,灵活性较差贵金属可双向交易,交易时间灵活风险较高,交易规则和技巧复杂信托投资收益高,安全性较大流动性差,投资门槛高,程序复杂期货可双向、可加杠杆、可T+0交易风险较高,波动性较大,时间不连续本门课将以股票为主,但所用方法同样适用于债券和其他类别的资产投资的目的投资
目的本金
保值经常性收益资本
增值数据收集与处理策略设计与实现策略回测与分析策略上线与跟踪反馈提升量化投资的定义以数学模型替代(辅助)人为主观判断,利用计算机技术从庞大的数据中选出能带来超额收益的“大概率”事件以制定投资策略量化投资是一项系统性工程量化投资的误区量化投资一定是低风险,稳赚不赔风险和收益同源关键在于风控策略的设计与使用量化投资一定是全自动,速度一定要快自动交易vs辅助决策高频策略vs低频策略量化投资是神秘主义量化投资模型只是一种工具成功与否在于投资者是否真正掌握了量化投资的精髓全
自动低
风险速度快神秘量化投资的主要思想套利思想:买低卖高、低买高卖关键是寻找估值洼地:错误定价或估值的投资标的概率思想:挖掘并利用可能重复的历史(可能性)依靠投资组合(相关性)取胜风险不可避免,风险是由不确定性导致假设市场运行内在遵循一定规律,但外在现象会受各种因素影响而存在不确定性量化投资的特点科学性:利用大量历史数据,对模型有效性和适用性进行验证客观性:基于数据,利用模型做出决策,克服人性弱点系统性:建立资产配置、行业选择、精选个股等多层次的量化模型从宏观周期、市场结构、估值、成长等多角度进行分析通过全面、系统性的扫描,捕捉交易机会及时性:及时跟踪市场变化,不断发现能提供超额收益的交易机会分散化:依靠投资组合(分散性)来取胜,而不是一只或几只股票取胜量化投资vs.传统投资量化投资传统投资代表人物分析方法詹姆斯·西蒙斯依据模型沃伦·巴菲特依据人的经验与判断信息来源海量数据以及多层次多方面的因素(定量分析)基本面及宏观经济(定性分析)投资风格投资周期偏向短期投资周期偏向长期投资标的分散化投资于某一只或少量股票风险处理在风险最小化前提下实现收益最大化风险考虑不周全收益率对比:66%vs20%量化投资的主要内容量化投资的主要内容量化投资技术几乎覆盖了投资的全过程投资环节简介量化选股利用量化方法从原始股票池选择出待投股票集合量化择时通过对各宏微观指标的量化分析判断未来走势资产配置以不同资产类型作为投资标的,通过数学模型确定组合资产的配置目标和分配比例风险管控以识别和量化风险为基础,通过风险控制来提升投资质量投什么?什么时候投?怎么投?假设市场运行内在遵循一定规律,但外在现象会受各种因素影响而存在不确定性量化选股目标:选出“待投股票集”从所有可交易股票中,筛选出适合自己投资风格、具有一定安全边际的候选集合选股依据:基本面vs.技术面vs.基本面+技术面估值法假设:基本面决定价值,价值决定价格通过估值方法得出的公司理论上的股票价格(价值)与市场价格进行比较,判断股票的市场价格是否被高估或者低估多因子模型从不同角度采用多种“因子”来综合评估股票的还坏(涨跌)基本面指标,如PB、PE、EPS增长率等技术面指标,如动量、换手率、波动率等其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等待投股票
可交易股票量化择时目标:确定股票的具体买卖时机,其依据主要是技术面取决于投资周期或风格,例如中长线、短线、或超短线K线图法:K线图主要包含四个数据:开盘价、最高价、最低价、收盘价所有K线都是围绕这四个数据展开,反映标的状况和价格信息不同粒度:周K线、日K线、小时K线、分钟K线、tick级K线等常用策略:趋势跟踪(动量)、高抛低吸、横盘突破等事件驱动法:根据离散的事件调整投资组合仓位主力资金流入、市场情绪变化、政策文件、突发事件等资产配置目标:根据投资需求,将拟投资金在不同的资产类别和标的之间进行分配,进而构造出一个相应的投资组合基于经验的配置方法利用先验知识分析各资产对组合的贡献和影响,进而确定各资产在组合中的权重常用方法:等权法、市值法、市价法等基于模型的配置方法根据理论或模型来量化投资风险和效用,将资产配置问题转化为最优化问题,并通过优化求解来确定投资组合配置常用方法:均值方差模型、最优化夏普比率模型等风险管控基本思想:以识别和量化风险为基础,通过风险控制来提升投资质量风险管理:包括对风险进行定义、测量、评估和控制关键:识别、分析、接受或减轻投资决策中的不确定性风险控制:手段:对风险因素和敞口实施有目的地选择和规模控制目的:提高收益的质量和稳定性常用方法:基于市场因子暴露的对冲、基于VaR控制等量化投资的理论发展20世纪50~60年代Markowitz组合模型1952年Markowitz建立均值-方差模型将数理工具引入投资组合研究,标志着现代投资组合理论的开端CAPM模型(CapitalAssetPricingModel,CAPM)在Markowitz工作基础上,Sharpe(1964)、Litner(1965)、Mossin(1966)研究了资产价格的均衡结构导出资本资产定价模型CAPM,是现代金融市场价格理论的支柱有效市场假说(EfficientMarketHypothesis,EMH)Samuelson(1965)与Fama(1965)提出有效市场假说EMH包括理性投资者、有效市场和随机游走,是现代资本市场理论的重要基石20世纪70~80年代B-S模型(Black-ScholesOptionPricingModel)1973年,Black和Scholes建立了期权定价模型(BS模型)为期权、债券等新兴衍生金融市场的各种以市场价格变动定价的衍生金融工具的合理定价奠定了基础APT理论(ArbitragePricingTheory,APT)1976年,Ross建立了套利定价理论APT利用因素模型描述资产价格的决定因素和均衡价格的形成机理20世纪90年代倒向随机微分方程(巴赫杜-彭方程)求解:促进期权定价理论的研究为将来设定了某个目标,那么根据现在的能力、财力能否达到?如何达到?问题关键,不是从现在向将来分析,而是由将来向现在推导,这就是倒向随机分析倒向随机微分方程求解:通过确定策略的制定逐步把不确定性抵消,把风险规避掉VaR模型(ValueatRisk,在险价值)在一定置信度下,某一投资组合价值在未来特定时期内的最大可能损失G30建议用VaR来衡量衍生工具的市场风险,并认为是市场风险测量和控制的最佳方法SEC要求美国公司采用VaR模型作为三种可行的披露其衍生交易活动信息的方法之一行为金融学兴起80年代对金融市场的大量实证研究发现了许多现代金融学无法解释的异象为解释这些异象,一些金融学家将认知心理学的研究成果应用于对投资者的行为分析量化投资的代表企业与人物量化投资的代表企业文艺复兴科技公司(RenaissanceTechnologies):成立于1982年,是量化投资领域的先锋以大量数据为基础,利用数学模型和计算机技术进行投资决策员工中超过1/3拥有数学、物理学、统计学等基础科学的博士学位创世人詹姆斯·西蒙斯更是一位著名的数学家文艺复兴旗下的大奖章基金年化收益远超巴菲特桥水对冲基金(Bridgewater):成立于1975年,是世界上最大的量化对冲基金之一多种创新投资策略的先锋者,例如分离Alpha和Beta策略、绝对Alpha策略、风险平价策略等量化投资的代表人物“最赚钱的基金经理”——詹姆斯·西蒙斯文艺复兴科技公司创始人,2018年个人净赚16亿美元管理的大奖章基金从1989到2009平均年收益率达38.5%在扣除5%的管理费和44%的超高业绩报酬的基础上得出净回报率远超过巴菲特的20%自诩为“模型先生”:采用数学模型和计算机技术进行投资决策西蒙斯遵循量化投资理念:市场整体有效,但短暂或局部会无效利用历史资料发现统计相关性捕捉短线获利机会量化投资的代表人物“定量分析之王”——大卫·肖(DavidShaw)1988年,以2800万美元在纽约创立德劭集团建立寻找隐藏的市场趋势或定价异常的数量模型两度当选美国总统科学与技术顾问委员会委员20年中,所管理的基金规模敏捷膨胀,年均回报率达20%巅峰时期的生意量可以占到整个纽约证券生意的5%“一流的学者,用真正的科学在做生意”一位科班出身的计算机专家在50岁生日宴上,肖抉择重回科研领域,进行学术研究基本假设与基本原则基本假设与原则基本假设:假设1:市场在大多数情况下是有效的假设2:量化分析能够创造统计套利机会基本原则:原则1:有效利用所有可得信息原则2:利用因果关系避免统计陷阱市场有效性与量化投资市场有效性与量化投资市场在大多数情况下是有效的客观事实:1980~2000年,仅有18%的美股基金跑赢标普500指数主动投资经理的信仰:“市场有时是无效的”,值得进行主动投资纯套利机会是不存在的市场无效并不会带来纯套利机会,而是统计套利机会风险与收益同宗同源强式有效价格已反映所有信息:公开和非公开信息内幕信息无效半强式有效价格已反映所有可获得的公开信息技术和基本面都无效弱式有效价格已反映历史价格中可获得的信息技术分析无效有效市场假说技术分析:以市场行为(价格、交易量等)为研究对象,以判断并跟随市场趋势变化来进行投资决策基本面分析:通过经济或业务数据来寻找市场变动的原因根据股票价格对市场信息的反映程度,市场可分为三种有效水平市场异象市场异象:有效市场假说无法解释的价格序列中持续存在的规律性模式投资专家与学者发现了一些与有效市场理论相矛盾的异象造成异象的可能原因:信息不对称,收集信息需要成本制度(例如T+1、做空困难)阻碍了投资者按照某种信息行动非理性决策:过度自信、从众心理、锚定效应等=>行为金融弱式有效市场异象弱式有效市场的检验方法试图确定个股的历史价格是否能够被用于预测未来的价格自相关异象:不同频率股票收益率(如周、月、季)是否存在不同的自相关日历效应:1月效应(欧美市场)、2月效应(中国市场)、节假日效应动量模式异象:上一期表现优异的股票下一期还能够获得正的超额收益弱式有效:当前价格已经反映所有历史价格所包含的信息,技术分析无效半强式有效市场异象规模效应:小盘股(小市值)组合的平均收益率高于大盘股组合,也称“小盘股效应”账面市值比(B/M)效应:价值投资高B/M(价值型公司)组合的平均收益率高于低B/M股票组合市盈率(P/E)异象低市盈率股票的股价表现优于高市盈率股票投资水平异象投资水平较高的公司的股票未来收益率较高盈利惊喜异象:露高于预期盈利的股票在公告后倾向于获得风险调整后的超额收益率半强式有效:股票价格已经反映可获得的公开信息,技术和基本面分析无效P/E=每股市场价格÷每年每股盈利每股盈利不变且派息率为100%,经过多少年投资可通过股息全部收回强式有效市场异象内部交易者检验:假设公司高管及其内部人士比外部人士更了解公司的经营和财务情况因此外部人士跟着内部人士买卖该股,就能获得风险调整后的超额收益市商检验:以其自有资金和证券与投资者进行证券交易,通过买卖报价的适当差额获利买卖双方不需等待交易对手出现,只要有做市商出面承担交易对手方即可达成交易限价委托单簿包含潜在买家和卖家准备买入和卖出该股的价格获得限价委托单簿其实就相当于获得了非公开信息若其高获利来自于利用这种信息,则做市商的获利就是市场非强式有效的信号强式有效:股票价格已经反映所有信息(公开和非公开),内幕信息无效事件发生后时间(天)CAR(%)有效市场与量化投资实际市场并非完全有效,导致市场上存在大量套利机会一些投资者的投资逻辑是基于感性认识而非对信息的逻辑理解经济环境、科技环境一直在变化,人们需要花时间来接受这些改变获取信息是需要成本的,并非所有人都愿意为信息支付成本息,即使是公开信息,在市场的传播也特别的缓慢不是每一个投资者都有能力处理大量的信息,特别是量化信息过过滤公开信息,一些投资者能够创造出相当于非公开信息的信息格罗斯曼-斯蒂格利茨悖论:由于存在信息成本,市场效率和竞争均衡不相容。收集信息需要付出成本,所以价格不能反映所有信息,否则收集信息的人将没有任何动机进行信息收集,但这将导致价格无法反映出所有可得信息。所以市场必须要允许收集信息的人赚取一定的回报,即通过信息优势赚钱。投资者收集信息信息影响价格市场变得有效信息没有价值投资者不愿收集信息收集信息需要成本矛盾有效市场与量化投资实际市场并非完全有效,导致市场上存在大量套利机会一些投资者的投资逻辑是基于感性认识而非对信息的逻辑理解经济环境、科技环境一直在变化,人们需要花时间来接受这些改变获取信息是需要成本的,并非所有人都愿意为信息支付成本信息,即使是公开信息,在市场的传播也特别的缓慢并不是每一个投资者都有能力处理大量的信息,特别是量化信息通过过滤公开信息,一些投资者能够创造出相当于非公开信息的信息市场无效并不会带来纯套利机会,而是统计套利机会基本法则与信息准则基本假设与原则基本假设:假设1:市场在大多数情况下是有效的假设2:量化分析能够创造统计套利机会基本原则:原则1:有效利用所有可得信息原则2:利用因果关系避免统计陷阱基本法则原则1和假设2指出:只要所用的方法和模型能够有效结合所有可获得的信息那么量化分析就能提供统计套利机会的可能性套利:狭义套利:通过以两种不同价格买卖(买低卖高)同一或同价值商品来获利
例如:配对交易、股指期货套利、商品期货套利等广义套利:通过低买高卖来获利,包括对同一标的低价买入后高价卖出统计套利:基于历史数据,通过统计分析发掘稳定、可靠的套利机会
即有较大概率会重复发生的套利模式,例如:各种金融异象基本法则
机会多看得准高收益信息准则
避免忽略一些重要信息避免引入一些无用信息避免重复利用冗余信息量化投资中的统计学问题基本假设与原则基本假设:假设1:市场在大多数情况下是有效的假设2:量化分析能够创造统计套利机会基本原则:原则1:有效利用所有可得信息原则2:利用因果关系避免统计陷阱相关关系vs因果关系数据中存在大量相关关系,其中也不乏伪相关坚实可靠的因果关系和理论是获取超额收益的关键相关关系一个变量的变化受另一个或几个变量的制约因果关系平行关系两个变量共同受另外一个因素的影响动物的生长速度受遗传、营养等影响子女的身高受父母身高的影响人的身高和体重之间的关系兄弟身高之间的关系二氧化碳与肥胖症20世纪50年代,观察大气层二氧化碳的含量和肥胖症人口的数量变化发现二者相关性较强,都出现明显增长似乎二氧化碳含量的增加会导致人类的肥胖实际原因:汽车业发展,汽车尾气排放增加,导致二氧化碳浓度上升同时人们使用汽车作为代步工具,走路活动时间变少,自然越来越胖计算机博士与商场营收美国计算机科学位博士授予人数与美国商场总营业收入时序图模型参数的稳定性量化模型应当反映持续稳定的模式假设:历史会重演量化模型都是基于历史数据来对未来进行预测即假设历史会重演,并假设模型的参数具备一定的稳定性统计陷阱:在历史数据上拟合效果好的模型不一定是一个好模型(伪相关)市场的不断变化会打断持续的历史模式:CEO、产品、市场环境以及法律法规等都会发生变化需要确定随着时间的推移,估计的参数是否能够保持稳定如果历史模式发生改变,要及时进行参数更新经典策略与系统神奇公式神奇公式选股模型基本思想:用便宜的价格购买好公司的股票通过综合考虑“便宜程度”和“好坏程度”对股票进行排序和筛选便宜程度:通常用价格(容易获取)和价值(难以获取)比值进行度量可用其盈利能力(例如每股收益)来间接度量其价值,例如市盈率PE企业好坏:能否产生价值并创造较高的投资回报常用指标:资本回报率(ROIC)、净资产收益率ROE、资产净利率ROA等好
公司股票便宜高性价比股票神奇公式选股模型公司排序:将目标公司的“便宜程度”和“好坏程度”全部计算出来然后,按照便宜程度和好坏程度进行排序打分:
如果是1000家公司,最好的是1000分,最后一名就是1分每个公司的最终分值就是两个数字相加最后按照最终分数来排序,挑选前n佳公司来投资投资策略与步骤:1、确定股票池。进行初步筛选,去除部分明显不良的股票(例如ST股票)2、精选标的。按神奇公式进行打分排序,并选出前n只股票(神奇公式
股票)3、分批建仓。第一次投入总资金20%~33%,每隔两三个月再投入20%~33%4、定期调仓。每只股票在持有一年后都将被卖出,买入新的神奇公式股票欧奈尔选股法则欧奈尔选股法则:CANSLIMCANSLIM是一个结合基本面和技术面的选股模型,一种多因子模型欧奈尔研究1953至1993年500家年度涨幅最大股票,得出“七步选股法”美国个人投资者协会用5年时间(1998~2002),对各种选股系统的业绩进行比较分析:无论是在牛市还是熊市,CANSLIM都是最稳定、表现最好的系统之一。欧奈尔选股法则:CANSLIMCANSLIM是一个结合基本面和技术面的选股模型,一种多因子模型欧奈尔研究1953至1993年500家年度涨幅最大股票,得出“七步选股法”C(Currentearnings):上市公司近一季的每股收益率超过20%A(Annualearning):上市公司年净利润持续增长三年以上N
(Newproduct):上市公司有重大创新或突破,如新业务、新产品、新技术等S
(SupplyandDemand):公司流通股一般不多于2500万股L
(Leader):上市公司为行业领导者,该股能引领市场走势I(Institutionalsponsorship):机构投资者对股票热捧M(Marketdirection):股市为牛市或震荡市,但绝非熊市“Buystocksinprofitablecompanies,withgreatproducts,ingrowingmarketsattherighttime.”配对交易策略配对交易基本思想:找出历史走势相近(相关性高)的股票或其他投资标的进行配对当价差明显偏离历史均值时,做空相对高估股票同时买入相对低估的股票等待他们回归到长期均衡状态,由此赚取价格收敛的报酬本质:利用配对间的短期错误定价,通过买入相对低估,卖空相对高估一种动量反转投资策略,利用股票价格均值回归配对交易:配对形成期目标:选股寻找历史走势相近(相关性高)的股票或其他证券进行配对步骤:行业划分:为保证股票对在主营业务上相近,在同一行业内筛选收益率相关性检验:配对股票历史收益率相关系数大于一定的阈值序列协整性检验:价差(或价格比)具备围绕均值上下波动的平稳性价差形态过滤:要求价差回复到均值的速度足够快,最好交替相对走强配对交易:配对交易期
配对交易:建仓与平仓
配对交易:建仓与平仓动量策略vs.反转策略经济学解释行为金融:羊群效应:羊群建立(动量)、羊群解散(反转)信息反应:反应不足(动量)、反应过度(反转)企业成长和发展:马太效应,强者愈强、弱者愈弱(动量)周期性变化,日中则昃,月满则亏(反转)动量vs.反转动量效应:前一段时间强势的股票,在未来一段时间继续保持强势反转效应:前一段时间弱势的股票,在未来一段时间会变强动量策略:寻找前期强势的股票,判断它将继续强势后买入持有反转策略:寻找前期弱势的股票,判断它将出现逆转后买入持有典型应用:择时动量和反转策略的思路可应用于很多量化投资场景中择时:高抛低吸(反转)和横盘突破(动量)配对交易标准建仓是以动量反转策略为基础延后建仓则是以动量策略为基础行业轮动美林投资时钟模型宏观经济周期波动是行业轮动背后核心驱动力行业配置的标准思路美林投资时钟模型美林证券基于对美国历史数据的研究,将经济周期与资产轮动及行业策略联系起来,提出“美林投资时钟”阶段时间产出缺口超势通胀趋势阶段定性阶段时间产出缺口超势通胀趋势阶段定性197001-197012下降下降衰退199612-199902上升下降复苏197012-197206上升下降复苏199902-199911上升上升过热197206-197306上升上升过热199911-200105下降上升滞胀197306-197412下降上升滞胀200105-200206下降下降衰退197412-197503下降下降衰退200206-200303下降上升滞胀197503-197612上升下降复苏200303-200403上升下降复苏197612-197811上升上升过热200403-200509上升上升过热197811-198003下降上升滞胀200509-200708上升下降复苏198003-198212下降下降衰退200708-200807下降上升滞胀198212-198307上升下降复苏200807-200906下降下降衰退198307-198403上升上升过热200906-201011上升下降复苏198403-198612上升下降复苏201011-201109上升上升过热198612-198901上升上升过热201109-201504上升下降复苏198901-199011下降上升滞胀201504-201603下降上升滞胀199011-199112下降下降衰退201603-201912上升下降复苏199112-199405上升下降复苏201912-202006下降下降衰退199405-199612上升上升过热202006-202009上升上升过热其他投资时钟模型库兹涅茨周期:美国经济学家西蒙·库兹涅兹在1930年提出反映经济基本面的长期趋势对应于20年左右的长周期朱格拉周期:法国经济学家克里门特·朱格拉在1862年提出反映市场的整体估值水平对应于10年左右的中周期基钦周期:美国经济学家约瑟夫·基钦于1923年提出反映市场的牛熊趋势对应于40个月左右的短周期,是把握短期市场涨跌的重要依据多周期嵌套多因子模型策略模型建立过程候选因子因子有效性检验冗余因子
剔除综合评分
模型构建选股模型验证原则:有效利用可得信息避免忽略一些重要信息避免引入一些无用信息避免重复利用冗余信息候选因子选取基本面因子:股票自身可观察的特征,可通过财务报表(或简单计算)获得例如:净利润、每股收益EPS、市盈率PE、市净率PB等技术因子:以市场行为为研究对象,例如:动量、换手率、波动等经济因子:影响企业营销活动的一个国家或地区的宏观经济状况例如:GDP、CPI、通货膨胀率、失业率、利率等其他指标:预期收益增长、分析师一致预期变化等各种已知的和潜在的市场异象因子因子有效性检验零投资组合检验法:(针对打分法)根据因子打分排序,将股票平均分为n个组构建零投资组合:等金额买入第1组股票并卖空第n组股票计算零投资组合的超额收益率,评估因子的有效性统计相关检验法:(针对回归法)计算因子与超额收益率之间的相关度相关度(相关系数的绝对值)越大,因子越有效
大市值股票期望收益率(1/3)
中市值股票期望收益率(1/3)
小市值股票期望收益率(1/3)冗余因子剔除动机:由于内在驱动因素相同等原因,一些因子具有较高一致性基本思想:剔除冗余因子,只保留同类因子中收益最好、区分度最高的一个冗余度(共线性)计算:相关分析法:相关系数打分法:分组收益率分析分组收益率相关分析:针对每个因子,按因子值大小对股票进行排序,并将股票分为n个组根据收益率对各组合进行打分(n,n-1,…,1),收益越大,分值越高按给定周期(例如:月)计算个股的不同因子得分间的相关性矩阵综合评分模型建立和选股打分法:(例:神奇公式)先单独根据每个因子进行打分,再进行加权求和得到总分根据总分排序选股,例如得分前10%或最高的50~100只股票回归法:用历史数据学习回归方程,再用其对未来收益率进行预测根据收益率预测值排序(选TopN)或是阈值截断进行选股模型评价及持续改进动机:随着使用者不断增加,有效因子将逐渐失效随着环境变化,有效因子变得无效,另一些变得有效改进(再平衡)方法:定期(例如:每月)vs
事件驱动对因子进行评价,对模型进行改进根据新结果调仓,以适应市场变化候选因子因子有效性检验冗余因子
剔除综合评分
模型构建选股模型验证策略回测思想与目的基本思想通过历史数据,尽可能还原实际交易过程,对策略进行验证和优化目的通过交易模拟找出策略中的缺陷和问题,并依据回测结果进行优化分析并确定策略中的合理假设,以及策略可能的应用场景和适用范围通过分析比较不同(参数)设置下的策略表现,帮助确定策略最优设置策略
回测缺陷&优化假设&应用参数
设置基本假设与流程基本假设:历史会重复使用历史数据进行测试的结果可用来评估策略在未来市场上的应用效果在历史数据上不能盈利的策略在未来一般也很难盈利在历史数据上表现优秀的策略在未来很可能也会带来较好的收益一般流程:策略实现、目标与范围设定、数据收集与处理、策略运行、结果分析、策略调整等环节常用平台与工具回测工具与平台主要功能:提供基础(功能)接口和(历史)数据模拟交易流程,执行交易策略,评估策略性能常用平台与工具:在线平台:聚宽、优矿、掘金、万矿等离线平台:
Backtrader、BigQuant、zipline、vn.py等工具库:TALib、QuantLib、PyQL、quantdsl等聚宽Joinquant服务:
1.选取参数,自动生成策略
2.可以自己编写代码,生成策略(有代码显示)
语言:
Python,R
数据库:
股票、基金、指数、股指、股票财务数据、金融期货数据、行业概念数据、宏观经济数据等
支持的功能:日级、分钟级、tick级的回测与模拟交易
优势:
1.支持回测中访问网络
2.社区活跃,还有销售策略活动
策略基本框架策略基本框架:初始化+迭代执行初始化:策略开始运行前要做的事,如初始化全局变量、资产和数据范围等迭代执行:周期循环:策略开始后,每个周期要做的事,判断是否交易以及如何交易事件驱动:策略开始后,设定的事件发生时执行,判断是否交易以及如何交易回测过程流程:准备好策略,实现handle_data函数初始设置:回测起止日期、初始资金、调仓间隔(如每天)、股票池开始回测(循环迭代)策略引擎根据选择的股票池和日期,取得股票数据,然后定期(如每天)调用handle_data函数在handle_data同时告诉用户现金、持仓情况和股票在上一天的数据.在函数中,用户还可以调用函数获取任何多天的历史数据,然后做出调仓决定当用户下单后,策略引擎会根据实际交易情况处理订单说明:可以在handle_data中调用record()函数记录某些数据,引擎会以图表的方式显示在回测结果页面用户可以在任何时候调用/debug/warn/error函数来打印一些日志回测结束后,引擎会画出用户收益和基准收益的曲线,列出每日持仓,每日交易和一系列风险数据神奇公式选股模型公司排序:将目标公司的投资回报率和收益率全部计算出来然后,按照投资回报率和收益率排序打分:
如果是1000家公司,最好的是1000分,最后一名就是1分每个公司的最终分值就是两个数字相加最后按照最终分数来排序,挑选前n佳公司来投资投资策略与步骤:
1、按投资回报率和收益率合并后排序的前n个公司,买入其股票
2、在第一次投入投资金额的20%到33%
3、每隔两三个月按照步骤一去投资买入
4、持有一种股票满一年后就将其卖出,不管是否盈利
5、用卖股票的钱和新增投资买入神奇公司股票,替换已卖出的公司好
公司股票便宜高性价比股票神奇公式:实现思路预处理选定股票列表范围(原始股票池),去除部分股票如:在沪深成分股中去除长期低PE股票(银行、钢铁、煤炭)和ST股票股票排序选定投资回报率和收益率的评价指标,例如:ROE和1/PE计算股票池中每只股票的ROE和1/PE,排序和挑选分数排在前十的股票分批建仓第一年的每季度重新获取满足条件股票,对新股按照原始仓位的25%建仓定期调仓每个季度检测股票是否已持仓满一年,如果是则卖出这只股票用卖股票的钱和新增投资买入同等资金的神奇公司股票止损策略在检测股票持仓时间时,强制卖出亏损超过10%的股票关键代码神奇公式defget_stock_list(context,today):#获取股票池security_list=st_filter(security_list)year=context.current_dt.yeardf=get_fundamentals(query(valuation.code,indicator.roe,#ROE净资产收益率ROE(%)valuation.pe_ratio,#PE市净率).filter(valuation.code.in_(security_list)),
statDate=str(year-1))#用前一年的数据计算(统计)指标#以股票名词作为indexdf.index=df['code'].valuesdf['1/pe']=1/df['pe_ratio']#获取综合得分df['point']=df[['roe','1/pe']].rank().T.apply(f_sum)name_list=list(map(lambda
x:get_security_info(x).display_name,df[['code']].values.flatten()))df.insert(0,'name',name_list)#按得分进行排序,取10只股票df=df.sort_index(by=['point'],ascending=False).head(N)['code’]returnstock_list回测结果86开源回测引擎:backtraderbacktrader简介开源的Python量化回测框架(支持实盘交易)品种多:股票、期货、期权、外汇、数字货币周期全:Ticks级、秒级、分钟级、日度、周度、月度、年度速度快:支持pandas矢量运算、多策略并行运算组件多:内置Ta-lib指标库、PyFlio分析、alphalens多因子库等扩展灵活:可集成TensorFlow、PyTorch等机器学习模块安装简单:
在pythonconsole中键入“pipinstallbacktrader”社区活跃、帮助文档齐全回测主体:Cerebro策略类:Strategyinit(
):
数据初始化、指标计算notify(
):监控回测状态,状态变动时被自动调用next(
):单位时间间隔调用,负责逻辑判断,生成买卖信号,发出订单请求回测引擎框架逻辑if__name__==‘__main__’:
#1.创建回测实体
cerebro=bt.Cerebro()
#2.添加策略
cerebro.addstrategy(TestStrategy)
#3.添加数据
filepath='./data/000001.csv'
#本地数据文件
dataframe=pd.read_csv(filepath,index_col=0,parse_dates=True)#读入数据
dataframe['openinterest']=0#添加一列,使传入数据符合框架要求
data=bt.feeds.PandasData(dataname=dataframe,#设置回测起止时间
fromdate=datetime.datetime(2013,1,1),
todate=datetime.datetime(2015,1,1))
cerebro.adddata(data)回测主体:主函数main#4.策略流程配置
cerebro.broker.set_cash(10000)#设置回测金额
cerebro.addsizer(bt.sizers.FixedSize,stake=100)#设置买卖股数或金额比例
cerebro.broker.setcommission(commission=0.001)#设置手续费#5.添加分析器
cerebro.addanalyzer(bt.analyzers.AnnualReturn,_name=‘AnnualReturn’)#年回报率
#6.运行策略
results=cerebro.run()
#7.取出回测指标结果
st0=results[0]
#索引1、2…
Annual_Return=st0.analyzers.AnnualReturn.get_analysis()#8.可视化展示
cerebro.plot()回测主体:主函数main(续)1.数据获取将时间序列称作lines(时间线)由adddata()将数据传入策略若只回测一只股票,则用data=self.data若对一个股票池进行回测:data=self.datas[k]#股票池中第k支股票数据2.技术指标计算写策略时,有时需要一些技术指标,例如MACD/KDJ/ROC等,在初始化函数中计算方法一:利用自身指标backtrader.indicators方法二:利用指标库Ta-lib中的方法classTestStrategy(bt.Strategy):
def__init__(self):
#初始化函数,策略循环前被调用
defnotify_order(self,order):
#订单监视函数
#监视订单变动状态
defnext(self):
#策略核心部分
#编写生成买卖信号的逻辑策略类:初始化函数def__init__(self):
self.close=self.data.close#获取股票的收盘价时间序列
self.macd=bt.ind.MACD(self.data.close)#计算MACD均线
self.order=None
#TokeeptrackofordersclassTestStrategy(bt.Strategy):
def__init__(self):
#初始化函数,策略循环前被调用
defnotify_order(self,order):
#订单监视函数
#监视订单变动状态
defnext(self):
#策略核心部分
#编写生成买卖信号的逻辑next()函数策略类核心组成部分;策略回测开始后,每前进一个时间单位,则next()将被调用一次,直到回测结束;以MACD均线(择时)策略为例:当MACD均线由下上穿零线时视为买入信号;
当MACD均线由上下穿零线时视为卖出信号策略类:next()函数defnext(self
):
position=self.positionor0#持仓数量
#上穿零线
ifself.macd[-1]<0.0andself.macd[0]>0.0:
self.order=self.buy()#生成买入订单
#下穿零线
ifself.macd[-1]>0.0andself.macd[0]<0.0:
ifposition>0:#有持仓
#生成卖出订单
self.order=self.sell(size=position)#5.添加分析器
cerebro.addanalyzer(bt.analyzers.AnnualReturn,_name='AnnualReturn')#年回报率
#6.运行策略
results=cerebro.run()
#7.取出回测指标结果
st0=results[0]
Annual_Return=st0.analyzers.AnnualReturn.get_analysis()Analyzer:分析器分析器:Analyzers回测陷阱信息泄露信息泄露:前视偏差回测中使用未来数据或信息进行分析和预测,并据此辅助当前投资决策全样本训练:使用全部样本训练策略模型,再使用其中的部分数据进行策略性能评估导致模型效果看起来很完美未来函数:获得并使用了当前无法获知的未来数据例:若当天收盘价大于开盘价就买入,若当天收盘价小于开盘价就卖出解决方案:将历史数据分为样本内数据和样本外数据,分别用于策略构建和性能评估利用回测平台模拟历史数据和事件的发生,发现并避免未来函数不可能成交价格与份额不可能成交价格偷价:利用过去的价格进行交易,例用前一日收盘价购买股票涨停买入,跌停卖出:大量资金涌入或流出忽略滑点和冲击成本(交易成本)不可能成交份额购买超出实际可购买的市场份额,例购买100万股只有10万流通股的股票政策限制:购买量达发行总量5%时,需要发布公告,并向监管部门报备解决方案:将涨停、跌停等特殊日期设置为不可交易日在回测中限制交易量与资产总额的比重根据具体市场和投资标的适当地添加一定比例的交易成本过拟合回测是基于历史数据,但历史数据的样本是有限的一个荒谬的模型,只要足够复杂,可以完美适应数据过拟合:在样本内数据上的误差越来越小,数据拟合效果越来越好在样本外数据上的误差(策略模型的泛化误差)却越来越大解决方案:根据奥卡姆剃刀原理,尽可能简化策略模型可以通过因子选择、正则化等技术来简化模型基础理论与资产配置资产配置
资产1
𝑤1=10%资产2𝑤2=20%资产3
𝑤3=25%资产4
𝑤4=9%…资产n
𝑤𝑛=16%
方法分类基于经验的方法利用一些先验知识或假设来分析各资产对组合的贡献和影响进而据此确定各资产在组合中的权重常用方法:等权法、市值法、市价法等基于模型的方法根据一些金融理论或模型来量化投资风险和效用在此基础上将资产配置问题转化为一个最优化问题利用一些优化求解方法确定最优的投资组合配置常用方法:均值方差模型、CAPM模型等基于经验的配置方法
Markowitz投资组合模型最优投资组合理论目标:给定投资者,在可得的各种可能投资组合中,寻找效用期望值最大的组合假设:投资者希望财富越多越好,效用是财富的函数,财富是投资收益率的函数
投资者效用可用收益率函数表示投资者都是不知足的和风险厌恶的,遵循占优原则(Dominancerule)同一风险水平下,选择收益率较高的资产
同一收益率水平下,选择风险较低的资产投资收益率的概率分布为正态分布收益风险最优投资组合理论
收益风险确定有效前沿
最优配置
基于MV模型的量化投资策略
资本资产定价模型CAPM基本假设主要思想:如果市场中所有的投资者都遵从Markowitz资产组合投资理论则CAPM可以给出证券市场中某一证券或某一证券组合的一致预期收益率基本假设除了马科维茨投资组合理论的基本假设,还包含如下附加假设存在大量投资者,个体影响甚微,只是价格接受者,其交易行为不影响证券价格所有投资者都采用Markowitz投资组合模型:追求在给定收益率下的方差最小化所有投资者都是同质预期的,即:对证券的评价和预期一致投资者可在固定无风险利率基础上无限制的借入或贷出任何额度的资金无交易摩擦:所有资产都可完全无限制的细分,且买卖证券时无交易成本及税赋核心结论
CAPM模型公式解读
Cov(X,Y)=E[(X-μX)(Y-μY)]
夏普比率SR
基于CAPM模型的量化投资策略
案例:投资组合
指标策略目标股票A比例股票B比例组合期望收益率组合标准差最大化投资者效用44.46%55.54%5.67%3.09%最小化方差82.26%17.74%4.53%1.56%最大化夏普比率72.63%27.37%4.82%1.70%保守型投资者,希望风险最小,可以选择最小化方差策略能够承担一定风险,但难以确定风险厌恶系数的投资者,可以选择最大化夏普比率策略既能承担一定风险,又能确定风险厌恶系数的投资者,可以选择最大化投资者效用策略风险度量与模型风险的定义风险是一个抽象的概念:损失、不确定性经济学家认为风险在个人偏好(效用)中体现:一个人认为有较高风险的投资在另一个人眼中可能只有较低风险投资管理(多方参与)需要一个不受主观偏好影响的风险定义:假设风险是客观存在的并且可以用客观的尺度来度量
风险定义的条件适合量化投资的风险定义与度量应满足:灵活性、便利性、可解释性应用的灵活性:定义的风险要既适用于个股又适用于投资组合可用于讨论过去的历史风险,也可对未来任意时期的风险进行预测计算的便利性:可从各资产风险自下而上构建出投资组合的风险,便于计算所有可能组合的风险交流的可解释性:便于不同参与方之间进行交流和解释投资中的风险收益风险风险定义的本质投资风险的来源:投资收益率的不确定性收益率的概率分布:描述了所有可能结果的概率可以回答关于收益率和概率的所有问题可以作为对未来收益率的预测,也可作为对已实现的收益率的概述可应用于各种投资类型:股票、债券等缺点:分布过于细致复杂,不实用需单一的、可反映整个收益率分布在风险方面的特征:方差、损失概率等方差
标准差
半方差(下行风险)
收益率d1d2d3d4d5半方差目标方差下行风险目标下行风险股票A2.25%-1.27%2.38%1.83%-4.23%0.029%0.035%1.71%1.88%股票B-2.25%1.27%-2.38%-1.83%4.23%0.054%0.049%2.33%2.21%t=0
损失概率定义:收益率落在目标值以下的概率举例:某基金月度收益率低于-10%的概率为3.4%优点:接近人们对风险的直观感受缺点:定义模糊,统计属性不熟知依赖于投资者的个人偏好(目标值的设定)难以预测,并且随目标值的下降变得越来越困难极端情况:对特大损失发生概率的预测受到个别观测值的影响收益率d1d2d3d4d5损失概率(t=0)目标损失概率(t=2%)股票A2.25%-1.27%2.38%1.83%-4.23%0.40.6股票B-2.25%1.27%-2.38%-1.83%4.23%0.60.8胜率
=1–损失概率风险值VaR
VaR值1-
损益接受域
置信水平最大回撤
风险指标统一表示
参数THkq方差21标准差21/2半方差21下行风险21/2目标半方差21目标下行风险21/2损失概率001目标损失概率01年化风险
主动风险
残差风险
整体总风险=系统(市场)风险+残差风险基础风险模型协方差矩阵
历史样本模型基本思想:利用历史收益率估计协方差矩阵V中的每一项用T个时期的样本来估计N*N的协方差矩阵优点:模型思想直观、简单缺点:不能快速反映公司不断变化的基本面,特别是出现并购拆分等重大事件时依赖于历史数据的样本方差和样本协方差,这种估计既不稳健也不合理
(当N较大时,缺少足够历史数据)隐含假设:各种风险一直保持不变单因子模型
结构化多因子风险模型结构化风险模型方程
市场风险结构
常用因子:风险指数基本思想:对一些共同投资主题的暴露也是股票风险的来源,用风险指数因子来衡量常用的风险指数:波动率:按波动率区分股票,假设历史波动率高的股票在未来仍然保持高的波动率动能:按近期表现区分股票规模:按市值大小区分股票流动性:按交易量的大小区分股票成长性:按过去和预期的盈利增长区分股票价值:按基本面情况区分股票,例如:盈市率EP、分红率DP、净市率BP、销市率SP等,反映了股票价格相对于发行公司的基本面而言是便宜还是昂贵盈利波动率:按盈利的波动性区分股票财务杠杆:按债务股本比率和对利率风险的暴露度区分股票APT理论和多因子收益率模型套利定价理论APT
…………
因子套利定价理论APT
说明:APT称正确的因子预测是存在的,但没有说明如何找到它们APT模型:实例1
APT模型:实例2
大市值股票期望收益率(1/3)
中市值股票期望收益率(1/3)
小市值股票期望收益率(1/3)
高账面市值比股票收益率(1/3)
中账面市值比股票收益率(1/3)
低账面市值比股票收益率(1/3)APT模型:实例3
高盈利水平ROE股票收益率(1/3)
中盈利水平ROE股票收益率(1/3)
低盈利水平ROE股票收益率(1/3)
高投资水平(再投资率)收益率(1/3)
中投资水平(再投资率)收益率(1/3)
低投资水平(再投资率)收益率(1/3)多因子收益率模型模型构建基本步骤
模型分类APT模型可以分为:结构化模型与纯粹统计模型结构化模型:因子有实际含义,因子预测可被理解为对具有相似特征的股票群体的预测可将因子与特定变量相联系,使模型匹配实践者的投资经验和投资直觉根据因子暴露或因子溢价已知,可分为基本面因子模型和经济因子模型统计模型:使用统计模型可以避免受到主观判断的影响因子通常没有实际含义,缺乏解释,因子溢价和因子暴露都未知例如:主成分分析模型、最大似然因子分析模型等…………
因子结构化多因子模型
基本面因子模型
参数估计
经济因子模型
混合模型基本思想:同时包含基本面因子(因子暴露已知)和经济因子(因子溢价已知)常用因子:基本面因子:P/B、P/E、ROE等经济因子:GDP增速、通货膨胀率、利率、汇率、失业率等难点:统一考虑经济因子和基本面因子方法:零投资组合因子转换法vs
直接回归法
混合模型:因子转换
应用示例
应用示例:投资策略收益率预测:使用多因子收益率模型对标的下一期的收益率进行预测选股:选择其中预期收益率较高且大于0的标的组合构建(资产配置):等权买入,即买入相同金额的各个选中标的持有到下一期后全部买出再平衡(定期调仓):每3个月对于标的预期收益率进行预测,并重新建仓应用示例:回测结果策略累计收益率曲线图基于信息的预测时间序列数据时间序列(time
series):按时间顺序记录的同一个(或一组)变量的一系列观测值时间序列数据组成:由观测时间t和观测值y两部分要素组成时间要素t表示观测的时间(时间点vs时间段)数值要素y表示观测变量的取值(数值vs向量)时间t……观测值y……时序分析流程画出时间序列图观察序列的走势的规律,选择合适的拟合或预测方法选择性能评估方法和指标,并确定相应的目标函数构建数学模型求解或估计模型参数,并评估模型的应用效果时间t……观测值y……
自回归模型自回归模型
移动平均假设:时间序列是局部平稳的且具有不变或缓慢变化的均值基本思想:采用移动的(局部)平均值来估计序列平均值的当前值,并用它来预测下一时刻(或时期)的情况常用模型:根据预测时使用的各元素的权值不同,可构造不同模型简单移动平均、加权移动平均、指数平滑法
ARIMA模型
以自回归为主,差分用于使其满足平稳性,移动平均用于修正预测误差时序平稳性背景:自回归模型假设时间序列满足平稳性时序平稳性时间序列的均值、方差和协方差等统计特征不随时间的推移而发生变化即时间序列内含的规律和逻辑在被预测的未来时间段内能够延续下去实际情况:通常时间序列不满足平稳性,特别是存在明显的增长或下降趋势时平稳性检验方法:观察法、单位根检验法等平稳化方法:差分法、对数变换、平滑法、分解法等差分法
差分阶数基本思想:差分阶数越高,序列越平稳,但每次差分都会导致一定信息丢失满足平稳性要求的条件下,差分阶数越低越好平稳性检验方法:观察法:通过查看差分后的时序图判断序列是否平稳单位根检验法:ADF检验(AugmentedDickey-Fullertest)ARIMA模型:AR&MA
案例:黄金价格预测黄金作为一种重要的投资标的数据:以2001~2008年共计8年的数据作为训练集以2009~2010年共计2年数据作为测试集预测性能评测指标:平均绝对误差MAE和均方根误差RMSE预测方法:简单移动平均、加权移动平均和ARIMA模型案例:黄金价格预测阶数选取:简单移动平均和加权移动平均中的阶数p分别取3、6和12ARIMA模型使用R语言中的auto.arima()函数,根据训练数据自动选择自回归阶数p、差分阶数d和移动平均阶数q权值:加权移动平均使用R语言中WMA()函数的默认权重ARIMA模型使用R语言中的auto.arima()函数在训练集上学习权值算法简单移动平均法加权移动平均法ARIMAp=12p=6p=3p=12p=6p=3p,d,q=0,2,1RMSE111.6166.6536.7181.4848.4624.9136.10MAE102.0056.8130.5173.5539.6120.9230.05案例:黄金价格预测算法简单移动平均法加权移动平均法ARIMAp=12p=6p=3p=12p=6p=3p,d,q=0,2,1RMSE111.6166.6536.7181.4848.4624.9136.10MAE102.0056.8130.5173.5539.6120.9230.05基于循环神经网络的时序分析循环神经网络循环神经网络RNN:一种包含循环的神经网络模型可以看作是一个随着时间推移重复发生的网络结构循环神经网络和传统神经网络的异同:都是由输入层、隐藏层和输出层三部分组成RNN的隐藏层有一个箭头表示数据的循环更新,以达到记忆的目的循环神经网络
循环神经网络:参数学习
长短期记忆网络(LSTM)
长短期记忆网络(LSTM)
门控循环单元网络GRU
案例:股票价格预测数据:2010年1月至2020年12月贵州茅台股票的每日开盘价,共计2668条数据以2010~2018年共计9年的数据作为训练集,共2181条数据以2019~2020年共计2年数据作为测试集,共487条数据预测性能评测指标:RMSE、MAE、MAPE预测方法:RNN、LSTM、GRU案例:股票价格预测
案例:股票价格预测模型均方根误差RMSE平均绝对误差MAE
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 油库租金合同范本
- 业务开拓协议书
- 原材料合同范本
- 2025年引进高层次和急需紧缺人才24人备考题库及1套参考答案详解
- 2026年多媒体制作服务合同
- 2025年湖北同济医院何凡教授团队公开招聘项目聘请制科研人员备考题库附答案详解
- 2026年竞业禁止协议
- 2025年兰州新区石化集团社会招聘15人备考题库完整参考答案详解
- 2026年河南推拿职业学院单招职业倾向性测试模拟测试卷附答案
- 2025年太原旅游职业学院单招职业适应性考试题库附答案
- 2026年辽宁生态工程职业学院单招职业适应性考试题库必考题
- 2026届高考化学冲刺复习水溶液中离子平衡
- 2025年产业融合发展与区域经济一体化进程研究可行性研究报告
- 2025年大学物联网工程(传感器技术)试题及答案
- 工程部项目进度监控与风险应对方案
- 河南省青桐鸣2026届高三上学期第二次联考语文试卷及参考答案
- 《国家赔偿法》期末终结性考试(占总成绩50%)-国开(ZJ)-参考资料
- 哈尔滨工业大学本科生毕业论文撰写规范
- 七人学生小品《如此课堂》剧本台词手稿
- 跨境人民币业务介绍-杨吉聪
- 工程项目质量管理培训课件
评论
0/150
提交评论