2012CFA一级总结(数量统计部分).docx_第1页
2012CFA一级总结(数量统计部分).docx_第2页
2012CFA一级总结(数量统计部分).docx_第3页
2012CFA一级总结(数量统计部分).docx_第4页
2012CFA一级总结(数量统计部分).docx_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数量统计部分设置计算器 2nd P/Y 1 ENTER 2ndquit一、几个利率的概念1. EAReffective annual rate.EAR=(1+periodic rate)m-1,periodic rate=年利率/m, m=每年compound的次数当m-无穷时,EAR=erate-1, rate2ndex-1Ordinary annuities(现金流在期末)与annuities due(现金流在期初),需将计算器调整成BGN模式,2ndBGN2ndset永久年金perpetuity, PV=PMT/IYUneven 现金流的PV和FV计算NPVCF2ndCLR WorkInitial cash outlay Enterperiod 1 cash flow +-Enterperiod 2 cash flow +-Enterperiod n cash flow +-EnterNPVdiscount rate EnterCPTFV要分别计算再累加2.BDY-Bank discount yield银行贴现率(T-bill以此报价)BDY =D/F*360/t其中D是折现额(face value-购买价格),F是面值!转换也是采用360,不是复利,该指标缺陷很大3.持有期收益Holding period returnHolding period yield-HPY=(P1-P0+Div)/P0顾名思义4.Money-weighted return and time-weighted return计算Money-weighted return资金加权,统计每期cash flow,计算使PV inflow=PV outflow的IRR计算器IRRCF2ndCLR WorkInitial cash outlay Enterperiod 1 cash flow +-Enterperiod 2 cash flow +-Enterperiod n cash flow +-EnterIRRCPTtime-weighted return时间加权:先计算每期的HPR,在进行算几何平均数。如果继续投资的收益率比前一期低,则时间加权的收益率高,如果继续投资的收益率高,则资金加权的收益率高。5.Effective annual yieldEAY=(1+HPY)(365/t)-1实际年收益率,基于365天进行复利计算!6.Money market yield(CD equivalent yield)货币市场收益率rmm=HPY360/t-基于360天进行计算!是一个按照360天每年进行单利转换的收益率,相比而言, EAY则是一个按照365天每年进行复利转换(compound daily)的收益率!BDY是一个比较特殊的比率,因为它是基于面值计算的;货币市场收益率和BDY之间是可以相互转换的-他们之间的桥梁是HPY!Rmm=360*Rbd/(360-t*Rbd)同时, EAY的计算也是要靠HPY的,所以HPY是非常重要的概念!EAY和Rmm都是年化的HPY。7.Bond equivalent yieldBEY债券等价收益率这是一个单独的收益率!因为美国的债券是每半年支付一次利息的,所以将任何一种债券转换成每半年支付利息的债券,计算收益率,再将结果乘以2,即可得到BEYCorporate finance 中working capital management中BEY=HPR*365/t二、统计概念和市场收益descriptive statistics描述性统计:用于总结大量数据的重要特征,得到有用的信息。inferential statistics推论性统计:基于样本来对总体进行预测、估计或judgement。1.Types of measurement scalesNominal scales:包含最少信息,没有顺序。Ordinal scales:每个observation被归到一个类别中,而这些类别都是按一定特征排序的。Interval scales:向Ordinal scales一样提供相对的ranking,且每个类的间隔是相等的。Ratio scales:除了向Ordinal scales一样提供相对的ranking,且每个类的间隔是相等的,还有true zero point作为原点。2.频率分布frequency distributionAbsolute frequency,modal interval:出现频率最多的区间,cumulative absolute frequency,cumulative relative frequency3.均值mean总体均值population mean:=Xi/N样本均值sample mean:X=Xi/nDeviation from the mean,到均值的离差一般为0加权平均weighted mean中位数median,中间一位或中间两个的平均数众数mode:出现频率最多的数一组数如果一个数出现频率最多是unimodal(单峰),2个是bimodal,3个trimodal几何平均geometric mean,调和平均 harmonic mean=N/(1/Xi)一般用于计算一段时间购买股票的平均成本。Harmonic geometric1)即 observations lie within k standard deviations of the mean is at least.差异系数coefficient of variation (CV)=Sx(standard deviation of x)/X(average value of x)衡量每单位E(回报)的风险,越小风险越低!夏普比率Sharpe ratio=(Rp-Rf)/p衡量每单位风险的超额回报,越大投资组合越好!局限性:1)当两个组合的夏普比率为负时,不一定高的那个表现好,2)对方差计算的不准确导致了夏普值偏高。偏斜skewness:最高点的数据用于是mode;Positive skewed(right)右尾长,modemedian永远在中间meanNegative skewed(left)左尾长,mean median永远在中间3,出现偏离均值小的数和偏离均值大的数的概率多more peak, fat tail;platykurtic低峰3,less peak, thin tail.Sample kurtosis=(1/n)*(Xi-X)4/s4Excess kurtosis=sample kurtosis-3投资收益成尖峰分布的风险较大!三、概率论Mutually exclusive events互斥事件,不能同时发生Exhaustive events全事件Independent events独立事件,一个事件的发生对其他事件的发生没有影响。P(A|B)=P(A)Empirical probability经验概率:基于过去的数据,priori probability先验概率:使用推理和检验的方法得到的概率。Subjective probability主观概率,objective probabilityConditional probability条件概率,假定事件B发生的事件A发生的概率Odds:一个事件发生的概率/不发生的概率乘法原理multiplication rule of probability:条件概率计算P (AB)=P(AB)*P(B)加法原理addition rule of probability:P(AUB)=P(A)+P(B)-P(AB)全概率公式total probability rule:P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|Bn)P(Bn),B1Bn是exclusive & exhaustive期望值expected value:E(X)=P(Xi)Xi方差2=P(Xi)(Xi-E(X))2=E(X2)-E(X)2协方差covariance:Cov(Ri,Rj)=ERi-E(Ri)Rj-E(Rj),股票和无风险资产的Cov=0Cov(A, B)=EA-E(A)B-E(B) =E(AB)-E(A)E(B)这是原始计算公式,可以变形为概率下的两个变量对其Expected Value的离差!Correlation coefficient 相关系数=Cov(1, 2)/(1*2)相关系数永远在-1和+1之间;相关性的含义就是:两个变量的变化关系,完全正相关,则说明一个变量增加10%,另一个变量也会增加10%,完全负相关则是,一个变量增加10%,另一个变量减少10%。一般来说,相关性越低,则多元化的好处越大,因为两个股票完全向相反方向移动,多元化之后,则可以改变这个问题。方差是表征单个股票或者股票组合的收益的离散程度(方差,标准差),而协方差仅仅是投资组合中任意两个变量(股票)之间的相关程度,每个变量都有其自身的离散程度(方差,标准差),但是协方差仅仅是表明两个变量之间的相关程度。对单只股票的方差的计算有两种方法:1. 根据每种情况发生的概率;2. 根据历史数据进行分析计算单只股票,因为其不同收益发生的概率不同,其方差为:2=P(Xi)(Xi-E(X))2历史数据的方法是先求出其平均值,再计算其协方差对于股票组合协方差也是两种方法:1. 根据每种情况发生的概率;2. 根据历史数据进行分析计算投资组合期望和方差:Portfolio expected value:E(Rp)=wiE(Ri)Portfolio variance:Var(Rp)=wiwjCov(Ri,Rj)投资组合方差-牢记公式!2个股票的组合Var(Rp)=Wa22a+Wb22b+2a*b3个股票的组合Var(Rp)=Wa22a+Wb22b+Wc22c+2ab+2ac+2bc要牢记amortization table的计算原理!-首先计算出PMT,以此数据为基础,计算每次PMT部分的interest component和principal component,根据他们可以计算出ending balance!Bayes formula贝叶斯公式:Updated probability=(probability of new information for a given event)/(unconditional probability of new information)*prior probability of event新的信息条件下某事件的条件概率先验事件的概率/新的信息条件下该事件的无条件概率P(Bi|A)=P(A|Bi)P(Bi)/P(A|Bj)P(Bj),B1Bn是exclusive & exhaustiveLabeling就是我们常说的抽屉问题!阶乘factorial,二项式combination formula nCr=n!/r!(n-r)!,permutation formula排序nPr=n!/(n-r)!四、Common probability distributions分布Discrete random variable and continuous random variable(某一点的概率为0)Probability density function -PDF概率密度函数,用于计算一个区间的概率Cumulative distribution functionCDF概率函数,小于或等于某个值得概率1. discrete uniform distribution离散型均匀分布分布是离散的,每个值的概率相等。2. binomial 二项分布贝努力Bernoulli分布-每次试验是独立实验,可以重复做!p(x)=nCr*Pr*(1-p)(n-r)其方差为2=np(1-p)expected value=E(X)=np二项式交叉树-正是期权定价的时候学习的Tracking error:一个组合的total return和衡量它表现的benchmark的total return的差。3. Continuous uniform distribution连续性均匀分布-就是一种线性的均匀分布f(x)=1/b-a,if axb; 0,其他。F(X)=0 ,(xa);(x-a)/ (b-a),(axbE(x)= (a+b)/2 2=(b-a)2/124.normal distrbution正态分布通过mean和方差进行衡量,偏度为0,峰度为3线性组合的多个正态分布,仍然是正态分布.N个正太随机变量的相关系数个数n(n-1)/2置信区间confidence interval i. 对于68%的置信区间,X的取值在其均值的1s和-1s之间ii. 对于90%的置信区间,X的取值在其均值的1.65s和-1.65s之间iii. 对于95%的置信区间,X的取值在其均值的1.96s和-1.96s之间iv. 对于99%的置信区间,X的取值在其均值的2.58s和-2.58s之间标准正态分布-z=observation-population mean/standard deviation=(x-)/Z value-represent the no. of standard deviation a given observation is from the population mean-z value就是代表该数据偏离了样本多少个标准差!F(-Z)=1-F(Z)一个股票分布类似正态分布,expected return=10%,标准差=12%,那么其收益大于30%的概率多少?30-10=20%-20/12=1.66个标准差-查表得到95.25%的概率小于30%-4.85%的可能性是大于30%Shortfall risk不足风险-投资组合回报低于某个目标收益的概率Roys safety first criteria罗依安全第一准则-最优组合的投资组合要最小化投资组合收益的概率要低于最低可接受的水平-该最低可接受的水平称为threshold-RL-SF Ratio=E(RP)-RL/p,这个比例和夏普比率非常相似-Sharpe=E(RP)-Rf/p注意SF Ratio是小于mean的多少个standard deviation!所以SFR越大,则小于threshold的比例就越低-SFR越大越好!SFR和Z-value从概念上来讲是一样的遇到题目分为两步进行计算:1)计算SFR;-根据目标收益率或者threshold; 2)选择SFR较大的一个5. Lognormal 分布对数正态分布是向右偏的 ,对数正态分布永远是正的,所以比较适合建立模型进行资产分析.采用对数正态分布来model 投资的price relative.Price relative就是S1/S0=1+the holding period return,Price relative=0则说明投资是-100%离散复利和连续复利Effective annual rate=eRcc-1Holding period return HPR的计算公式-ln(S1/S0)=ln(1+HPR)=RccIf Rcc=10% for one year, then the effective holding period return over 2 years=e(10%*2)=22.14%The holding period return after T years when the annual continuously compounded rate is Rcc-HPRT=(eRcc*T)-1,如果两年的连续复利的回报率为A%,则一年的连续复利回报率为A%/26. Monte Carlo simulation蒙特卡罗模拟,historical simulation历史模拟蒙特卡洛:多次重复一个或者多个可能会影响证券价格的risk factor,来模拟证券价格的分析方法。一般用于复杂证券定价,模拟交易策略损益,计算VAR,模拟pension与liability,对非正态分布资产组合定价。步骤:1对于每个risk factor,必须定义其可能遵循的概率分布的参数(这里的参数是指mean,variance,possible ,skewness等等)!2 随机产生股价和利率的值。3对每对risk factor计算期权价格4计算均值蒙特卡罗模拟的缺陷是:1)比较复杂;2)对假设非常敏感;3)仅仅是统计而不是分析历史模拟:使用历史数据进行分析。但是缺点是历史数据可能不是未来的good indication五、样本和参数估计样本和population的区别。Simple random sampling和systematic sampling(等间隔抽样)样本误差,即样本统计与总体参数的差,不可避免Sampling error of the mean=sample mean-population mean= X-样本的分布:从一个总体中多次抽取相同数量的样本,这些样本统计的概率分布就是Sample distribution of the sample statistic.Sample distribution of the mean-从一个population中多次抽取出一个个数为1000的sample,来作为对整个population的估计。这1000个sample的每个sample的平均值构成的分布叫做sample distribution of the mean分层抽样stratified random sampling,将总体按一定特征分成小的group,在从每个group抽样。时间序列和截面序列:Time-series时间序列-观察一段时间区间内的数据Cross-sectional data-截面序列-在某个特定时间时点,每个股票的收益中心极限定理:1. 当一个population的mean=,标准差为,那么当其样本的size n足够大的时候,不论这个population是否正态分布,则从中抽取的sample的sampling distribution of sample means接近正态分布-而且其mean=,方差为2/n2. 样本要足够大!n=30样本均值符合正态分布样本均值的标准误差Standard error of the sample mean=/n-the standard divatino of the distribution of the sample means-就是选出来的sample有很多个,每个sample的平均数构成的组合的standard deviationDesirable properties of an estimator: unbiasedness(估计量的期望=总体的均值), efficiency(方差最小), consistency(随着样本数增大精确性提高)点估计-用单个样本算出的值来估计总体-point estimate1. 点估计2. Confidence interval-置信区间-就是一组数据落在一定区间,概率为1-aa. 此处a叫做level of significance for the confidence levelb. The probability 1-a叫做degree of confidencec. 置信区间的构成-point estimate reliability factorstandard error当整体population的标准差已知,则Standard error of the sample mean=/n0.5实际上population的标准差一般都不知道的!Standard error of the sample mean=s/n0.5其中s=(xi-x)2/(n-1)0.5-此处注意:是n-1原因是从正态分布总体中抽取的样本符合t分布!注意三个概念:a. 样本标准差sb. 总体标准差c. 样本平均数标准误差xT分布1. 当样本容量是小样本,属于正态分布或者接近正态分布,而且总体方差未知的情况2. 也适用于总体方差未知,样本容量比较大,从而根据中心极限定理,样本分布接近正态分布的情况3. T分布的特点a. 对称;b. 一个参数可以描述-degree of freedom自由度df=n-1,n是样本数c. 自由度越大,其图形越苗条,越细高!d. 注意不要把自由度和峰度搞混,自由度越大越接近正态分布,但是就峰度来讲,正态分布的峰度=3e. 所谓厚尾,是指两侧的尾巴偏离中心0的厚度!f. 厚尾!fatter tails-偏离平均值的概率比正态分布偏离均值的概率要大!g. 厚尾意味着更多的数据偏离分布的中心-也就是有很多outlier!h. 随着自由度的增加-也就是样本容量的增加,t分布越来越接近正态分布i. 当n大于30的时候, t分布已经接近正态分布了j. T分布实际上更加扁平4. 置信区间confidence interval的构建和解释a. 正态总体,方差已知i. 置信区间为x za/2*/n0.5ii. za/2的意思是reliability factor-是right-hand tail一侧的分布的概率=a/2的时候的Z scoreiii. z-score=za/2 =1.645,则置信区间为90%,也就是significant level=10%,5% at each tailiv. z-score=za/2 =1.96,则置信区间为95%,也就是significant level=5%, 2.5% at each tailv. z-score=za/2 =2.575,则置信区间为99%,也就是significant level=1%, 0.5% at each tailb. 正态总体,方差未知i. 置信区间为x ta/2*s/n0.5ii. ta/2是t分布依赖因子,表示自由度为n-1的t分布,落在ta/2右侧的概率为a/2iii. 由于t分布更加厚尾,也就是更加偏离中心区域,那么我们使用t分布的依赖因子实际上是更加conservative!c. 总体分布不一定是正态分布,方差未知的总体,大样本的情况i. 分布是non-normal,总体方差已知,使用z统计ii. 分布是non-normal,总体方差未知,使用t统计-前提是样本足够大!-当然也可以使用z统计,但是t统计更加保守!iii. 总结如下:When the sample is fromSample size n=30Normal distribution with known variancezzNormal distribution with unknown variancetTNon-normal distribution with known variancen.aZNon-normal distribution with unknown variancen.aT或z统计都可以,但是t统计更加conservative!各种统计偏差Data mining Bias重复使用databaseSample selection bias,一些数据被排除在外Look-ahead bias样本数据在test那天not availableSurvivorship bias一些基金不存在了Time-period bias数据的Time-period太短或太长六、Hypothesis testing假设检验1. 零假设(也叫原假设)和备择假设a. Null hypothesis-是我们希望拒绝的-want to rejectb. Alternative hypothesis-是我们希望接受的!c. 备择假设是当证据充足来拒绝原假设的时候,我们得出的结论-conclusiond. 他们两者是完全对立事件!e. 非常重要-原假设肯定包括“=”!不可能再备择假设中包含“=”!2. 单尾和双尾的假设检验a. 注意什么时候使用单尾什么时候使用双尾!b. 双尾的决策规则-for two tailed z-test at a=0.05, reject H0 if test statistic 1.96,|(x-)/(/n)|c. 单尾:Upper tail: H0:Za/2拒绝H0 Lower tail: H0: =03. 检验统计量test statistics和临界值critical valuea. Test statistics=(sample statistics hypothesized value)/standard error of the sample statisticsb. standard error of the sample statistics=/n0.5c. 当总体的方差未知的时候,使用样本的s/n0.54. 两类错误a. Type I-弃真错误-a错误b. Type II-取伪错误-错误-a小则大!c. Significance level显著性水平也就是出现a错误type I类型错误的概率!d. 我们不能说accept原假设,只能说支持或者拒绝e. 1-a-我们叫做置信度;1-(H0假,且拒绝)我们叫做power of test统计检验效率f. P-value是拒绝一个本身正确的原假设的概率-对于单尾,p-value等于大于我们计算的test statistics的概率或者小于我们计算的test statistics的概率;对于双尾,则是两者相加的概率5. Statistical significance不一定代表着economic significanta. Transaction costb. Tax factorsc. Risk factors6. 进行各种测验的时候,要构建合适的检验-t检验, z 检验或其他的检验!7. 检验两个population的mean是否相同?-要求每个样本是独立的,正态分布a. 两个正态分布,其方差已知b. 两个正态分布,方差未知,但相等c. 两个非正态样本,均是大样本,方差已知或未知d. 构建两个新的t分布!8. Paired comparison test-用来检验两个非独立正态总体的mean是否有差异?a. 构建H0:d =dzvs Ha: d dzb. 其中dz是假设的hypothetical mean of paired difference,which is commonly 0!c. 其中d是mean of the population of paired dif

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论