CFA考试:投资分析的数量方法(投资工具)_第1页
CFA考试:投资分析的数量方法(投资工具)_第2页
CFA考试:投资分析的数量方法(投资工具)_第3页
CFA考试:投资分析的数量方法(投资工具)_第4页
CFA考试:投资分析的数量方法(投资工具)_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 学时 投资分析的数量方法(Quantitative Methods for Investment Analysis) 投资工具PAGE PAGE 82胺第五章:正态概皑率分布翱Chapter皑 傲叭 Common昂 Probab埃ility D安istribu艾tions邦本章简介斑(Introd拔uction)昂P226敖本章的内容,是疤四种概率分布及隘它们的应用,即扳:安叭 the un挨iform;拜柏 the bi扮nomial;背柏 the no八rmal;哎般 the lo俺gnormal耙。邦本章的其他数量澳工具:懊扒 Hypoth隘esis te半sting;把盎 regre

2、s傲sion an岸alysis;袄霸time-se盎ries an拔alysis。爸不连续的随机变叭量懊(Discre耙te Rand百om Vari板ables)P爱227爱熬 定义和解释概跋率分布(Pro氨babilit半y Distr跋ibution捌s)搬概率分布(Pr凹obabili拔ty Dist艾ributio按ns),即将随败机变量可能结果埃的概率予以特定疤。俺每个随机变量都爸有描述它的概率皑分布,概率分布八的方式有两种:澳叭 概率函数(p吧robabil靶ity fun澳ctions)叭。柏佰 累积分布函数皑(cumula白tive 挨distrib佰ution鞍 func

3、ti吧ons耙distrib版ution斑 functi暗onscdf般唉 区别:连续的爱随机变量和不连挨续(discr爸ete)的随机鞍变量澳随机变量,是一唉个未来结果不确版定的数。随即变俺量有两种类型:啊不连续的随机变耙量(discr岸ete ran艾dom var摆iable)、瓣连续的随机变量安(contin奥uous ra扮ndom va按riable)吧。伴变量的结果能予胺以历数(个数有拔限)的随机变量盎,为不连续的随败机变量。叭叭 描述某特定变捌量可能结果的集跋合昂稗 定义一个概率罢函数(熬Probabi澳lity fu叭nction罢)并说明它的关盎键特征巴概率函数的表示暗方法

4、是:P(X啊 x),它拜表示随机变量的熬值为x的概率。凹不连续随机变量澳的概率函数,可按以缩写为p(x罢);连续随机变氨量的概率函数用澳f(x)表示,挨称之为概率密度蔼函数(Prob瓣ability敖 densit扮y funct办ionsde巴nsityp般df)。拜概率函数有两个胺关键特征:奥巴 0哀袄p(x)败挨1;按碍 随机变量X所版有值的概率的总芭和等于1。鞍鞍 定义概率密度唉函数(蔼Probabi颁lity de爸nsity f般unction靶)般澳 定义累积分布扮函数(cumu澳lative 翱distrib疤ution 安functio阿n盎)并根据累积分阿布函数计算随机叭变

5、量的概率岸累积分布函数(昂cumul靶ative 把distrib笆ution背 functi败ons爱distrib吧ution办 functi吧onscdf安),表示随机变澳量的结果位于某肮一范围的概率。昂cdf函数的功瓣能相当于累积相鞍对频率。般连续的或不连续哀的随机变量的结跋果的累积概率分蔼布,可以记作F鞍(X) P(半X敖叭x),或F(X阿) P(x矮1八澳X颁暗x哎 2跋),或F(X)皑P(X跋熬x)。俺累积概率函数(耙cdf函数)的袄特征:搬阿 0佰阿F(x)白癌1;靶坝 随着x的增加俺,cdf函数或笆增加或保持不变胺。捌不连续的单项分罢布矮(The Di按screte 凹Uni

6、form案 Distri哀bution)癌P228半版 给定不连续的巴单项分布(a 安discret艾e unifo芭rm dist扒ributio哀n),定义不连拌续的单一随机变板量并计算概率叭单项分布(Un办iform D艾istribu败tion),即埃随机变量所有可拜能结果的概率都笆相等。凹单项分布的应用拜:拌板 它是为其它概暗率分布产生随机暗数以作为随机观袄察对象(ran摆dom obs摆ervatio奥n)的基础;癌俺 它可以用来描熬述结果概率相等扒的随机变量。疤贝诺里分布昂(The bi霸nomial 搬Distrib爱ution)办P230颁盎 给定贝诺里概瓣率分布(bin敖o

7、mial P鞍robabil颁ity Dis板tributi版ons),定义矮贝氏随机变量(隘Bernoul班li Rand八om vari坝able)并计癌算概率敖懊 贝诺里(Bi败nomial)败分布的功能翱贝诺里(Bin傲omial)分搬布的功能:描述皑有两项可能结果安的随机变量的每靶一项结果的概率拔分布。其模型是跋:两项选择的价蔼格模型(the罢 binomi凹al Opti扮on Pric氨ing Mod皑el,BOPM凹),即价格的上爱升或价格的下降懊。颁案 贝氏随机变量瓣(Bernou懊lli Ran般dom var般iable)懊贝诺里分布的建阿构元素是贝氏随鞍机变量(Ber艾

8、noulli 氨Random 芭variabl摆e)。假定某个鞍能重复进行的试跋验有两个可能的伴结果,每次试验巴产生的结果必为半其一,这样的试扮验称为贝诺里试唉验(Berno八ulli tr板ial)。案在结果为成功时胺,则Y1;在阿结果为失败时,笆则Y0,则贝澳氏随机变量Y的霸概率函数为:暗p(1) p邦(Y1) 暗p芭p(0) p瓣(Y0) 蔼1 p昂艾 贝诺里随机变懊量(binom啊ial Ran伴dom var伴iable)隘对n个贝诺里试袄验,有0熬氨n个罢“版成功拜”板。如果单个贝诺熬里试验的结果是啊随机的,则n个鞍贝诺里试验的结皑果为傲“背成功矮”疤的总数也是随机扒的。搬定义贝诺

9、里随机奥变量埃X罢为n个贝诺里试肮验中结果为成功芭的总数。用柏“扳Y唉i阿”摆表示第i个贝诺胺里试验的结果为罢“澳1坝”搬或坝“哀0胺”拔(巴i岸 1,2,傲邦,n),则:吧X Y 皑1百Y澳 2翱 安翱 Y伴 n胺 。敖贝诺里随机变量挨由参数p和n定岸义。p即每次试伴验结果为拜“板成功阿”阿的概率;n贝诺佰里试验的次数。办对贝诺里分布,笆可作有如下假设皑:伴叭 对所有贝诺里般试验,结果为搬“佰成功艾”皑的概率是一个常盎数;败澳 贝诺里试验相跋互独立。啊因此,贝诺里随百机变量疤X碍可以完全用两个敖参数描述,即X伴 B(n,熬p)。贝氏随机按变量板Y扮是n 1的贝霸诺里随机变量的胺值,即:Y 芭

10、 B(1,p)邦。懊肮 贝诺里随机变暗量X B(隘n,p)的概率斑函数P(X =哎 x)的表示公鞍式:p(x) P(Xx)nC xp x(1 p)n x nC x n!x!(nx)!氨傲 X是贝诺里随爱机变量,表示n安个贝诺里试验中靶的拔“扒成功按”搬的总数;Xx半,是这n个贝诺唉里试验中成功的邦总数等于x。隘翱 p(x)和P暗(X x),捌表示n个贝诺里傲试验中,成功的挨总数等于x的概哎率。把佰 奥n疤C隘 x袄是在n个贝诺笆里试验中有x个安成功的排列方式癌的数目。翱啊 p,是单个贝吧诺里试验的结果氨为成功的概率;般(1p),是佰单个贝诺里试验百的结果为不成功稗的概率。隘柏 拜p爸 x熬(1

11、 p)坝n x般,是每一个排列盎都具有的概率。办霸 贝诺里随机变盎量概率函数的形佰状唉当单个贝诺里试斑验的结果为成功笆的概率p50拔%时,贝诺里分稗布式对称的。败若p奥艾50%,则贝诺埃里随机变量概率埃函数的图像就具疤有偏向性。啊拔 当p 5懊0% 时,概率叭函数的会向右偏搬(right-办skewed)败,即图像的右部搬有较长的尾巴;暗拜 当p 5罢0% 时,概率澳函数的会向左偏安(left-s氨kewed)。鞍对同一贝诺里随氨机变量有p般1稗、p稗2安,如果p懊1氨p扳2 澳1,则它们的奥图像呈镜像对称班。巴百 贝诺里随机变巴量(berno案ulli Ra啊ndom va拜riable)半

12、的预期值和方差氨贝诺里随机变量办(bernou摆lli Ran耙dom var搬iable)的拔预期值和方差柏Mean(we鞍ighted 翱average半)半Varianc胺e氨Binomia癌l,B(1,p奥)哀p芭p(1p)傲Binomia蔼l,B(n,p按)班np百np(1p)稗Binomia佰l,B(5,0跋.5)蔼2.5(即5跋爸p)败1.25即5岸袄p(1p)伴Binomia懊l,B(5,0啊.1)唉0.5(即5奥耙p)靶0.45即5把懊p(1p)埃连续的随机变量皑分布懊(败Continu伴ous Ran癌dom Var昂iables碍)佰P240癌邦 给定连续的单挨项分布(a

13、 c挨ontinuo昂us unif芭orm dis把tributi拜on),定义连稗续的单项随机变岸量并计算概率按连续的单一分布背(Contin搬uous Un叭iform D肮istribu把tion)半般 连续的单项随拔机变量的概率密肮度函数(pdf捌): 1(ba) (axb)f(x) 0 其他值岸 捌耙 连续的单项随叭机变量的累积概白率函数(cdf爱): 0 (xa)F(x)= (xa)(ba) (a x b) 1 (xb)八 计算概俺率密度函数f(暗x)在定义域(半a八安x叭拌b)上的面积(皑即累积概率值)拜的数学方法是,皑对函数f(x)颁从a到b积分(爸integra扮l),即:

14、P(axb)ab f(x)dx盎可以用上述等式凹对(按扮,盎把)范围内的任意霸两个实数求积分稗。笆因为连续随机变百量的值是无限的稗,所以,连续随昂机变量的值等于跋任一定点的概率氨为0。这对计算颁连续随机变量的阿累积概率函数(蔼cdf)有重要敖意义:对任何连艾续的随机变量X挨,有P(a邦背x岸皑b) P(a皑 x皑按b) P(a板澳x b)澳 P(a 颁xb)。袄当a搬巴x瓣安b 时,f(x摆)1/(b碍a)表示的是连唉续随机变量在区笆间a爱肮x盎挨b的平均概率。矮正态分布袄(The No班rmal Di般stribut拌ion)P24霸3岸办 解释正态分布暗的关键特征癌阿 描述正态分布拔的两个

15、参数:平瓣均值半笆(Mean)和袄方差(伴艾 2疤)或标准差埃霸。正态分布可以爸表示为:X 扒 N(靶笆 ,傲翱 2隘)。伴稗 正态分布的下熬述参数值:偏向半性(skewn熬ess)0;百峰度(kurt八osis)3跋,剩余峰度(e蔼xcess k拜urtosis暗) 0。瓣正态随机变量的艾平均值(mea拜n)、中值(m拔edian)、澳众数(mode坝)都相等。扮拔 两个正态随机挨变量的线性叠加爸(linear捌 combin背ation),败还是正态分布。扳版 区别:单变量拌(univar熬iance)分按布和多变量分布扒(multiv爸ariance啊)蔼单变量分布(u版nivaria肮

16、te dist八ributio安n),描述单个班的随机变量;多板变量分布(mu班ltivari唉ate dis吧tributi白on),描述的碍是一组随机变量癌的概率。哀当我们有一组资拌产时,我们可以捌将每一项资产的拔收益分布分别模矮型化,也可以将俺这些资产作为一板组(as a 拔group)来安将它们的收益分鞍布模型化。作为氨一组,即考虑收奥益系列之间的统疤计关系,其中经拔常使用的模型就隘是多变量的正态阿分布(mult翱ivariat耙e norma盎l distr白ibution伴)。扮n种证券的收益背的多变量正态分把布,可以用三个艾参数予以定义:邦皑 单个证券收益稗的平均值(me白an)

17、的清单;佰艾 证券收益方差按的清单;隘扮 收益的所有互蔼不相同的相关系哀数(corre按lations扮)的清单,共n案(n-1)/2笆个。般与单变量正态分昂布相比较,相关捌系数(corr摆elation巴s)是多变量的暗正态分布的区别柏特征之一。皑拔 解释相关系数背在多变量正态分俺布中的作用肮熬 定义标准正态澳分布(stan袄dards n翱ormal d埃istribu绊tion)并解般释如何使随机变绊量标准化捌懊 正态分布的概叭率密度函数(p捌df)的表达式岸(案翱 x 案扮):f(x) exp (x )22 2 ( 2 )瓣当傲巴 0,绊扳1 时,该正氨态分布称之为标跋准(stand拔

18、ard)正态分吧布或单位(un哀it)正态分布扮。拔对于正态分布,柏标准差(败摆)越大,其相对拌于平均值的分布隘就越分散。利用碍标准差,我们能把够对任何正态分扮布的结果的分散扮性作出概率报告俺:扳啊 大约有50%芭的观察对象,在岸区间板袄 背白(23)按柏的范围内;拜暗 大约有68%翱的观察对象,在跋区间扒癌 败傲的范围内;艾拜 大约有95%袄的观察对象,在啊区间唉澳 埃般2奥鞍的范围内;跋扮 大约有99%岸的观察对象,在熬区间肮稗 爸稗3巴皑的范围内。柏绊 随机变量的标班准化胺标准正态随机变巴量用Z N办(0 ,霸1班)表示。将随机巴变量 X 蔼N(稗矮 ,扳皑 2傲)标准化的公式癌:Z (

19、X )邦随机变量Xx摆 0哎 对应的标准正澳态随机变量Z 敖 z蔼0皑 (x背 0邦 把斑)/ 爸佰。靶其意义是:对X胺 N(捌柏 ,拔扒 2蔼),随机变量的搬值小于或等于x伴 0案的概率,正好等拔于标准正态分布霸Z N(0耙 ,板1按)中随机变量的凹值小于或等于z耙0摆的概率z摆0安(x办 0 罢 叭昂)蔼班。哎即:对X 氨N(般傲 ,安扒 2把)有P(X按笆x唉 0疤);对Z 澳N(0 ,熬1蔼)有N(Z敖懊z挨0啊)。当z巴0盎(x啊 0 邦 案按)啊邦时,则P(X碍皑x挨 0绊)N(Z佰拔z板0班)。艾肮 呈正态分布的罢随机变量的信置背区间(conf艾idence 敖interva碍l

20、s)班瓣 正态随机变量背X的确切信置区昂间(confi坝dence i霸nterval柏s): 懊罢 P( x阿傲1.645s懊 扒伴X埃霸 x巴伴1.645s稗) 90%;蔼x翱阿(也记作傲邦)为样本平均值颁;s(也记作瓣哀)为样本的标准傲差。 x跋败和s是店测算(罢point e扒stimate斑s)。罢拔 P( x扳懊1.96s 靶哀X安班 x百傲1.96s)氨 95%;挨霸 P( x笆俺2.58 s昂 矮半X百巴 x案班2.58s)拜 99%;吧斑 使用标准正态办分布(stan啊dards n拌ormal d伴istribu哎tion)计算拌概率敖斑 标准正态随机靶变量累积分布函扳数表

21、N(x)的哀使用。比如查找皑P(Z霸敖0.24)的值扳(即变量Z的值跋小于或等于0.班24的概率),靶其步骤:在表的百第一纵栏找到0哀.20,在表的柏第一横栏找到0伴.04,两者对岸应的值即为要找疤的概率。扒【例】 跋扮 P(Z 叭癌 1.282)唉 90% ,挨它表示有10%捌的值在图像的右靶边尾部,并且,爱P( x案败1.282s搬 熬疤X靶碍 x白胺1. 282埃s) 80%矮。扳坝 P(Z癌昂1.645)安 95%,它表搬示有5 %的值半在图像的右尾部啊,或有10 %爱的值在90%的袄信心区间之外(摆即左右两边尾部盎各有5 %的值盎在90%的信心啊区间之外)。肮癌 了解下列关系颁,有助

22、于我们使安用累积分布函数拜N(x)表:版俺 当x傲叭0时,x右边的颁分布概率P(Z扮百x)1.0 碍 N(x);柏盎 对负数x,邦有:N(x)埃= 1.0 把N(x)。奥因为:x右边的疤分布概率和面积懊,等于x左边败的分布概率和面办积,即:P(Z办白x) N(蔼x)或P(Z板鞍x)。岸正态分布的应用霸(Applic办ation o哎f the N邦ormal D笆istribu啊tion)懊跋 翱平均值按般方差分析法翱胺 平均值爱肮方差分析法(m扳ean-var扒iance a蔼nalysis稗)唉平均值柏拜方差分析法,将拌整体的收益分布把概括为平均值和扮方均差,进而对扳投资决策进行评伴价。靶

23、板 将新资产加入敖到投资组合中,扮为了实现获利须岸满足: E(R new)R f new Corr(R new,R p) E(R p)R f p蔼即:新资产的半“摆夏普比隘”盎,要大于投资组安合p的岸“敖夏普比吧”昂与新资产和投资版组合P的相关系胺数的乘积。霸蔼 马克维茨决策氨规则(Mark啊owitz d皑ecision拜 rule)。般对于资产A和B百,投资者选择A埃而不选择B,其凹决策依据是:拔鞍 A的平均收益半等于或大于B的隘平均收益,而A艾的收益的标准差熬更小;耙爱 A的平均收益吧大于B的平均收爱益,而A与B收艾益的标准差相等跋。办昂 定义亏空风险碍(shortf俺all ris扒k

24、)百亏空风险(sh拜ortfall按 risk),艾即在某段时间投板资组合的价值会柏下降到能够接受爸的最低水平以下艾。如:某个已经扒界定收益计划的半资产的价值下降癌到计划的债务之佰下,即为亏空风挨险(short唉fall ri扮sk)。胺哀 计算安全首位氨比率(safe艾ty-firs白t ratio柏)并利用罗伊的稗安全首位标准选懊择最佳投资组合白安全首位规则(白Safety-班first R挨ules),作拜为评估价值下滑靶风险(down瓣side ri傲sk)的方法,伴关注的是亏空风熬险(short靶fall ri艾sk)。矮假定R拌 L斑 是投资者能接班受的最低收益水败平。按照Roy隘

25、的安全首位标准芭:最优化的投资八组合,就是能够百使该组合的收益袄R背 p暗下降到临界水平癌R懊 L盎以下的概率最小俺化的投资组合,吧即:P啊版R爸 p 唉 R拜 L蔼哀为最小值。俺当投资组合收益扮是正态分布的,笆我们使用标准方傲差能计算出P霸岸R爱 p 班 R挨 L拔鞍。投资组合的期暗望收益为E(R啊 p坝),则单位标准啊差的E(R肮 p坝)R唉 L巴最大时,投资盎组合的P扳半R唉 p 安 R哀 L埃摆最小。八E(R皑 p吧)R案 L懊是平均收益(斑mean re班turn)到亏霸空标准的距离。盎用坝SFRatio安表示案安全首位比率(版safety-瓣first r耙atio),则拔:俺SF

26、Ratio巴 = E(R伴 p澳)-R拌 L柏/皑 敖 隘p昂应用Roy标准隘,对投资组合进奥行选择的步骤:哎捌 计算投资组合摆的SFRati哀o。案败 根据计算所得矮的SFRati傲o值评估标准正澳态累积分布函数敖(cdf)。收案益值小于R熬 L皑的概率就是N(凹SFRati隘o),即:P(耙R百 p 按 R百 L隘)N(SF柏Ratio)=爸1N(SFR熬atio)。芭办 选择上一步中皑概率最小的投资佰组合。班SFRatio背与癌“艾夏普比率捌”皑的差别在于R靶 L盎和R 啊f啊(无风险收益)背。安全首位规则伴为熬“暗夏普比率拔”暗提供了一个新的哀角度:在使用夏矮普比例评价投资胺组合时,假

27、定投版资组合收益是正爸态分布的,则夏蔼普比率高的投资疤组合,是使投资坝组合收益小于无熬风险收益的概率柏最小的投资组合蔼。翱啊 对数正态分布岸(lognor耙mal dis拌tributi摆on)和正态分版布的关系按阿 对数正态分布蔼的概述昂对随机变量Y,昂如果它的自然对唉数Y为正态分傲布,则Y为对数白正态分布;反之绊亦然。对对数正斑态分布,有两点八值得注意:埃爱 它的下界由0版界定;挨捌 它偏向右边(班即它的右边由一柏个长的尾巴)。按假定Y是对数正搬态分布的,则对吧数正态分布的两翱个参数是:Y艾的平均值和方差班(或标准差)。昂这样就有两套平巴均值和标准差(八或方差):正态俺分布的平均值和俺标准

28、差(或方差埃);对数正态分百布自身的平均值般和标准差(或方奥差)。澳爸 求对数正态分敖布自身的平均值矮和标准差(或方隘差)颁假定正态随机变拔量X有预期值奥伴 和方均差爱拜 2搬。定义:Ye俺xp(X)e搬 x碍,Y是取对数的阿逆运算,即Y鞍X。X是正态霸随机变量,而Y挨是对数正态变量氨。则:耙吧 Y的预期值是搬exp(白暗 0.5版坝 2俺),即E(Y)啊 exp(阿稗0.5皑罢 2碍)。隘其原因:对数正熬态分布扩展了,扳它能向上扩展但阿是不能向下扩展矮超过零,因此,凹分布的中心向右拌边移动,即增加背了平均值。办俺 对数正态分布坝自身的平均值(巴佰L案)和方均差(傲哀L啊2笆)的计算公式:澳罢

29、L拔 exp(挨吧 0.5哀办 2瓣)败傲L斑2搬 exp(2板扳 靶肮 2盎)昂瓣exp(拜袄 2邦)1 哀艾21区别:收绊益的连续复利和捌不连续复利扒柏 股票收益分布靶和股票价格的关柏系柏如果股票的连续伴复利收益率(c白ontinuo癌usly co佰mpounde爸d retur跋n)是正态分布奥的,则将来的股邦票价格必定是对颁数正态分布的。巴同样重要地,即捌使股票的连续复拜利收益不是正态颁分布的,因为中捌心限制理论(c八entral 疤limit t版heorem)佰的作用,股票的埃价格也可用对数按正态分布来描述哀。办熬 连续复利收益癌率与持有期回报捌率(holdi爱ng 八perio

30、d澳 return搬)的关系扮假定股票价格的拌一系列观察对象癌S奥0哀,S柏1氨,S跋2奥,翱巴,S阿T 扒,是等间距的。绊现在的股票价格傲S疤0疤是一个确定的数叭(不是随机变量拌),而股票的未般来价格却是一个肮随机变量。价格挨比(S啊t凹+1 唉S 败t芭),等于1加上跋持有期回报率,拌即:S 笆t+1昂S 扒t 佰 1R哎 t+1,t版 。癌连续复利收益率瓣,是与持有期回伴报率(R摆 t+1,t巴)相伴随的一个拌重要概念。连续疤复利收益用r搬 t+1,t疤表示,则根据E邦AR e 岸r白s矮 拜1可得(EA白R拔 耙敖effecti岸ve皑 白annual扮 rate即R罢 t+1,t敖)

31、,在期间t到扳t+1内,两者奥的关系是:r t+1,t (St+1 S t)(1R t+1,t)按在期间0到T内坝(T-hori罢zon),连续败复利收益率与持翱有期回报率HP昂R的关系是:r0, T (S T S 0) rT,T1 rT1, T2 r0,1罢因此,S 般T 八 S 阿0扮 exp(r 碍0, T癌)。霸白 独立的同一分背布(IID,i翱ndepend矮ently a白nd iden肮tically板)癌独立的同一分布颁含义。邦凹 独立,指投资胺者不能根据过去板的收益预测未来癌的收益;懊吧 同一就是假定澳静止。半假定单个期间的扮连续复利收益率矮r佰T,T 爸按1把,是平均值为跋

32、昂、方差为背白 2笆的IID随机变柏量,则在0到T敖期间内连续复利稗收益率r摆0, T澳的期望值为:E(r0, T) E(rT,T 1) E(rT 1, T-2)E(r0,1) T 2(r0, T) 2T蔼 比较S皑 伴T 埃S 爱0败 exp(r办0, T拜)和Y e巴xp(X),我昂们可以将未来股板票价格S 板T芭的模型作为对数按正态随机变量。瓣因为,r盎0, T懊至少应该是近似安的正态随机变量俺。懊爱22给定持有靶期回报率HPR吧,计算收益的连扮续复利般氨23解释蒙特埃卡洛模拟和历史癌模拟,并说明它罢们的应用和局限袄性邦绊 蒙特卡洛模拟柏的简介扳蒙特卡洛模拟的熬要旨,在爬梯之安前要做的最

33、后一矮件事,就是摇动氨梯子。就像摇动般梯子让我们接近扒爬梯的风险一样肮,蒙特卡洛模拟扒让我们在实施一笆项政策前,对其拜进行试验。其目奥的,就是发现对拜复杂的金融问题蔼的近似解决方法凹。耙作为蒙特卡洛模懊拟整体的一部分背,就是通过各种阿各样的假定,从霸概率分布中产生败大量的随机样本氨,以模拟各种可澳能的风险。拔蒙特卡洛模拟的坝应用:巴碍 在实施一项政把策或投资决策前袄,对其进行试验坝;把稗评估处于风险中靶的价值(Val耙ue at R埃isk);罢奥 对复杂的证券矮估价;暗半 研究院用以测背试他们的模型和哎投资工具。哀八 蒙特卡洛模拟佰的步骤。稗熬 根据基础变量办,明确规定感兴鞍趣的问题的数量白

34、(Specif案y the q肮uantiti盎es of i鞍nterest白 in ter艾ms of u柏nderlyi斑ng vari霸able)。拔半 明确规定时间爸坐标(Spec般ify a t板ime gri绊d)。拜白 对产生前在变皑量的风险因素,颁明确规定其分布傲假说(Spec奥ify dis翱tributi哀onal as靶sumptio靶ns for 挨the ris鞍k facto败rs that懊 drive 笆the und拔erlying班 variab扳les)。扮凹 使用计算机程暗序或空白表格(搬spreads奥heet)函数百,产生每一个风扒险因素的随机值伴

35、。背办 使用上一步产哎生的随机观察对哀象,计算基础变背量。跋岸 计算感兴趣的案问题的数量。爱肮 返回到第4步办重新操作,直到拜试验的详尽数据阿完成。耙耙 蒙特卡洛模拟叭,是分析方法的巴补充。它只提供巴统计数据,而不绊能提供精确的结捌果,而分析方法袄提供了更深刻的疤因果关系。坝版 历史模拟(h啊istoric板 simula艾tion,or哎 back s捌imulati案on),从历史挨纪录中取样来模摆拟一个过程。挨第六章:取样和哎评估安Chapter摆 皑稗 Sampli岸ng and 袄Estimat敖ion埃本章简介(伴In百troduct拌ion)挨本章的主题:是坝如何取样?以及搬如何

36、利用样本信啊息估算群体参数案?取样的核心是捌中心限制理论和唉估算(cent吧ral鞍 安limit哀 靶theorem捌 胺and案 稗estimat奥ion)。皑取样(扮Samplin熬g皑)搬拌 摆定义样本随机取岸样扳(捌simple鞍 氨random背 隘samplin埃g捌)班样本傲(袄simple板)拜随机取样柏,即群体中的所版有元素入选的概啊率都相等。稗两种随机取样的瓣方法袄:靶简单的随机取样袄(暗simple胺 癌random败 半samplin半g阿)凹和分层次的随机班取样隘(皑stratif岸ied拜 邦random瓣 胺samplin八g颁)傲。拌两类数据:横截叭数据(cr

37、os耙s爸-哀section办al柏 爱date)和时板间系列数据(t蔼ime矮-胺series霸 碍date)。哎斑 巴定义并解释取样瓣误差哀(摆samplin鞍g懊 俺error唉)拔取样误差,即统罢计观察到的值和半统计要估算的量瓣之间的差。坝白 岸定义取样分布矮(败samplin瓣g阿 氨distrib阿ution矮)颁一个统计的取样般分布(罢sam袄pling办 埃distrib安ution鞍),按是我们从同一群昂体中随机抽取规岸模相同的样本、半并对样本进行统袄计计算皑,啊而得出的所有相俺互区别的可能值碍的分布。拔跋 区别:简单的氨随机取样和分层爱的随机取样(s鞍tratifi安ed

38、rand板om samp靶ling)把简单的随机取样稗(颁simple爱 扳random哀 叭samplin埃g斑),八即样本的获得是斑任意的稗,佰群体中的每一个白元素霸,板都有同等的机会瓣被选中。耙分层次的随机取唉样(strat芭ified r笆andom s傲ampling阿),即根据一个背或多个分类标准澳,将群体进一步芭分为亚群体(s傲ub popu笆lation拌s皑trat敖a)。然后按每搬一层(亚群体)哎的相对规模,按皑比例地抽取简单敖的随机样本,并芭将这些样本集中白起来。敖碍 时间系列(t扒ime-ser懊ies)数据和奥横向(cros吧s-secti坝onal)数据捌 俺 败时

39、间系列数据,捌是时间间隔相等拔地、不连续地收懊集到的一系列数啊据。横截数据,懊是在某一时间点埃上的个体、团体拜、地区或公司的碍特征的数据。熬样本平均值的分按布般(Distri靶bution 胺of the 哎sample 板mean)柏案 说明中心极限罢定律(cent扒ral lim挨it theo凹rem)并说明唉它的重要性罢假定任一概率分埃布描述的群体有凹平均值啊 跋哎 隘和限定的方差暗笆2板,埃当我们从群体中袄抽取规模为n的皑样本以计算样本板平均值x盎氨时芭,扮如果n足够大把(瓣n埃 隘邦 30),碍则可得斑:皑罢 昂样本平均值x搬奥的取样分布是近哎似的正态分布隘;碍绊 该取样分布的岸样

40、本平均值x唉靶 绊板 ,方差肮摆2胺x靶胺 安摆2摆n 。把中心极限理论鞍:版八 按能估计群体的平岸均值佰;隘熬 艾样本统计的标准俺差八,矮就是统计的标准哀误差鞍(版Standar颁d吧 半Error搬 稗of蔼 按Statist捌ic俺);吧扒 挨能够建构信心区邦间和测试假定。唉埃 计算和解释样白本平均值的标准拜差(stand岸ards er傲ror)摆样本平均值的标笆准差懊s罢 捌x把岸(败Standar拜d霸 把Error癌 盎of败 搬Statist班ic扳)扳的定义。爱样本统计的标准疤差熬(吧Standar挨d靶 白deviati岸on安)肮,斑就是统计的标准稗差扳(埃Standar

41、笆d芭 扮Error爸)懊。因此,样本平版均值拜x霸芭的标准差懊(靶Standar扒d把 懊Error班)昂的计算公式有二熬:挨半x扒伴 哎皑懊阿n佰 ;八或癌s 唉x胺按 s 板摆n佰 半。 ns2 (x i x)2 (n1) i1颁群体平均值的点坝估算和区间估算埃Point a挨nd Inte阿rval Es隘timates奥 of the奥 Popula矮tion Me矮an懊稗 鉴别和描述估笆算公式的必要特爱性(the d埃esirabl斑e prope把rties)白估算公式(Es罢timator氨sestim靶ation f敖ormulas斑)和估算值(霸estimat败e吧)。估

42、算值是我拔们使用估算公式办对样本观察对象懊进行计算所得出班的特定值。搬估算值和估算公跋式的区别:从群罢体中抽取不同的班样本进行重复的把抽样统计时,估笆算公式会产生不矮同的结果(即估敖算值)。般百 公正性(un佰biasedn叭ess)。一个埃公正的估算公式俺,就是它的预期安值(即取样分布白的平均值)正好肮等于它要评估的肮参数。哎盎 有效性(ef扒ficienc皑y)。如果某个蔼公正的估算公式捌是有效的,则除邦了该公式外,再挨没有另外一个公癌正的估算公式,耙就同样的参数得肮出具有更小方差拌的取样分布。敖岸 一致性(co矮nsisten扒cy)。如果估把算公式具有一致鞍性,则随着取样板规模的增大,

43、准敖确的估算值(接奥近群体参数值的暗估算值)的概率捌也会增加。即随爸着取样规模无限凹扩大,估算值的凹取样分布越来越绊集中于我们要估扳算的参数的值。艾这三个特征,也百是选择估算公式岸的三个标准。白艾 区别群体参数疤的点估算(a 哀point e按stimate唉)和信置区间估敖算(a con案fidence败 interv霸al esti哎mate)哀对平均值或其他傲参数的关注岸,盎集中于两个问题翱:般癌 百假定测试。它针拌对的问题是耙“啊参数值是等于某蔼个特定值吗?挨”扒 估算(est案imation捌)。它针对的问阿题是敖“扮参数的值是什么板?百”捌估算包括:点估暗算(a Poi扒nt Es

44、ti癌mates)和巴信置区间估算。袄懊 点估算(a 胺Point E背stimate罢s)哀按照样本平均值案计算而得的群体罢参数的单个估算岸值,称之为平均百值的点估算。隘颁 埃群体平均值的信般心区间隘(耙Confide唉nce俺 按Interva暗ls敖 拔for矮 凹the翱 扒Populat巴ion罢 俺Mean矮)翱 颁氨 稗信置区间的定义柏信置区间氨,即我们能够以埃给定的概率澳1耙艾(按信置翱度板)肯定该区间包挨括了它要测算的败参数。搬这个区间称为该阿参数的(拜1耙瓣)靶版 挨信置区间。搬信置区间对参数叭给出概率解释或奥实践解释。斑把 按照概率解释吧,例如群体平均岸值95%的信置翱区

45、间表示,在重瓣复取样中,在长案远上,有95%癌的这样信置区间搬将包括群体平均按值。版安 按实践解释,搬我们有95%的安信心肯定单个该败区间(95%的傲信置区间)即能搬够包括群体平均挨值。白半 信置区间的建俺构(Const鞍ruction鞍 of Con叭fidence澳 Interv凹als)坝参数绊的(啊1半佰)% 坝信置区间的结构背:点估算值 拜版 信赖因素 傲蔼 标准误差(P翱oint es蔼timate 耙巴 Reliab班ility f叭actor 拔碍 Standa袄rd erro傲r)。扒点估算值(Po版int est百imate),拔即一个样本统计奥的值;信赖因素摆(Relia

46、b办ility f奥actor),般是以点估算值的鞍假定分布和信置岸度拔(阿1巴伴)熬为根据的一个数柏据;标准误差(扮Standar柏d error把),是提供点估罢算值的样本统计阿的标准误差。暗芭 描述t- 分颁布的特征澳(拔Student瓣皑s t-案 distri袄bution)百鞍 t分布(t 癌-Distri把bution)版,是由单一参数八即自由度df(佰degrees袄 of fre哎edom)定义邦的一个对称的概安率分布。八敖 t分布与正态巴分布的比较。颁假定我们从一个傲正态分布中取样爸,则比率z(懊x艾案 凹败)癌唉瓣蔼n,是一个标准办的正态分布(平靶均值为0,标准肮差为1)

47、;比率暗t (x笆败按懊)吧s阿白拔n,则是t分布瓣(平均值为0,白自由度为n1矮)。案这个用t表示的摆比率,不是正态斑分布,因为它是败两个随机变量(澳样本的平均值和爱标准差版)的比,而标准坝正态分布的定义俺只有一个随机变绊量x拜埃。然而,随着自伴由度的增加,t爱分布接近于标笆准正态分布(分捌布越尖锐、尾巴班越瘦)。鞍把 芭计算和解释自由坝度岸(邦degrees罢 岸of俺 扒freedom板)办自由度的概念。柏对P40计算样碍本标准差s的公岸式,分母上的项扮(n1)就是叭使用该等式估算疤群体标准差的自扳由度数字。拔使用般“拔自由度疤”啊术语其原因为:霸在随机样本中,扮我们假定观察对挨象的选取

48、是互不扒依赖的。假定计百算有n个互不依坝赖的观察对象的疤样本的平均值,安则只有(n1靶)个观察对象是拔可以独立地选择摆的。八(n1)也常暗常被作为根据t扒分布(tDi艾stribut跋ion)确定信隘赖因素的自由度鞍。胺拌 邦对群体方差已知艾或未知的正态分白布矮,巴计算和解释群体奥平均值的信置区芭间暗摆 方差已知的呈背正态分布的群体扳的平均值的信置挨区间伴从方差为百按2坝的正态群体分布靶中取样,则群体班平均值佰安的扒(半1耙爸)% 暗信置区间为:x z / 2 n捌标准正态分布Z芭(0,1)信置疤区间的信赖因素拔(Reliab哀ility F柏actors)办拌信置区间颁z俺 阿把/ 2八癌=

49、 0.1按90%的信置区扮间巴Z皑 0. 05 办= 1.645氨凹= 0.05坝95%的信置区把间胺Z埃 0. 025般= 1.96搬凹= 0.01瓣99%的信置区背间吧Z吧 0. 005岸 办=2.575埃随着信置度的增叭加,信置区间越邦来越宽,对我们斑要估算的数据能艾给出的信息就越挨不精确。熬背 方差未知的群唉体的平均值的信盎置区间的求解肮癌 方法一:z替跋换法(the 百zAlter绊native)绊从方差未知的任扮何分布的群体中瓣取样,当取样规扳模较大时,则群霸体平均值斑埃的啊(氨1办叭)% 半信心区间为:x z / 2 S n叭柏 方法二:t分搬布法(tDi胺stribut安ion

50、)霸如果从一个方差伴未知的群体中取坝样,并且满足下懊列两个条件中的败任一条件的,即碍:碍拌 样本较大;矮柏 样本较小但是芭群体呈正态分布癌或近似的正态分白布。则群体平均吧值的信心区间可熬以表示为:x t/ 2 S n耙计算信赖因素(拔Reliabi拜lity Fa把ctors)的靶根据捌取样的群体阿样本规模较小的稗统计坝样本规模较大的阿统计澳方差已知的正态笆分布拌z皑z叭方差未知的正态巴分布瓣t巴t(或z)俺方差已知的非正挨态分布肮Not ava艾ilable罢z哀方差未知的非正澳态分布啊Not ava柏ilable斑t(或z)挨绊 从任何类型的叭分布中抽取大量暗的样本,在群体澳方差未知时,计

51、芭算和解释群体平盎均值的信置区间稗蔼 对选择适当样哎本规模的问题进靶行讨论案搬 班讨论数据挖掘偏捌见鞍(奥date哀-凹mining芭 罢bias隘)哀数据窥探偏见俺(笆Date把-敖snoopin俺g阿),鞍即以刺探他人经安验性结果来引导挨自己的分析而得版出推论所产生的般偏见。把防止办法:检验懊新数据,以防止唉过分依靠过去的拌研究,来解释发碍现和得出结论。阿数据挖掘偏见(拜Date岸-安mining巴 耙bias),指埃重复的钻研同一班数据,直至有所稗发现。数据挖掘胺偏见的四点迹象傲:对数据挖掘太隘多而又缺乏信心拔(Too mu巴ch digg爱ingToo拜 little巴 confid熬

52、ence);没挨有过去也没有将颁来(No st笆ory No霸 future叭)。叭防止的办法是在白样本数据之外测熬试交易规则。阿澳 讨论样本选取肮偏见、现存关系跋偏见、超前偏见办、时间期间偏见暗。罢芭 埃样本选择偏见(芭Sample 捌selecti吧on bias班),即因为数据澳可获得性的原因案,而将某项资产艾排除在分析之外邦,由此产生的问跋题为样本选择偏邦见。耙摆 现存关系偏见盎(surviv安orship 叭bias)。如胺果测试设计没有蔼考虑到已经关闭岸、被兼并或因其澳他原因离开了数俺据库的公司的账鞍户,则属于现存爱关系偏见。氨疤 超前偏见(l癌ook-ahe颁ad bias爱)。

53、如果一项测把试设计在测试数癌据上使用了不能八获得的信息,则碍会产生超前偏见碍。肮吧 时间期间偏见柏(time-p巴eriod b佰ias)。如果搬作为测试设计根佰据的时间期间,挨使结果在时间搬跋期间上特定化,吧属于时间期间偏坝见。要注意对取肮样期间长度的选扳择。叭第七章:假定测埃试吧Chapter按 按拜 吧Hypothe爱sis隘 Testin昂g袄假定测试岸(Hypoth胺esis Te矮sting)凹爱 定义假定并描案述假定测试的步板骤芭假定,即对群体八的说明。假定测败试的步骤(St搬eps in 伴the Hyp敖othesis绊 Testin蔼g):芭唉 提出假定(s邦tating

54、笆the hyp捌othesis澳);翱矮 确定测试统计唉和它的概率分布跋(Identi懊fying t埃he test瓣 statis罢tic and般 its pr癌obabili哀ty dist安ributio霸n);跋氨 有效度的特定拔化(Speci笆fying t板he sign霸ificanc疤e level案);霸拔 声明决定规则白(Statin癌g the d办ecision八 rule);败昂 收集数据和进挨行计算(Col坝lecting爸 the da懊te and 岸calcula摆ting th胺e test 唉statist百ic);稗八 做出统计结论哀(make s

55、奥tatisti叭cal dec澳ision);袄背 做出经济或投靶资结论(mak班e the e伴conomic俺 invest熬ment de白cision)颁。绊上述第安阿、岸奥步是假定测试的绊传统方法,可以岸用p值(p癌value)方板法来替代这些步板骤。蔼昂 定义和解释零叭假定(null罢 hypoth柏esis)和替白代假定(alt斑ernativ板e hypot艾hesis)笆假定的类型有两班种:拔板 零假定(th摆e null 白hypothe暗ses),用H斑 0傲表示;氨啊 替代假定(t暗he alte隘rnative啊 hypoth吧eses),用斑H哀 a唉表示。哎零假

56、定:除非用拌以进行假定测试翱的样本有证据表癌明零假定是错误鞍的,否则该假定捌就被认为是正确隘。如果有证据表盎明零假定是错误敖的,则将导致替稗代假定。拔替代假定,即零罢假定不成立时的背假定。敖唉 单边(one昂-tailed瓣)假定测试和双扒边(two-t扒ailed)假傲定测试矮拌 假定公式。假癌定某一群体有参瓣数为矮芭,百懊0把 为该参数的一哎个值,对于两者傲的关系可以通过百下列三种方式形皑成零假定和替代癌假定:斑鞍 稗H熬 0 扳:疤啊鞍岸0耙 对 袄H靶 a靶 :版稗0绊 (不等于替摆代假定)澳拜 扮H蔼 0 拜:伴袄0拜 对 板H蔼 a伴 :坝爸奥懊0吧 (大于替代八假定)盎岸 瓣H哎

57、 0 稗:吧傲0吧 对 搬H捌 a绊 :捌摆挨柏0吧 (小于替代白假定)稗蔼 公式哀叭是双边(two百-sidet啊wo-tail般ed)假定测试摆;公式拜板与昂挨,是单边(on柏e-side芭one-tai靶led)假定测袄试。暗白 讨论零假定和翱替代假定的选择坝最常用的是芭“柏不等于(not皑 equal 把to)吧”矮替代假定,即公颁式半捌。如果有证据表埃明参数可能大于搬0或小于0,则败我们可以否定零扒假定。矮然而,我们有时坝要为我们艾“敖怀疑的(鞍suspect鞍ed败)邦”拔或拔“跋希望的(hop稗ed for)罢”敖情形寻找支持证袄据。在此情形,摆我们可以将替代案假定定义为懊“昂该

58、情形是真的拜”办,而将零假定坝定义为背“胺情形的非真般”隘。如果证据支持坝对零假定的否定佰并接受替代假定案,则我们在统计胺上可以肯定地认摆为我们的想法是奥正确的。般注意:板“斑大于凹”白和版“氨小于柏”八替代测试,比隘“笆不等于袄”扳替代测试更强烈捌地反映了研究者霸的确信。为了强哀调态度的中立性哎,在有些时候即坝使单边的替代测扒试试合理的,研扳究者也会选择凹“唉不等于唉”疤替代测试。澳邦 定义和解释测昂试统计(a t百est sta艾tistic)芭测试统计(Te哀st Stat按istic)的柏定义,是根据样袄本计算得出的数叭据,它的值是决凹定支持或反对零矮假定的根据。一扒般地,测试假定背有

59、如下公式:测试统计 (0)s x坝败为把样本统计;胺扒0蔼为扮H扒 0盎下群体参数的值碍(哀把0霸);碍s 蔼x鞍俺为氨样本统计的标准败误差(stan稗dard er办ror)。对公岸式的说明:其他艾条件不变时,叭s 霸x拔芭 越小,则测试爱统计越大,否定败零假定的概率就蔼越大。而且,取矮样规模n越大,跋则s 案x拜按 越小。摆测试零假定的测鞍试统计,遵循的挨概率分布有四种瓣类型:斑傲 t板八分布(对t袄摆测试);叭坝 z摆翱分布,即标准正板态分布(对z盎叭测试);暗稗 卡方分布,即绊the chi叭-square白(x癌2哀)distri凹bution(扮对卡方的测试)阿;袄版 F熬皑分布(

60、对F盎胺测试)。案拔 定义和解释误斑差类别吧捌及误差类别巴佰(type 埃坝 error)捌爱 解释有效度(皑a signi捌ficance扳 level)跋并说明有效度在搬假定测试中的应按用邦测试统计计算出敖来后,有两种可俺能的行为,即:半否定或不否定零把假定。我们行为傲的根据是将计算昂出来的测试统计笆和特定的可能值暗进行比较。我们矮选择的比较值,半是以选取的有效拜度(the l柏evel of凹 signif搬icance)疤为根据的。有效袄度相当于证明标摆准,它反映了为暗反对零假定所必背要的样本证据。百测试零假定时,颁存在四种可能的翱结果:氨哀 否定错误的零背假定,这是正确碍行为;癌癌

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论