




已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
离散型1.二项分布Binomial distribution:binom二项分布指的是N重伯努利实验,记为X b(n,p),E(x)=np,Var(x)=np(1-p)pbinom(q,size,prob), q是特定取值,比如pbinom(8,20,0.2)指第8次伯努利实验的累计概率。size指总的实验次数,prob指每次实验成功发生的概率dbinom(x,size,prob), x同上面的q同含义。dfunction()对于离散分布来说结果是特定值的概率,对连续变量来说是密度(Density)rbinom(n, size, prob),产生n个b(size,prob)的二项分布随机数qbinom(p, size, prob),quantile function 分位数函数。分位数:若概率0pZa)=的实数。如t分布的分位数表,自由度f=20和=0.05时的分位数为1.7247。 -这个定义指的是上侧分位数分位数:实数满足0 1 时,分位数是使PX x=F(x)=的数x双侧分位数是使PX2=1-F(2)=0.5的数2。qbinom是上侧分位数,如qbinom(0.95,100,0.2)=27,指27之后P(x=27)=0.95。即对于b(100,0.2)为了达到0.95的概率至少需要27次重复实验。2.负二项分布negative binomial distribution (帕斯卡分布)nbinom掷骰子,掷到一即视为成功。则每次掷骰的成功率是1/6。要掷出三次一,所需的掷骰次数属于集合 3, 4, 5, 6, . 。掷到三次一的掷骰次数是负二项分布的随机变量。dnbinom(4,3,1/6)=0.0334898,四次连续三次1的概率为这个数。概率函数为f(k;r,p)=choose(k+r-1,r-1)*pr*(1-p)k, 当r=1时这个特例分布是几何分布rnbinom(n,size,prob,mu) 其中n是需要产生的随机数个数,size是概率函数中的r,即连续成功的次数,prob是单词成功的概率,mu未知.(mu是希腊字母的读音)3.几何分布Geometric Distribution,geomn次伯努利试验,前n-1次皆失败,第n次才成功的机率dgeom(x,prob),注意这里的x取值是0:n,即dgeom(0,0.2)=0.2,以上的二项分布和负二项分布也是如此。ngeom(n,prob)4.超几何分布Hypergeometric Distribution,hyper它描述了由有限个(m+n)物件中抽出k个物件,成功抽出指定种类的物件的次数(不归还)。概率:p(x) = choose(m, x) choose(n, k-x) / choose(m+n, k) for x = 0, ., k.当n=1时,这是一个0-1分布即伯努利分布,当n接近无穷大时,超几何分布可视为二项分布rhyper(nn,m,n,k),nn是需要产生的随机数个数,m是白球数(计算目标是取到x个白球的概率),n是黑球数,k是抽取出的球个数dhyper(x, m, n, k)5.泊松分布 Poisson Distribution,poisp(x) = lambdax exp(-lambda)/x!for x = 0, 1, 2, . The mean and variance are E(X) = Var(X) = . x ()泊松分布的参数是单位时间(或单位面积)内随机事件的平均发生率.泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等.rpois(n, lambda)dpois(x,lambda)连续型6.均匀分布 Uniform Distribution,uniff(x) = 1/(max-min) for min = x = max.runif(n,min,max).生成16位数的随机数:as.character(runif(1,1000000000000000,9999999999999999)dunif(x,min,max)=1,恒定等于1/(max-min).对于连续变量,dfunction的值是x去特定值代入概率密度函数得到的函数值。7.正态分布Normal Distribution,normf(x) = 1/(sqrt(2 pi) sigma) e-(x - mu)2/(2 sigma2)其中mu是均值,sigma是standard deviation标准差理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布rnorm(n,mean=0,sd=1)后两个参数如果不填则默认为0,1。dnorm(x,mean,sd),sd是标准差。画出正态分布概率密度函数的大致图形:x-seq(-3,3,0.1)plot(x,dnorm(x) plot中的x,y要有相关关系才会形成函数图。qnorm(p,mean,sd),这个还是上侧分位数,如qnorm(0.05)=-1.644854,即x= 0, a 0 and s 0.Gamma分布中的参数,称为形状参数(shape parameter),即上式中的s,称为尺度参数(scale parameter)上式中的aE(x)=s*a, Var(x)=s*a2. 当shape=1/2,scale=2时,这样的gamma分布是自由度为1的开方分布/wiki/File:Gamma_distribution_pdf.pngdgamma(x,shape,rate=1,scale=1/rate), 请注意R在这里提供的rate是scale尺度参数的倒数,如果dgamma(0,1,2)则表示dgamma(0,shape=1,rate=2),而非dgamma(0,shape=1,scale=2)pgamma(q, shape, rate = 1, scale = 1/rate, lower.tail = TRUE, log.p = FALSE)qgamma(p, shape, rate = 1, scale = 1/rate, lower.tail = TRUE, log.p = FALSE)rgamma(n, shape, rate = 1, scale = 1/rate)9.指数分布Exponential Distribution,exp指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。记作X Exponential()。f(x) = lambda e(- lambda x) for x = 0.其中lambda 0是分布的一个参数,常被称为率参数(rate parameter). E(x)=1/,Var(x)=1/2dexp(x, rate = 1, log = FALSE)pexp(q, rate = 1, lower.tail = TRUE, log.p = FALSE)qexp(p, rate = 1, lower.tail = TRUE, log.p = FALSE)rexp(n, rate = 1)假设在公交站台等公交车平均10分钟有一趟车,那么每小时候有6趟车,即每小时出现车的次数 Exponential(1/6)我们可以产生10个这些随机数看看rexp(10,1/6)60/(rexp10,1/6)即为我们在站台等车的随机时间,如下:1 6.443148 24.337131 6.477096 2.824638 15.184945 14.5949037 7.133842 8.222400 42.609784 15.182827可以看见竟然有一个42.6分钟的随机数出现,据说这种情况下你可以投诉上海的公交公司。不过x符合指数分布,1/x还符合指数分布吗?pexp(6,1/6)=0.6321206, 也就是说这种情况下只有37%的可能公交车会10分钟以内来。按照以上分析一个小时出现的公交车次数应该不符合指数分布。10.卡方分布(non-central)Chi-Squared Distribution,chisq它广泛的运用于检测数学模型是否适合所得的数据,以及数据间的相关性。数据并不需要呈正态分布k个标准正态变量的平方和即为自由度为k的卡方分布。E(x)=k,Var(x)=2k.dchisq(x, df, ncp=0, log = FALSE)pchisq(q, df, ncp=0, lower.tail = TRUE, log.p = FALSE)qchisq(p, df, ncp=0, lower.tail = TRUE, log.p = FALSE)rchisq(n, df, ncp=0)其中df为degrees of freedom。ncp是non-centrality parameter (non-negative).ncp=0时是central卡方分布,ncp不为0时,表示这个卡方分布是由非标准正态分布组合而成,ncp=这些正态分布的均值的平方和。11.分布Beta Distribution,beta变量x仅能出现于0到1之间。空气中含有的气体状态的水分。表示这种水分的一种办法就是相对湿度。即现在的含水量与空气的最大含水量(饱和含水量)的比值。我们听到的天气预告用语中就经常使用相对湿度这个名词。相对湿度的值显然仅能出现于0到1之间(经常用百分比表示)。冬季塔里木盆地的日最大相对湿度和夏季日最小相对湿度。证实它们都符合贝塔分布dbeta(x, shape1, shape2, ncp = 0, log = FALSE)pbeta(q, shape1, shape2, ncp = 0, lower.tail = TRUE, log.p = FALSE)qbeta(p, shape1, shape2, ncp = 0, lower.tail = TRUE, log.p = FALSE)rbeta(n, shape1, shape2, ncp = 0)shape1,shape2是beta分布的两个参数。E(x)=s1/(s1+s2),var(x)=s1*s2/(s1+s2)2 * (s1+s2+1)12.t分布Student t Distribution,t应用在当对呈正态分布的母群体的均值进行估计。当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t 分布。学生t 分布可简称为t 分布。其推导由威廉戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t 检验以及相关理论经由罗纳德费雪的工作发扬光大,而正是他将此分布称为学生分布。dt(x, df, ncp, log = FALSE)pt(q, df, ncp, lower.tail = TRUE, log.p = FALSE)qt(p, df, ncp, lower.tail = TRUE, log.p = FALSE)rt(n, df, ncp)其中df是自由度,ncp是non-centrality parameter delta,If omitted, use the central t distribution。ncp出现时表示分布由非标准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络协同节能-洞察及研究
- 银行报销费用自查报告及整改措施
- 三年级数学计算题专项练习及答案
- 汽车汽车知识竞赛创新创业项目商业计划书
- 农产品智能冷库管理系统创新创业项目商业计划书
- 简历与求职信翻译服务创新创业项目商业计划书
- 农产品品牌公关传播创新创业项目商业计划书
- 粉尘消防安全知识培训课件
- 2026届湖北省黄冈市麻城市实验高中高二化学第一学期期中联考模拟试题含解析
- 新鲜茶叶知识培训内容课件
- 行政法与行政诉讼法案例教程 课件全套 殷兴东 第1-8章 行政法的基本原理-行政赔偿
- 高中新班主任培训
- 新媒体运营与推广- 课程标准、授课计划
- 中式烹调技艺高职全套教学课件
- 陕西华山的险峻之旅
- 苏教版分式章起始课-展示课件
- 《茶文化与茶健康》第一讲
- OBE理念下的小学音乐教学设计反向思路初探
- GB 24541-2022手部防护机械危害防护手套
- 《PLC与变频器控制》课件 1.PLC概述
- 智慧产业园综合管理平台解决方案
评论
0/150
提交评论