版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、x100%P(A)P(BA)1.数据的类型:根据描述事物所采用的不同尺度,数据分为分类型数据和数量型数据;按照被描述的对象与时间的关系分为截面数据、时间序列数据与平行数据。2.图形显示:饼形图、条形图、柱形图、散点图、折线图、曲线图、茎叶图。(1)饼形图的作用:反映各个部分的构成各频率的总合是100%。(2)条形图和柱形图:信息的比较条形图:不同单位,不同信息的比较;柱形图:同一单位不同时间信息的比较。(3)折线图:同柱形图作用相似,对同一的数据折线图具有唯一性(两点间有且只有一条直线)。(4)曲线图:同折线图作用相似也是表示不同时间信息的比较,但不具有唯一性。(5)散点图:表示两个变量之间的
2、相互关系。(两个变量的任何一对取值都在平面直角坐标系上代表一个点)。(6)茎叶图:把每一个数据分解成两部分茎与叶(它的优点在于它既保留了所有的原始数据又直观地显示出了数据的分布情况(与条形图相似)3.平均数、中位数和众数的关系:(1)数据分布是对称分布时:众数=中位数=平均数(2)数据分布不是对称分布时:左偏分布时:众数中位数平均数右偏分布时:众数中位数平均数8.变异系数是标准差与平均数的比值,即:V9.样本空间与随机事件的两种表示方法:(1)列举法;(2)描述法10.按照随机变量的取值情况,一般把随机变量分为:(1)离散型随机变量;(2)连续型随机变量。11.若两个事件是相依的,则不一定是互
3、斥的。12.概率的乘法公式:P(AB)P(B)P(AB)P(A)P(BA)(B发生的概率B发生条件下A也同时发生的概率)P(B)P(AB)P(AB)P(AB)12n13.全概率公式:PAP(BA)PAP(BA)PAP(BA)1122nnP(A)P(BA)ii14.贝叶斯公式:P(AB)P(Ai)P(BAi)iii【例。全概率】某车间有4个工人生产同一种产品,每个人生产的产品个数分别占总产量的15%,20%,30%和35%,每个人的次品率分别为0.05,0.4,0.03和0.02,4.分组数据的平均数(加权平均):平均数=(频数*组中值)的和频数的和求该产品的总次品率(即随机地抽取一个产品,它是
4、次品的概率)。解:设Ai代表“取到的产品是第i个人生产的”,i=1,2,3,4.设B代表“取到的产品是次品”。根据题意有:6.四分位极差先排队再等分为4份,其中n15.极差R=最大值最小值(极差容易受极端值的影响有时是无效的)3(n1)对应Q1,中位数为Q2,44的对应Q3,n为总个数。Q3-Q1=四分位极差,这两个点上的数值叫四分位点。如果四分位点不是一个整数则将前后两位数相加除以2便是。P(B/A1)=0.05P(B/A2)=0.04P(B/A3)=0.03P(B/A4)=0.02P(A1)=0.15P(A2)=0.20P(A3)=0.30P(A4)=0.35我们想要求的是P(B),首先所
5、有的产品都是由4个人中的一个人生产的,因此A1+A2+A3+A4=M,同时,A1,A2,A3.A4两两互斥,由概率的加法公式得P(B)=P(BM)+PB(A1+A2+A3+A4)=P(BA1)+P(BA2)+P(BA3)+P(BA4)n7.方差21(xx)2i再由概率的乘法公式,得到P(B)P(A)P(BA)0.15*0.05+0.20*0.04+0.30*0.03+0.35*0.02=0.0315ii即总次品率为3.15%1/6E()E(X)E(X)208.6【例。全概率】在上例中,假设车间规定,出了次品要追究有关人士的经济责任,现从生产出的产品中任取一件,结果为次品,但它是由谁生产的标志已
6、脱落,问这4个人当中谁生产了这个次品的可能性最大?32X3232325555555解:沿用上例的符号,我们想求的是P(Ai/B),i=1,2,3,4.由条件概率的定义和乘16.离散型随机变量的方法公式,我们可以得到:P(A1/B)=0.15*0.05/0.0315=0.238P(A2/B)=0.2*0.04/0.0315=0.254P(A3/B)=0.30*0.03/0.0315=0.286P(A4/B)=0.35*0.02/0.0315=0.222即该次品由第3个人生产的概率最大。【例。贝叶斯】某出版社向80%教授MBA管理经济学的教师寄送了关于一本管理经济学方面的新教科书的广告。在收到广告
7、的教师当中,有30%采用了该书,在没有收到广告的教师中了,有10%采用了该书,已知某教师采用了该书,问他收到了广告的概率是多少?解:设A代表事件“收到广告”,B为“采用了该书”。则根据题意差:D(X)(x)2pE()2E(2)()217.二项分布【例】:次品率为0.05(1)从中抽取10个1个为次品,其余为正品P0.050.959(2)10个中有1个正品,第2个为次品,其余为正品的概率P(概P(A)=0.80,P(B/A)=0.30,P(B/A非)=0.10我们想求的是率)C1100.0510.959P(AB)=0.8*0.3/0.8*0.3+0.2*0.1=0.923P(A)P(BA)P(A
8、)P(B/A)P(A非)P(B/A非)(3)10个中有2个次品0.0520.958C20.0520.958次品位置固定时前两个为1015.期望值:E(X)XiPiP(k)CkPk(1P)nkn(2X)PE(2X)2E(X)X=K表示做几次试验,有K次出现的概率为多少。E(23X)23E(X)二项颁布率为XB(n、p)二项颁布期望值E(X)=np方差D(X)=np(1-p)2x32xPXk【例。数学期望】若E(X)20,求E(),E的期望值。k!E()E(05X)0.5E(X)0.5E(X)0.5205.5E(X)Xp18.泊松公布:XP()单位时间内某事件出现的次数iiE(abx)abE(X)
9、kee为自然数=2.71828452X1111当n很大并且P很小时,可以利用泊松分布来近似地计算二项分布。444442/6泊松分布特征值:E(X)=(期望值)标准差D(X)=22.总体均值的估计:x(总体均值);P(总体比例);【例。泊松分布】某大学计算机中心有计算机80台,各台工作是相互独立的,发生故障的概率都是0.01,假设一台计算机的故障可由一个维护人员来处理,问至1x1x2(两个总体均值之差);PP2(总体比例差)nx1n)0.6827;P(x2少需配备多少维护人员,才能保证计算机发生故障但不能及时维修的概率小于0.01.解:设需配备N人,用X表示同一时刻发生故障的计算机台数,则X-B
10、(80,0.01),P(x1222nx2n2n)0n重复抽样;xzn(N1)不重复抽样。N我们要确定使P(XN)0.99的最小的N。N应满足k00.8ke0.8k!0.99即一、总体分布方差2已知,用Z代表大样本2Nnxza2N1k00.8ke0.8k!0.01查表得满足上式的最小的N是3,即至少应配备3个1的置信度为90%时,Z2=1.645维护人员。19.连续型随机变量的数学期望值和方差若已知E(x),计算E(a+bx)=a+bE(x)方差:若已知D(x),计算D(a+bx)=b2D(X)所有变量值减去期望值为0。X除以标准差的方差为1。【例。连续型随机变量的数学期望和方差】某人估计她家八
11、月份的电费(元)由下式决定:X=28.5+0.6C其中C是八月份的平均温度(单位:C),它是均值为1的置信度为95%时,Z2=1.961置信度为95.45%时,Z2=21置信度为99.73%时,Z2=3二、总体正态分布、方差未知、大样本34.2,标准差为2.2的连续型随机变量,求该人家八月份的平均电费以及标准差。解:该人家八月份的平均电费为:E(X)=28.5+0.6E(C)=28.5+0.6*34.2=49.02(元)1xZ2s2s2Nn重复抽样;xZ()不重复抽样nnN1其标准差为x=2=0.62*2=0.6*2.2=1.32【例。置信区间】某汽车租赁公司欲估计全年每个租赁汽车的顾客每次租
12、赁平均20.决策的准则:(1)极大极小原则(悲观准则)。(2)最大期望收益原则。(3)最小期望机会损失原则(机会损失)。21.决策的三个基本要素:(1)要找出决策方案(两个以上)。(2)找出自然状态(无法控制的)。(3)收益值和损失值(找出不同方案在不同自然状态下的收益值和损失值)。行驶的里程。由于全年汽车租赁量很大,随机抽取了200个顾客,根据记录计算平均行驶里程X=325公里,标准差s=60公里。试估计全年所有租赁汽车每次平均行驶里程的置信区间。置信水平分别为(1)0.90,(2)0.95.解:由于样本量n=200为大样本,故x的抽样分布为正态分布,x的标准差的估3/6n=60计值为s2(
13、n1)200=4.2426(1)置信度为90%时,Z2=1.645,由公式xza2Sn,置信区间为s2s2Nnxt重复抽样;xt(n1)()不重复抽样。nnN12【例。置信区间】为研究独生子女的每月零花钱,从某小学随机抽取了20个独生子女的家庭,得到x=107,s=40,试以95%的置信度估计该校独生子女小学生家=3251.645(4.2426)=3256.98,为318.02公里至331.98公里之间。庭平均每月零花钱的置信区间。解:因为t分布适用于正态总体,因此研究这一问题应首先假设独生子女家庭的子(2)置信度为95%时Z=3258.32。2=1.96,u的置信区间为3251.96(4.2
14、426)x非u女零花钱应服从正态分布,在小样本、总体方差未知用S2代替时,st,(n-1)【例。置信区间】某药厂在生产过程中改换了一种新的霉素,测定了36批产品的由公式xt2(n1)s2n其置信区间为:产出率与理论产出率的比值:1.281.311.481.100.991.221.651.400.951.251.321.231.431.241.731.351.310.921.101.051.391.161.19xt2(n1)s2n40=1072.09=(88.3125.7元)201.410.980.821.220.911.261.321.711.291.171.741.511.25要求:(1)计
15、算这一比值95%的置信区间;(2)得出上述结论时作出了什么假设;(3)能否以95%的置信水平说明新霉素的产出率提高了。(解:1)计算得到x=1.268s=0.228,置信度为95%时Z2=1.96,故置信区间为24.假设检验的基本思想小概率原理;接受域和拒绝域若在小概率范围的区域【例】:-n,n(0.27内)称-n,n为拒绝域;显著水平=原假设为真的,但我们却错误地拒绝了它,而这种可能性是多少?就是显著水平(也就是小概率原理)25.假设检验中两类错误:弃真错误同第五点取伪错误样本本是xza2Sn=1.2681.96(0.228)得1.194u1.342.6假的弃真错误减少则取伪错误增加=两者成
16、反比我们只能控制“弃真错误”(3)假设36批的样品是随机的。(4)说明新的霉素的产出率提高了,因为置信下限已超过1.23.总体正态分布、方差未知、小样本26.原假设和备择假设H0:u=u0H1:uu0拒绝域两边H0:uu0H1:uu0拒绝域左边H0:uu0H1:uu0拒绝域右边=等号一定在原假设上;(单侧检验);一般把希望拒绝的假设放在原假设4/61、判定系数:R1中(对立方不一样),(拒绝的错误,就是弃真错误,更直观地知道)在中立立场上,把可能拒绝的放在原假设中。三种形式,希望拒绝;可能拒绝;27.相关关系定义变量间的关系函数关系:一个变量决定了另外一个变量,是确定的完全严格的相关关系:两者
17、间有关系,一个变量不是完全由另外一个变量确定的(受其它因素的影响)28.相关关系表现形态(相关关系的类型)SSR(yy)2SSTSSESSE2SST(yy)2SSTSST判定系数取值0R21,判定系数越大,拟合程度越高R2=1。32.回归方程线性关系检验:第一步:确定存假设H0,不存在线性关系。H1:存在线性关系。第二步:F=(SSR/1)/SSE/(n-2)F(1,n-2)第三步:确定显著性水平,F2(1,n-2)第四步:F1F2(1,n-2)拒绝原假设。线性相关:变量这间的关系近似地表现为一条直线非线性相关:变量之间的关系近似地表现为一条曲线33.多元线性回归回归方程:E(y)xxx011
18、22kk正相关:两个变量同一方向变动负相关:两个变量相反方向变动估计回归方程:ybbxbxbx01122kkybbxbx0112229.回归模型:yx回归方程:E(y)xE()=00i0134.一元线性回归方程中R2=r2方差。r相关系数,b1回归系数,R2判定系数,cov协估计的回归方程ybbx01估计值为b;为b;E(y)为y0011反相等量之间相关方向:r、b1、cov反相等量之间相关方向:r、R235.时间数列分析:绝对数的时间数列,反应总规模总水平(时期指标可相加;30.(1)最小二乘法b;bybxnx2(x)222236.间隔不等:yTnxyxy101回归方程参数含义:几何意义:b0截距;b1斜率。经济意义:b1回归系数【例。最小二乘法】y0.32800.3777时点指标不可相加);平均类的时间数列,反应一般水平;相对数的时间数列yyyyyy(12)T(23)T(n1n)T12n1nii1收入(x)每增加100元,储蓄额(y)平均增加0.3777万元,(x每变动一个单位,y平均变动的数值)37.相对数、平均数序时平均数a:y=a/b;b:yab。B与r(相关系数)的关系:b10时,x、y为正相关,斜方差为正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年靶放协同杀伤机制深度解读
- 2025年低空通信网络可靠性设计
- 2026 减脂期冷锅串串课件
- 老年性黄斑变性的护理与管理
- 脊椎关节外科患者的皮肤护理
- 2026 增肌期膳食纤维摄入课件
- 非奇异对称矩阵合同在材料科学中的应用合同合同三篇
- 2026年全面合作协议合同二篇
- 胸外科术后并发症的预防和护理
- 视网膜动脉阻塞的护理实践案例
- 2024年四川攀枝花市川投能源攀水电公司招聘笔试参考题库含答案解析
- 采购英文分析报告
- Python文件和数据格式化桌面应用开发与设计
- 毕业设计指导记录表12次
- 上海轨交地下车站工程质量资料表式
- 2023年04月上海市大数据中心工作人员公开招聘26人笔试参考题库+答案解析
- JJF 1151-2006车轮动平衡机校准规范
- GB/T 9065.6-2020液压传动连接软管接头第6部分:60°锥形
- 人教PEP版英语六年级下册Recycle教学课件(附教案与反思)
- 水利工程预算定额课件
- 工程伦理西南交通大学课件
评论
0/150
提交评论