




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数量方法(二)》(代码00994)自学考试复习提要数据整理和描述⊙基本知识点:一、数据分类:按照描述事物分类:分类型数据:描述是事物品质特征,本质表现是文字形式;数量型数据:事物数量特征,用数据形式表示;日期和时间型数据。按照被描述对象与时间关系分类:截面数据:事物在某一时刻改变情况,即横向数据;时间序列数据:事物在一定时间范围内改变情况,即纵向数据;平行数据:是截面数据与时间序列数据组合。数据整理和图表显示:组距分组法:将数据按上升次序排列,找出最大值max和最小值min;确定组数,计算组距c;计算每组上、下限(分组界限)、组中值及数据落入各组频数vi(个数)和频率(),形成频率分布表;唱票记频数;算出组频率,组中值;制表。饼形图:用来描述和表现各成份或某一成份占全部百分比。注意:成份不要多于6个,多于6个通常是从中选出5个最主要,把剩下全部合并成为“其余”;成份份额总和必须是100%;百分比必须于扇形区域面积百分比一致。条形图:用来对各项信息进行比较。当各项信息标识(名称)较长时,应该尽可能采取条形图。柱形图:假如是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应该使用柱形图,好处是能够直观看出事物随时间改变情况。折线图:显著表示趋势图示方法。简单、轻易了解,对于同一组数据具备唯一性。曲线图:许多事物不但本身逐步改变,而且改变速度也是逐步改变。具备愈加自然特点,不过不具备唯一性。散点图:用来表现两个变量之间相互关系,以及数据改变趋势。茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观显示出了数据分布。数据集中趋势度量:平均数:轻易了解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”;缺点是它对极端值十分敏感。平均数= 中位数:将数据按从小到大次序排列,处于中间位置一个数或最中间两个数平均数。它优点是它对极端值不像平均数那么敏感,所以,假如包含极端值数据集来说,用中位数来描述集中趋势比用平均数更为恰当。众数:数据中出现次数最多数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反应了数据集中最常见数值,而且它不但对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;而且能够告诉我们最普遍、最流行款式、尺寸、色彩等产品特征。分组数据平均数(加权平均):,为组数,vi为第i组频数,yi为第i组组中值。5.平均数,中位数和众数关系:数据分布是对称分部时:众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数<中位数<平均数右偏分布时:众数>中位数>平均数数据离散趋势度量:极差R=最大值max-最小值min四分位点:第二四分位点就是整个数据集中位数;第一四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个平均);第三四分位点是整个数据按从小到大排列后第个(若不是整数,取左右两个平均)。四分位极差=-,它不像极差R那么轻易受极端值影响,不过依然存在着没有充分地利用数据全部信息地缺点。方差:离平均数地集中位置地远近;是频数,是组中值,即数据个数,即用分组数据计算平均数。标准差:。变异系数:表示数据相对于其平均数分散程度。⊙基本运算方法:1、一组数据3,4,5,5,6,7,8,9,10中中位数是()A.5 B.5.5C.6 D.6.5解析:按从小到大排列,此九个数中,正中间是6,从而答案为C。2、某企业30岁以下职员占25%,月平均工资为800元;30—45岁职员占50%,月平均工资为1000元;45岁以上职员占25%,月平均工资1100元,该企业全部职员月平均工资为()A.950元 B.967元C.975元 D.1000元解析:25%*800+50%*1000+25%*1100=975,故选C。3、有一组数据平均数和标准差分别为50、25,这组数据变异系数为()A.0.2 B.0.4C.0.5 D.0.7解析:变异系数=,故选C。4、若两组数据平均值相差较大,比较它们离散程度应采取()A.极差 B.变异系数C.方差 D.标准差解析:考变异系数使用方法,先B。5、一组数据4,4,5,5,6,6,7,7,7,9,10中众数是()A.6B.6.5C.7 解析:出现最多数为众数,故选C。6、对于峰值偏向左边单峰非对称直方图,通常来说()A.平均数>中位数>众数 B.众数>中位数>平均数C.平均数>众数>中位数 D.中位数>众数>平均数解析:数据分布是对称分部时:众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数<中位数<平均数右偏分布时:众数>中位数>平均数需要记住提,峰值偏向左边单峰非对称直方图称为右偏分布,峰值偏向右边单峰非对称直方图称为左偏分布,从而此题答案为B。第二章随机事件及其概率⊙基本知识点:随机试验与随机事件:随机试验:能够在相同条件下重复进行;每次试验可能结果可能不止一个,不过试验全部可能结果在试验之前是确切知道;试验结束之前,不能确定该次试验确实切结果。样本空间:全部基本事件全体所组成集合称为样本空间,是必定时间;样本空间中每一个基本事件称为一个样本点;每一个随机事件就是若干样本点组成集合,即随机事件是样本空间子集;不包含任何样本点随机事件就是不可能事件。样本空间表示方法:列举法:如掷骰子描述法:若掷骰子出现可描述为:掷骰子出现奇数点。事件关系和运算事件关系:包含关系:事件A每一个样本点都包含在事件B中,或者事件A发生必定造成事件B发生,成为事件B包含事件A,记做。若则称事件A与事件B相等,记做A=B。事件并:事件A和事件B最少有一个发生事件称为事件A与事件B并,记做。事件交:事件A与事件B同时发生事件称为事件A与事件B交,记做。互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥,不然称这两个事件是相容。。对立事件:一个事件B若与事件A互斥,且它与事件A并是整个样本空间Ω,则称事件B是事件A对立事件,或逆事件。事件A对立事件是,。事件差:事件A发生,但事件B不发生事件,称为事件A与事件B差,记做A-B。2.运算律:交换律:结合律:分配律: :对偶律:。事件概率与古典概型:事件A发生频率稳定值称为事件A发生概率,记做:,。概率性质:非负性:;规范性:;完全可加性:;;设A,B为两个事件,若,则有,且;古典概型试验与古典概率计算:古典概型试验是满足以下条件地随机试验:它样本空间只包含有限个样本点;每个样本点发生是等可能。古典概率计算:;两个基本原理:加法原理:假如做一件事情有两类方法,在第一类方法中有m种不一样方法,而在第二类方法中有n种不一样方法,那么完成这件事情就有m+n种不一样方法。加法原理能够推广到有多类方法情况;乘法原理:假设做一件事情能够分成两步来做,做第一步有m种不一样方法,做第二步有n种不一样方法,那么完成这件事情有mn种不一样方法。乘法原理也能够推广到多个步骤情形。条件概率:在事件B发生条件下(假定P(B)>0),事件A发生概率称为事件A在给定事件B下条件概率,简称A对B条件概率,记做:;概率公式:互逆:对于任意事件A,;广义加法公式:对于任意两个事件A和B,,广义加法公式能够推广到任意有限个事件并情形,尤其地:减法公式:——→;乘法公式:P(AB)=P(A)P(B|A),P(A)≠0;事件独立:若,则相互独立。全概率公式:设事件A1,A2,…,An两两互斥,A1+A2+……+An=Ω(完备事件组),且P(Ai)>0,i=1,2,…,n则对于任意事件B,有:;贝叶斯公式:条件同上,则对于任意事件B,假如P(B)>0,有: ; ⊙基本运算方法:1、事件表示:例1、设A、B、C是三个随机事件,用A、B、C运算关系表示事件:A不发生但B与C发生为()A. B.C. D.解析:本题考查事件表示方法,选B。例2、对随机事件A、B、C,用E表示事件:A、B、C三个事件中最少有一个事件发生,则E可表示为()A.AUBUC B.Ω-ABC C. D.解析:选A。2、古典概型例1、正方体骰子六个面点数分别为2、4、6、8、10、12,掷二次所得点数之和大于等于4概率为()A. B.C. D.1 解析:样本空间中样本点一共有36个,两次掷得点数和不可能小于4,从而选D。例2、在一次抛硬币试验中,小王连续抛了3次,则全部是正面向上概率为()A. B.C. D.解析:样本空间一共有8个样本点,全部正面向上只有一次,故选B。例3、某夫妇按国家要求,能够生两胎。假如他们每胎只生一个孩子,则两胎全是女孩概率为()A. B.C. D.解析:生两胎,样本空间共有4个样本点,故选C。3、加法公式、减法公式、条件概率例1、设A、B为两个事件,P(A)=0.4,P(B)=0.3。假如BA,则P(AB)=()A.0.1 B.0.3C.0.4 D.0.7解析:BA,则P(AB)=P(B),故选B。例2、设A、B为两个事件,P(A)=0.4,P(B)=0.8,P()=0.5,则P(B│A)=()A.0.45 B.0.55C.0.65 D.0.375解析:由P()=P(B)-P(),从而P()=0.3,P(B│A)==0.375,故选D。例3、事件和B相互独立,且P()=0.7,P(B)=0.4,则P(AB)=()A.0.12 B.0.21C.0.28 D.0.42解析:事件和B相互独立知事件A与B独立,从而P(AB)=P(A)P(B)=0.12,A。例4、事件A,B相互独立,P(A)=0.3,P(B|)=0.6,则P(A)+P(B)=()A.0. B.0.3C.0.9 D.1解析:由事件A,B相互独立知P(B|)=P(B)=0.6,从而选C。4、事件互斥、对立、独立关系:例1、A与B为互斥事件,则A为()A.AB B.BC.A D.A+B解析:A与B为互斥事件,即AB,从而选C。例2、事件A、B相互对立,P(A)=0.3,P(AB)=0.7,则P(A-B)=()A.0 B.0.2C.0.3 D.1解析:由事件A、B相互对立知AB,从而P(A-B)=P(A)=0.3,选C。例3、事件A、B相互独立,P(A)=0.2,P(B)=0.4,则P(A+B)=()A.0.50 B.0.51C.0.52 D.0.53解析:P(A+B)=P(A)+P(B)-P(AB),由A、B相互独立知P(AB)=P(A)P(B),从而P(A+B)=P(A)+P(B)-P(A)P(B)=0.52,选C。例4、事件A、B互斥,P(A)=0.3,P(B|)=0.6,则P(A-B)=()A.0 B.0.3C.0.9 D.1解析:事件A、B互斥有AB,从而P(A-B)=P(A)-P(AB)=P(A)=0.3,选B。5、全概率公式和贝叶斯公式:例1、在厂家送检三箱玻璃杯中,质检部门抽检其中任一箱概率相同。已知第一箱次品率为0.01,第二箱次品率为0.02,三箱玻璃杯总次品率为0.02。求第三箱次品率。若从三箱中任抽一只是次品,求这个次品在第一箱中概率。解析:设表示抽到第箱,=1,2,3.B表示次品,则,,,从而,即第三箱次品率为0.03.即从三箱中任抽一只是次品,这个次品在第一箱中概率为1/6。例2、实战演练中,在甲、乙、丙三处射击概率分别为0.2,0.7,0.1,而在甲、乙、丙三处射击时命中目标概率分别为0.8,0.4,0.6。若最终目标被命中,求目标是由乙处射击命中概率。解析:设表示在甲处射击,表示在乙处射击,表示在丙处射击,B表示命中,则,,, 从而目标是由乙处射击命中概率为0.56.第三章随机变量及其分布⊙基本知识点:离散型随机变量:取值能够逐一列出数学期望:定义:,以概率为权数加权平均数;性质:E(C)=C(常数期望是本身)E(aX)=aE(X)(常数因子提出来)E(aX+b)=aE(X)+b(一项一项分开算)E(aX+bY)=aE(X)+bE(Y)(线性性)方差:定义:;性质:D(c)=0(常数方差等于0)D(aX)=a2D(X)(常数因子平方提)D(aX+b)=a2D(X)公式:(方差=平方期望-期望平方);惯用随机变量:0-1分布:随机变量X只能取0,1这两个值;X~B(1,p);E(X)=p D(X)=p(1-p)二项分布:分布律:;X~B(n,p)E(X)=npD(X)=np(1-p)适用:随机试验具备两个可能结果A或者,且P(A)=p,P()=1-p,将试验独立重复n次得到n重贝努里试验。泊松分布:分布律:,λ>0X~P(λ)E(X)=λD(X)=λ适用:指定时间内某事件发生次数。连续型随机变量:设X是一个连续型随机变量:X均值,记做μ,就是X数学期望,即μ=EX;X方差,记做D(X)或,是数学期望,即:X标准差,记做σ,是X方差算术平方根,即;惯用连续型随机变量:名称分布律或密度记法E(X)D(X)均匀分布指数分布,λ>0正态分布μ标准正态分布X~N(0,1)01正态分布密度曲线y=P(x)是一条关于直线x=μ对称钟形曲线,在x=μ处最高,两侧快速下降,无限靠近X轴;σ越大(小),曲线越矮胖(高瘦)。标准正态分布密度曲线y=φ(x),是关于Y轴对称钟形曲线。随机变量标准化(减去期望除标差)。标准化定理:设。二维随机变量:用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)取值带有随意性,但具备概率规律,则称(X,Y)为二维随机变量。X,Y协方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXEY,cov(X,Y)>0说明X与Y之间存在一定程度正相关关系,cov(X,Y)=0称X与Y不相关,cov(X,Y)<0说明X与Y存在一定程度负相关关系;X,Y相关系数:,取值范围是,越靠近1,表明X与Y之间正线性相关程度越强,越靠近于-1,表明X与Y之间负线性相关程度越弱,当等于0时,X与Y不相关。随机变量线性组合:E(aX+bY)=aE(X)+bE(Y);决议准则与决议树:对不确定原因进行估量,从几个方案中选择一个,这个过程称为决议;决议三准则:极大极小标准:将各种方案最坏结果(极小收益)进行比较,从中选择极小收益最大方案;最小期望损失标准:选择期望损失最小方案;最大期望收益标准:选择期望收益最大方案。决议树:使我们把不确定原因过程以图解形式表示出来,有简单、直观优点。⊙基本运算方法:1、随机变量含义:例1、某一事件出现概率为1/4,试验4次,该事件出现次数将是()A.1次 B.大于1次C.小于1次 D.上述结果都有可能解析:答案为D,此题考查对随机变量了解。2、六种常见分布例1、某企业出厂产品200个装一盒,产品分为合格与不合格两类,合格率为99%,设每盒中不合格产品数为X,则X通常服从()A.正态分布 B.泊松分布C.均匀分布 D.二项分布解析:将任一个合格品记为0,不合格记为1,则X~B(200,0.01),选D。例2、通常正态分布N(μ,σ2)概率分布函数F(x)转换为标准正态分布N(0,1)概率分布函数时表示为()A.Φ(x) B.ΦC.Φ(x-μ) D.Φ解析:本题考查正态分布标准化,选B.例3、掷一枚不均匀硬币,正面朝上概率为,将此硬币连掷3次,则恰好2次正面朝上概率是()A. B.C. D.解析:记X表示正面向上次数,则X~B(3,),,C。例4、若随机变量X服从正态分布,则随机变量Y=aX+b(a≠0)服从()A.正态分布 B.二项分布C.泊松分布 D.指数分布解析:本题考查正态分布线性组合仍为正态分布,选A。例5、某电梯一星期发生故障次数通常服从()A.两点分布 B.均匀分布C.指数分布 D.泊松分布解析:选D,泊松分布描述不常发生事情。例6、一个服从二项分布随机变量,其方差与期望之比为1/3,则该二项分布参数P为()A.1/3 B.2/3C.1 D.3解析:此题考查二项分布方差与期望,,从而选B。例7、设随机变量X概率密度函数为(x)=(-)则X方差D(X)=()A.1 B.2C.3 D.4解析:此题考查正态分布密度函数,选D。例8、随机变量X分布律为P(x=k)=,k=0,1,2,3,…则X方差D(X)=()A.0.4 B.2C.2.5 D.3解析:此题考查泊松分布方差,选A。例9、据调查,某单位男性员工中吸烟者百分比为20%,在一个由10人组成该单位男性员工随机样本中,恰有3人吸烟概率是多少?解析:设X表示10人中抽烟人数,则X~B(10,0.2),从而(自行用计算器计算出概率)。例10、某零件寿命服从均值为1200小时,标准差为250小时正态分布。随机地抽取一个零件,求它寿命不低于1300小时概率。((0.3)=0.6179,(0.4)=0.6554,(0.5)=0.6915)解析:设某零件寿命为X,则X~N(1200,),从而=1-(0.4)=0.34463、随机变量期望、方差及协方差运算和性质:例1、设X和Y为两个随机变量,D(X)=10,D(Y)=1,X与Y协方差为-3,则D(2X-Y)为()A.18 B.24C.38 D.53解析:由知,答案为D。例2、设X和Y是两个相互独立随机变量,已知D(X)=60,D(Y)=80,则Z=2X-3Y+7方差为()A.100 B.960C.1007 D.1207解析:因为常数方差为0,且由X和Y独立知其协方差为0,从而由公式知答案为B。例3、设X为随机变量,E(X)=2,D(X)=6,则E(X2)为()A.5 B.10C.20 D.30解析:由方差等价定义:D(X)=E(X2)-E2(X)知,答案为B。例4、若已知,则X与y相关系数r为A.0.2 B.0.6C.0.7 D.0.8解析:由相关系数计算公式知答案为C。例5、设X、Y为随机变量,D(X)=6,D(Y)=7,Cov(X,Y)=1,试计算D(2X-3Y).解析:由知D(2X-3Y)=4D(X)-12Cov(X,Y)+9D(Y)=75。4、概率分布、密度函数:例1、离散型随机变量X只取-1,0,2三个值,已知它取各个值概率不相等,且三个概率值组成一个等差数列,设P(X=0)=α,则α=()A.1/4 B.1/3C.1/2 D.1解析:因为三者成等差数列,故设X取-1概率为α-d,取2概率为α+d,而三者相加为1,从而α=1/3,答案为B。例2、设随机变量X概率密度函数为P(x)=则x数学期望E(X)=()A.1 B.1.25C.1.5 D.2解析:显然,从概率密度函数知X~U(1,1.5),从而期望为1.25,答案为B。第四章抽样方法与抽样分布⊙基本知识点:抽样基本概念:总体:研究对象全体;个体:组成总体每一个个体;抽样:从总体中抽取一部分个体过程;样本:从总体中抽出一部分个体组成集合;样本值:在一次试验或观察以后得到一组确定值;随机样本:个体被抽到可能性相同;相互独立;同分布。抽样方法:简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得全部可能样本都有一样机会被抽中。有放回抽样样本个数为;无放回抽样样本个数为。系统抽样(等距抽样):将总体单元按照某种次序排列,按照规则确定一个起点,然后每隔一定间距抽取样本单元。分层抽样:在抽样之前将总体划分为互不交叉重合若干层,然后从各个层中独立地抽取一定数量单元作为样本。整群抽样:在总体中由若干个总体单元自然或人为地组成群体称为群,抽样时以群体为抽样单位,对抽中各群全部总体单元进行观察。抽样中经常碰到三个问题:抽样选取不妥;无回答:处理无回答惯用方法:注意调查问卷设计和加强调查员培训;进行数次访问;替换无回答样本单元;对存在无回答结果进行调整。抽样本身误差。抽样分布与中心极限定理:不包含任何未知参数样本函数称作统计量;惯用统计量:样本均值:;样本方差:;样本标差:。统计量分布叫做抽样分布,当样本容量n增大时,不论原来总体是否服从正态分布,其样本均值都将趋向于正态分布,当n≥30时,样本均值就能够近似服从正态分布。中心极限定理:设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,;==μ;设随机变量X1,X2,……Xn独立同分布,且EXi=μ,DXi=σ2,i=1,2,……n,,则;;设随机变量X1,X2,……Xn独立同(0,1)分布,则,且。惯用抽样分布样本均值抽样分布:总体均值、方差抽样方式样本期望样本方差有限总体重复抽样μ有限总体不重复抽样μ无限总体任意μ若有限总体不重复抽样<5%时,其修正系数近似为1,样本均值方差能够简化为。样本百分比抽样分布:总体百分比抽样方法EPDP无限总体任意有限总体有放回抽样有限总体无放回抽样若有限总体无放回抽样<5%时,其修正系数近似为1,样本百分比方差能够简化为。三种小样本抽样分布:名称统计量记法上α分位点χ2分布χ1,χ2……χn分布χ2~χ2(n)分布X~N(0,1),Y~χ2(n)X,Y相互独立F分布,U,V相互独立,几个主要统计量分布:设X~N(μ,σ2),X1,X2,……Xn是X样本,样本均值,样本方差:分布:;χ2分布:;设X1,X2,……Xn是样本,Y1,Y2,……Yn是样本,而且都相互独立,则:;;⊙基本运算方法:1、基本概念及抽样方法:例1、假如抽选10人作样本,在体重50千克以下人中随机抽选2人,50~65千克人中随机选5人,65千克以上人中随机选3人,这种抽样方法称作()A.简单随机抽样 B.系统抽样C.分层抽样 D.整群抽样解析:本题考查概率抽样方法分类,答案为C。例2、将总体单元按某种次序排列,按照规则确定一个随机起点,然后每隔一定间隔逐一抽取样本单元。这种抽选方法称为()A.系统抽样 B.简单随机抽样C.分层抽样D.整群抽样解析:本题考查概率抽样方法分类,答案为A。2、抽样分布与中心极限定理:例1、一个具备任意分布形式总体,从中抽取容量为n样本,伴随样本容量增大,样本均值将逐步趋向于()A.泊松分布 B.分布C.F分布 D.正态分布解析:本题考查中心极限定理,答案为D。例2、在简单随机抽样中,假如将样本容量增加9倍,则样本均值抽样分布标准误差将变为原来()A.1/9倍 B.1/3倍C.3倍 D.9倍解析:因为D()=,从而标准误差为,答案为B。例3、对于容量为N总体进行不重复抽样(样本容量为n),样本均值方差为()A. B.C. D.解析:本题考查样本均值抽样分布,答案为A。例4、设X1,X2,…,Xn是从正态总体N(μ,σ2)中抽得简单随机样本,其中μ已知,σ2未知,n≥2,则以下说法中正确是()A.是统计量 B.是统计量C.是统计量 D.是统计量解析:本题考查是统计量概念,不能含有未知参数,故答案为D。例5、一个具备任意分布形式总体,从中抽取容量为n样本,伴随样本容量增大,样本均值逐步趋向正态分布,这一结论是()A.抽样原理 B.假设检验原理C.估量原理 D.中心极限定理解析:本题考查是中心极限定理内容,答案为D。3、三种小样本分布与几个主要统计量分布例1、从总体X~N()中抽取样本,……,计算样本均值,样本方差,当n<30时,随机变量服从()A.分布 B.F分布C.t分布 D.标准正态分布解析:本题考查是几个主要统计量分布中t分布,答案为C。例2、从总体X~N()中重复抽取容量为n样本,则样本均值标准差为()A. B.C. D.解析:本题考查依然是样本均值抽样分布,由D()=知答案为D。第五章参数估量⊙基本知识点:参数估量参数点估量:设总体分布中含有未知参数θ,从总体中抽取一个样本X1,X2,……Xn,用来估量未知参数θ统计量(X1,X2,……Xn)称为参数θ一个估量量,若X1,X2,……Xn是样本一组观察值,则(X1,X2,……Xn)称为参数θ一个点估量值。估量量评价标准:无偏性:设是总体中未知参数θ估量量,若则称是θ无偏估量量。样本均值是总体均值μ无偏估量量,;样本方差S2是总体方差σ2无偏估量量,ES2=σ2。有效性:θ方差最小无偏估量量称为θ有效估量量;正态总体样本均值是总体均值μ有效估量量。(以上两种情况在样本容量固定情况下发生;当样本容量增大是越来越靠近真值。)一致性:若当样本容量增大时,估量量值越来越靠近未知参数θ真值,则称是θ一致估量量。样本均值方差是总体均值方差一致估量量。总体均值区间估量:设θ是总体分布中未知参数,X1,X2,……Xn是总体一个样本,若对给定α(0<α<1),参在两个估量量1(X1,X2,……Xn)和2(X1,X2,……Xn),使,则称随即区间(1,2)位参数θ置信度位1-α置信区间。α称为显著水平。意义:随机区间(1,2)包含θ真值概率是1-α。总体均值置信区间(置信度1-α)总体分布样本量σ已知σ未知正态分布大样本正态分布小样本非正态分布大样本总体百分比区间估量:总体百分比置信区间(置信度1-α)样本量抽样方式置信区间大样本有放回抽样无放回抽样两个总体均值之差置信区间(置信度1-α)总体分布样本量σ已知σ未知正态分布大样本用S1代替σ1用S2代替σ2正态分布小样本非正态分布大样本用S1代替σ1用S2代替σ2大样本,两个总体百分比之差()置信区间,置信度(1-α):样本容量确实定(置信度1-α):抽样方式置信区间允许误差样本容量有放回抽样(或抽样比<5%)总体均值总体百分比不放回抽样总体均值先算出有放回抽样样本容量n0;然后:总体百分比⊙基本计算方法:1、参数估量及评价标准:例1、估量量无偏性是指()A.估量量数学期望等于总体参数真值B.估量量数学期望小于总体参数真值C.估量量方差小于总体参数真值D.估量量方差等于总体参数真值解析:本题考查估量量无偏性这一概念,答案为A。例2、若T1、T2均是θ无偏估量量,且它们方差关于系DT1>DT2,则称()A.T1比T2有效 B.T1是θ一致估量量C.T2比T1有效 D.T2是θ一致估量量解析:本题考查估量量有效性这一概念,答案为C。例3、设总体X服从正态分布N(μ,σ2),μ和σ2未知,(X1,X2,…,Xn)是来自该总体简单随机样本,其样本均值为,则总体方差σ2无偏估量量是()A. B.C. D.解析:本题考查一个主要结论——样本方差是总体方差无偏估量,答案为A。2、区间估量:例1、若置信水平保持不变,当增大样本容量时,置信区间()A.将变宽 B.将变窄C.保持不变 D.宽窄无法确定解析:答案为B。例2、置信系数1-表示区间估量()A.精准性 B.显著性C.可靠性 D.准确性解析:本题考查置信系数概念,答案为C。例3、设总体X服从正态分布N(,),已知,用来自该总体简单随机样本X1,X2,…,Xn建立总体未知参数置信水平为1-置信区间,以L表示置信区间长度,则()A.越大L越小 B.越大L越大C.越小L越小 D.与L没关于系解析:因为总体方差已知,从而L=2*,越大L越小,故选A。例4、对于成对观察两个正态总体均值差区间估量,能够采取统计量是()A.t统计量 B.Z统计量C.统计量 D.F统计量解析:本题考查不一样条件下,选取不一样统计量进行区间估量,答案为A。例5、在小样本情况下,假如总体服从正态分布且方差未知,则总体均值置信度为1-α置信区间()A.x±ZC.x±t解析:本题考查不一样条件下,选取不一样统计量进行区间估量,答案为C。例6、假设某单位员工天天用于阅读书籍时间服从正态分布,现从该单位随机抽取了16名员工,已知他们用于阅读书籍平均时间为50分钟,样本标准差为20分钟,试以95%置信度估量该单位员工用于阅读书籍平均时间置信区间。(解析:本题是正态总体,总体方差未知,小样本,显然采取下面公式计算:(以下详细计算略)例7、某餐馆欲估量每位用户午餐平均消费数额,依据以往经验,用户午餐消费标准差为15元。假设中午在该餐馆就餐用户非常多,现要以95%置信度估量每位用户午餐平均消费数额,并要求允许误差不超出3元,应抽取多少位用户作为样本?(Z0.05=1.645,Z0.025=1.96)解析:题设条件是总体分布未知,大样本,其区间估量公式为,,从而允许误差为(以下详细计算略)例8、某企业采取两种不一样促销方式进行销售。使用甲促销方式进行销售30天里,日均销售额为50万元,样本标准差为5万元;使用乙促销方式进行销售30天里,日均销售额为40万元,样本标准差为4万元。求使用甲、乙促销方式进行销售日均销售额之差置信度为95%置信区间。(Z0.05=1.645,Z0.025=1.96)解析:本题显然是双总体均值之差区间估量,采取公式:(以下详细计算略)例9、某市场调查机构对某品牌家电进行市场调查,一共随机调查了1000名用户,其中有700人表示喜欢该品牌家电。试以95%可靠性估量喜欢该品牌家电用户百分比P置信区间。(Z0.05=1.645,Z0.025=1.96)解析:本题考查是百分比区间估量,应用公式(以下详细计算略)第六章假设检验⊙基本知识点:假设检验基本概念:小概率原理:小概率事件在一次试验中极难发生,但并不意味着绝对不会发生。对总体参数取值所作假设,称为原假设(或零假设),记做H0;原假设对立假设称为备选假设(备择假设),记做H1。犯“H0为真,但拒绝H0”这种错误概率α称为显著水平;这种错误称为第一类错误(弃真错误);“H0不成立,但接收H0”这种错误称为第二类错误;犯这种错误概率记做β。用来判断是否接收原假设统计量称为检验统计量。当检验统计量取某个范围D内值时,我们拒绝原假设H0;这是D称为拒绝域;拒绝域边界点称为临界点。假设检验基本思想:先假定H0成立,在这个前提下用样本数据进行推导、计算,假如造成小概率事件发生,择拒绝H0,不然就接收H0。当检验统计量~N(0,1)时:H0:μ=μ0H1:μ≠μ0双假检验:H0:μμ0H1:μ<μ0左侧检验:H0:μμ0H1:μ>μ0右侧检验:假设检验五个步骤:提出原假设与备选假设。标准:1、把含有等号式子作为原假设;2、从样本做出猜测而希望证实问题作为备选假设;选取统计量。经过选取适当统计量来结构小概率事件;按P(拒绝H0/H0真)=α确定拒绝域;计算统计量值;做出判断:当样本值落在拒绝域内,小概率事件发生,拒绝H0;当样本值不落在拒绝域内,小概率事件没发生,接收H0。总体均值假设检验:已知条件H0H1检验统计量及其分布拒绝域X~N(μ,σ2)σ=σ0,已知μ=μ0,或大样本μ=μ0μ≠μ0μμ0μ<μ0μμ0μ>μ0X~N(μ,σ2)σ未知,小样本μ=μ0μ≠μ0μμ0μ<μ0μμ0μ>μ0三、总体百分比假设检验:已知条件H0H1检验统计量及其分布拒绝域大样本两个总体均值(百分比)之差假设检验:已知条件H0H1检验统计量及其分布拒绝域,σ1,σ2已知,或大样本μ1=μ2μ1≠μ2(设)μ1μ2μ1<μ2μ1μ2μ1>μ2,σ1,σ2未知,或小样本μ1=μ2μ1≠μ2μ1μ2μ1<μ2μ1μ2μ1>μ2大样本⊙基本计算方法:1、假设检验基本概念:例1、显著性水平是指()A.原假设为假时,决议判定为假概率B.原假设为假时,决议判定为真概率C.原假设为真时,决议判定为假概率D.原假设为真时,决议判定为真概率解析:第一类错误又称拒真(弃真)错误,犯这类错误概率为,故也称其为错误,表示原假设为真,决议判定为假从而拒绝接收原假设,故选C。例2、以下关于第一类、第二类错误说法中正确是()A.原假设H0为真而拒绝H0时,称为犯第一类错误B.原假设H0为真而拒绝H0时,称为犯第二类错误C.原假设H0为假而接收H0时,称为犯第一类错误D.原假设H0为假而拒绝H0时,称为犯第一类错误解析:本题考查第一类错误和第二类错误概率,选A。例3、在假设检验中,记Ho为待检假设,则犯第二类错误指是()A.H0成立,经检验接收H0 B.H0不成立,经检验接收H0C.H0成立,经检验拒绝Ho D.H0不成立,经检验拒绝H0解析:本题考查第一类错误和第二类错误概率,选B。例4、设是假设检验中犯第一类错误和第二类错误概率。在其余条件不变情况下,若增大样本容量n,则()A. B.C.D.解析:若样本容量不变,减小必增大,减小必增大,若要二者同时减小,必增大样本容量,从而答案为B。2、假设检验:例1、在比较两个非正态总体均值时,采取Z检验必须满足()A.两个总体方差已知 B.两个样本都是大样本C.两个样本容量要相等 D.两个总体方差要相等解析:本题考查是不一样条件下,选取不一样检验统计量进行检验,选B。例2、对于假设H0:μ≥μ0,H1:μ<μ0,若抽得一个随机样本,其样本均值小于μ0,则()A.必定拒绝H0 B.有可能拒绝H0C.必定接收H1 D.有1-α可能性接收H0解析:本题考查是假设检验拒绝域问题,答案为B。例3、对方差已知正态总体均值假设检验,可采取方法为()A.Z检验 B.t检验C.F检验 D.检验解析:本题考查是不一样条件下,选取不一样检验统计量进行检验,选A。例4、假设总体服从正态分布,在总体方差未知情况下,检验统计量为t=,其中n为样本容量,S为样本标准差,则H0拒绝域为()A. B.C. D.解析:本题考查是假设检验拒绝域问题,显然双侧检验,t分布,答案为B。例5、假设X~N(),H0∶≥,Hl∶<,且方差已知,检验统计量Z=,假如有简单随机样本X1,X2…Xn,其样本均值为>,则()A.必定拒绝原假设 B.必定接收原假设C.有可能拒绝原假设 D.有可能接收原假设解析:本题考查是假设检验拒绝域问题,答案为B。例6、对正态总体N(,9)中进行检验时,采取统计量是()A.t统计量 B.Z统计量C.F统计量 D.统计量解析:正态总体,总体方差已知,选取Z统计量,故答案为B。例7、在假设检验中,假如仅仅关心总体均值与某个给定值是否有显著区分,应采取()A.单侧检验 B.单侧检验或双侧检验C.双侧检验 D.相关性检验解析:答案为C。例8、已知X~N(μ,),σ0已知,对于假设H0:μ=μ0,H1:μ≠μ0,抽取样本X1,…,Xn,则其检验统计量为___________。解析:正态总体,总体方差已知,故选取统计量例9、在对正态总体X~N(μ,σ2)均值μ区间估量中,当置信系数1-α增大时,置信区间会___________。解析:置信系数1-α增大时,置信区间会减小。例10、在对总体X~N(μ,σ2)中μ假设H0∶μ=μ0进行检验时,若总体方差σ2较大,此时H0接收域___________。解析:依题意,总体方差已知,且是双侧检验,故拒绝域为,从而接收域为。例11、某饮料生产商声称其生产某种瓶装饮料中营养成份A含量不低于6克,现随机抽取100瓶该饮料,测得其营养成份A含量平均值为5.65克,样本标准差为1.2克。试问该饮料生产商申明是否真实可信?(可靠性取95%,Z0.05=1.645,Z0.025=解析::,: 从而拒绝域为,即 计算得Z=-2.91,从而从而拒绝,即认为该饮料生产商申明不真实。例12、已知某地人均消费为6000元。,从该地个人消费总体中随机取得一个样本为:7000、7500、8000、8000、7000、9000、8000、8500、9000(单位:元)。假设该地个人消费服从正态分布。(1)求该地个人消费样本均值。(2)求该地个人消费样本方差。(3)请以95%可靠性检验该地人均消费是否比有显著上涨?并给出对应原假设、备择假设及检验统计量。(t0.025(8)=2.306,t0.025(9)=2.26,t0.025(10)=2.228,t0.05(8)=1.8595,t0.05(9)=1.8331,t0.05(10)=1.8125)解析:(1)=8000元(2)=562500元(3):,:拒绝域为=1.8595计算得8>1.8595从而拒绝,即认为有显著上涨。例13、某培训中心采取A、B两种培训方法对学员进行培训。从使用A培训方法和使用B培训方法学员中分别随机抽取了10人,测得他们完成培训所需时间分别为10,15,8,13,18,20,17,12,12,15小时和10,15,7,8,6,13,14,15,12,10小时。假设使用A培训方法和使用B培训方法所需培训时间均服从正态分布,且方差相等。(1)求使用A培训方法和使用B培训方法学员所需培训时间平均值及样本方差。(2)请给出检验A、B两种培训方法所需培训时间是否有显著性差异检验原假设和备择假设。(3)检验A、B两种培训方法所需培训时间是否有显著性差异(显著性水平取5%)。(t0.05(18)=1.734,t0.05(19)=1.729,t0.05(20)=1.7247,t0.025(18)=2.1,t0.025(19)=2.09,t0.025(20)=2.086)解析:(1)均值公式:样本方差公式:(此处详细计算略)(2):,:(3)选取检验统计量其拒绝域为(下面详细计算略)第七章相关与回归分析⊙基本知识点:相关分析:线性相关:数量关系近似线性函数;正线性相关:变量是同向改变;负线性相关:变量是反向改变;非线性相关:变量关系近似非线性函数;完全相关:变量是函数关系;完全线性相关:变量关系是线性函数;完全非线性相关:变量关系是非线性函数;不相关:变量之间没有任何规律。协方差:总体相关系数: 样本相关系数:一元线性回归:若对控制变量X每一个确定值,随机变量数学期望存在,则此数学期望是X函数,称为Y关于X回归函数;若一元回归函数是线性函数,则称为一元线性回归(回归直线);回归直线,其中称为斜率,称为截距。总变差平方和=剩下平方和+回归平方和SST=SSE+SSR总变差平方和:Y1,Y2,……Yn分散程度;回归平方和:X1,X2,……Xn分散性引发Y1,Y2,……Yn分散程度;剩下平方和:其余原因引发分散程度。 判定系数:最小二乘法:是使因变量观察值yi与估量值SSE(剩下平方和)达成最小来求得a和b方法;即:。估量标准误差:判定系数意义:0≤r2≤1SSE意义r2=1SSE=0,观察点落在回归直线上,X,Y完全线性相关r2→1SSE→0,观察点靠近回归直线,X,Y高度线性相关r2=0SSE=SSTX改变与Y无关,无线性相关关系给定,置信度为1-α,预测区间与置信区间:点估量:预测区间:;置信区间:。多元线性回归和非线性回归:多元线性回归:可线性化非线性回归:名称方程变量代换线性回归双曲函数对数函数幂函数多项式函数,,……,⊙基本计算方法:1、相关分析及基本概念:例1、假如相关系数r=-1,则表明两个随机变量之间存在着()A.完全反方向变动关系 B.完全同方向变动关系C.互不影响关系 D.靠近同方向变动关系解析:本题考查相关系数概念,A。例2、当全部观察点都落在回归直线y=a+bx上,则x与y之间相关系数为()A.r=0 B.r2=1C.-1<r<1 D.0<r<1解析:本题一样考查相关系数概念,因为不确定a比0大还是小,故选B。例3、在回归分析中,估量标准误差主要是用来检测()A.回归方程拟合程度 B.回归系数显著性C.回归方程显著性 D.相关系数显著性解析:本题考查估量标准误差概念,答案为A。例4、两个现象之间相互关系类型有()A.函数关系和因果关系 B.回归关系和因果关系C.函数关系和相关关系 D.相关关系和因果关系解析:本题考查两个现象之间关系分类,答案为C。例5、假如相关系数r=0,则表明两个变量之间()A.相关程度很低 B.不存在任何关系C.不存在线性相关关系 D.存在非线性相关关系解析:相关系数为0,只能说两个变量之间不存在线性关系,但可能存在非线性关系,故答案为C。例6、测度各实际观察点在回归直线散布情况统计量为()A.回归方程 B.相关系数C.回归系数 D.估量标准误差解析:答案为D。2、回归分析例1、在直线回归方程=a+bxi中,若回归系数b<0,则表示x对y线性影响是()A.不显著 B.显著C.正向影响 D.反向影响解析:本题考查对回归系数了解,显然,答案为D。例2、在回归分析中,F检验主要是用来检验()A.相关系数显著性 B.单个回归系数显著性C.线性关系显著性 D.拟和优度显著性解析:在回归分析中,F检验主要是用来检验线性关系,答案当然是C。例3、设一元线性回归方程为,若已知b=2,,,则a等于)A.-28 B.-25C.25 D.28解析:由知,本题答案为B。例4、一元回归直线拟合优劣评价标准是()A.估量标准误差越小越好 B.估量标准误差越大越好C.回归直线斜率越小越好 D.回归直线斜率越大越好解析:本题考查估量标准误差概念,答案为A。例5、假如回归平方和SSR与剩下平方和SSE比值为4∶1,则判定系数为()A.0.2 B.0.4C.0.6 D.0.8解析:因为判定系数==4/5,故答案为D。例6、为研究某行业企业年销售额与年销售支出之间关系,调查取得了5个企业关于数据以下:年销售支出x(万元/年)1020406080年销售额y(百万元/年)1130455560要求:(1)计算年销售支出与年销售额之间简单相关系数;(2)以年销售支出为自变量,年销售额为因变量,建立直线回归方程;(3)估量年销售支出为50万元时企业预期销售额。解析:(1)相关系数(相关计算在此略去)(2)设回归方程为,其中系数计算公式以下:,,其中。(3)将代入(2)中计算回归方程,得到值即可。例7、为研究某商品A销售量与价格之间关系,调查取得5个月月销售量与月销售价格数据以下:单价x(元/件)0.80.91.01.11.2月销售量y(千件)231514108(1)以月销售量为因变量,建立回归直线方程。(2)计算销售量与价格之间简单相关系数。(3)当商品价格由每件1.10元降为每件0.85元时,商品A销售量将怎样改变?改变多少?解析:本题计算方法,所用公式同上。例8、发达国家企业为取得更大利润,不惜拨巨款用于新产品研究和市场等项工作。为考查“研究和发展费”与企业“利润”关系,有些人对日本5家大企业进行调查,得到一组数据如表所表示:研究和发展费(十亿日元)12334利润(十亿日元)1120404550要求:(1)计算研究和发展费与利润之间简单相关系数;(2)以研究和发展费为自变量,利润为因变量,建立回归直线方程;(3)计算估量标准误差。解析:本题(1)(2)两问计算及公式同例6,第(3)问所用公式以下:(详细计算在此略去)第八章时间数列分析⊙基本知识点:时间数列对比分析:现象在各个时间上观察值称为发展水平(规模和发展程度);各个时期发展水平平均数称为平均发展水平(序时平均数);序时平均数:绝对数时期数列:算术平均法绝对数时点数列:首末折半法其中:是时间间隔长度假如,则:相对数或平均数时间数列序时平均数:时间数列速度分析:增加量=汇报期水平-前期水平;逐期增加量=汇报期水平-前期水平;累计增加量=汇报期水平-固定基期水平;发展速度=;环比发展速度=;定基发展速度=;增加速度=;环比增加速度=;定基增加速度=;平均增加量=各个逐期增加量算术平均数=;平均发展速度=各环比发展速度几何平均数;水平法:累积法:(查表)平均增加速度=平均发展速度-1;长久趋势分析及预测:影响时间数列原因T:长久趋势;S:季节变动;C:循环变动;I:不规则变动。时间数列模型:乘法模型:Y=T×S×C×I;加法模型:Y=T+S+C+I;混合模型移动平均法:适当扩大时间间隔,逐期移动,算出移动平均趋势率,消除短期波动(偶数要算两次);线性模型法:把时间t做自变量,把发展水平Yt做因变量,用最小二乘法得趋势直线方程。季节变动分析:季节变动得测定:按月(季)平均法;计算同月(季)平均数(消除随机影响);计算总月(季)平均数();计算季节指数();四季季节指数之和=400%;平均数=100%;整年指数和=1200%;平均数=100%趋势剔除法:先消除趋势变动,再计算季节指数;算出四季(或整年)移动平均趋势T;计算(%),消除趋势变动;将按月(季)重新排列,计算同月(季)平均数。季节变动调整:算出(消除季节变动);依照数据,配合趋势直线,,(t为时间次序号)由趋势直线方程,算出调整后趋势值。循环变动测定:剩下法:从时间数列中消除趋势变动、季节变动和不规则变动。消除季节变动,计算;依照Y数据,配合趋势直线,算出趋势值T(即);消除趋势变动,算出=C×I,得到循环变动与不规则变动相对数;4)将C×I移动平均,消除不规则运动,得到循环变动相对数。⊙基本计算方法:1、时间数列对比分析(主要包含计算各种平均数、发展速度、增加速度等)例1、已知某地域居民存款余额比1990年增加了1倍,比1995年增加了0.5倍,1995年存款额比1990年增加了()A.0.33倍 B.0.5倍C.0.75倍 D.2倍解析:设1990年居民存款余额为单位1,则为2,设1995年为a,则1.5a=2,从而a=1.33,比1990年1增加了0.33倍,从而选A。例2、某一国GDP总量在比增加了7%,比增长了6%,则比增加了()A.13.42% B.14.23% C.16.56% D.17.82%解析:设GDP为单位1,则为1.07,1.07*1.06=1.1342从而答案为A。例3、时间数列增加量与基期水平之比,用以描述现象相对增加速度,被称作()A.增加速度 B.环比发展速度C.平均增加量 D.定基发展速度解析:本题考查增加速度概念,增加速度=,答案为A。例4、已知某时间数列各期环比增加速度分别为11%、13%、16%,该数列定基增加速度为()A.11%×13%×16% B.11%×13%×16%+1C.111%×113%×116%-1 D.111%×113%×116%解析:定基增加速度=,从而答案为C。例5、假如6年产量依次是20、15、22、25、27、31,那么,其平均增加量是A. B.C. D.解析:平均增加量=,从而选C。例6、设某种股票各统计时点收盘价以下表:统计时点1月1日3月1日7月1日10月1日12月31日收盘价(元)10.110.39.79.59.7求该股票平均价格。解析:此题是间隔时间大于1天时点数列求平均,所采取公式以下:(计算结果略)例7、某电信企业1998~营业额数据以下表:年份19981999营业额(百万元)44.54.84试用几何平均法,计算1998~环比发展速度。解析:几何平均法公式:2、长久趋势分析及预测,季节变动分析(主要计算季节指数),循环波动分析例1、依照各季度商品销售额数据计算各季度指数为:一季度130%,二季度120%,三季度50%,四季度100%。相对来讲,受季节原因影响最大是()A.一季度 B.二季度C.三季度 D.四季度解析:显然,与100%相差最多是三
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物流与供应链行业物流仓储自动化技术发展分析报告
- 2025年特色小镇文化旅游IP运营项目文化旅游与旅游服务融合可行性报告
- 2025年陶瓷材料3D打印增韧技术在航空航天涡轮叶片的创新方案
- 2025yy中学教师宿舍改造项目拆除工程合同
- 2025年版北京市果品种植收购合同
- 激光雷达固态化技术成本控制策略与市场拓展:2025年行业白皮书
- 门卫处安全知识培训课件
- 镭雕机专业知识培训内容课件
- 激光雷达固态化技术发展现状与2025年成本控制优化方案
- 2025年3D打印在骨骼修复中的应用
- 铁路公司招聘干部试题
- 一年级道德与法治上册全册教案
- GB/T 1770-2008涂膜、腻子膜打磨性测定法
- 输血申请单规范PDCA
- 污水处理技术及工艺介绍课件
- 第17课-我是浙江人课件
- 税务尽职调查报告(参考)
- 初中七年级上《综合实践》活动课程课件
- 《太阳出来了》课 件课件
- 全屋定制家居整装安装师傅专业安装服务技巧培训指导手册
- 公路桥梁和隧道工程施工安全风险评估讲解(刘兴旺)
评论
0/150
提交评论