




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数量方法笔记第一章 数据的整理和描述一、 数据的分类:按照描述的事物分类:1 分类型数据:描述的是事物的品质特征,本质表现是文字形式;2 数量型数据:事物的数量特征,用数据形式表示;3 日期和时间型数据。按照被描述的对象与时间的关系分类:1 截面数据:事物在某一时刻的变化情况,即横向数据;2 时间序列数据:事物在一定的时间范围内的变化情况,即纵向数据;3 平行数据:是截面数据与时间序列数据的组合。二、 数据的整理和图表显示:1 组距分组法:1) 将数据按上升顺序排列,找出最大值max和最小值min;2) 确定组数,计算组距c;3) 计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi (个数)和频率(),形成频率分布表;4) 唱票记频数; 5) 算出组频率,组中值;6) 制表。2 饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100;比例必须于扇形区域的面积比例一致。3 条形图:用来对各项信息进行比较。当各项信息的标识(名称)较长时,应当尽量采用条形图。4 柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。5 折线图:明显表示趋势的图示方法。简单、容易理解,对于同一组数据具有唯一性。6 曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。7 散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。8 茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观的显示出了数据的分布。三、 数据集中趋势的度量:1 平均数:容易理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”;缺点是它对极端值十分敏感。平均数2 中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。3 众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。4 分组数据的平均数(加权平均): 为组数,vi为第i组频数,yi为第i组组中值。四、 数据离散趋势的度量:1 极差R最大值max最小值min2 四分位点:第二四分位点Q2就是整个数据集的中位数;第一四分位点Q1是所有小于(或等于)Q2的数据所组成的数据集的中位数;第三四分位点Q3是所有大于(或等于)Q2的数据所组成的数据集的中位数。四分位极差Q3Q1,它不像极差R那么容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息地缺点。3 方差:离平均数地集中位置地远近;是频数,是组中值,即数据的个数,即用分组数据计算的平均数。4 标准差:。变异系数:表示数据相对于其平均数的分散程度。第二章 随机事件及其概率一、 随机试验与随机事件:1 随机试验:a) 可以在相同的条件下重复进行;b) 每次试验的可能结果可能不止一个,但是试验的所有可能的结果在试验之前是确切知道的;c) 试验结束之前,不能确定该次试验的确切结果。2 样本空间:a) 所有基本事件的全体所组成的集合称为样本空间,是必然时间;b) 样本空间中每一个基本事件称为一个样本点;c) 每一个随机事件就是若干样本点组成的集合,即随机事件是样本空间的子集;d) 不包含任何样本点的随机事件就是不可能事件。3 样本空间的表示方法:a) 列举法:b) 描述法:二、 事件的关系和运算1. 事件的关系:a) 包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必然导致事件B的发生,成为事件B包含事件A,记做。若则称事件A与事件B相等,记做AB。b) 事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并,记做。c) 事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做。d) 互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。e) 对立事件:一个事件B若与事件A互斥,且它与事件A的并是整个样本空间,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是,。f) 事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做AB。2运算律:a) 交换律:b) 结合律:c) 分配律:d) 对偶律:。三、 事件的概率与古典概型:1. 事件A发生的频率的稳定值 称为事件A发生的概率,记做:,。2. 概率的性质:a) 非负性:;b) 规范性:;c) 完全可加性:;d) ;e) 设A,B为两个事件,若,则有,且;3. 古典概型试验与古典概率计算:a) 古典概型试验是满足以下条件地随机试验: 它的样本空间只包含有限个样本点; 每个样本点的发生是等可能的。b) 古典概率的计算:;c) 两个基本原理: 加法原理:假如做一件事情有两类办法,在第一类办法中有m种不同方法,而在第二类办法中有n种不同方法,那么完成这件事情就有m+n种不同方法。加法原理可以推广到有多类办法的情况; 乘法原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。乘法原理也可以推广到多个步骤的情形。4. 条件概率:在事件B发生的条件下(假定P(B)0),事件A发生的概率称为事件A在给定事件B下的条件概率,简称A对B的条件概率,记做:;5. 概率公式:a) 互逆:对于任意的事件A,;b) 广义加法公式:对于任意的两个事件A和B,广义加法公式可以推广到任意有限个事件的并的情形,特别地:c) 减法公式:;d) 乘法公式:P(AB)P(A)P(B|A),P(A)0;e) 全概率公式:设事件A1,A2,, An两两互斥,A1+A2+An(完备事件组),且P(Ai)0,i1,2,n则对于任意事件B,有: ;f) 贝叶斯公式:条件同上, 则对于任意事件B,如果P(B)0,有: ;第三章 随机变量及其分布取值带有随机性,但取值具有概率规律的变量称为随机变量。一、 离散型随机变量:取值可以逐个列出1. 数学期望:1) 定义:,以概率为权数的加权平均数;2) 性质:Ec = c (常数期望是本身)E(ax) = aEx (常数因子提出来)E(ax+b)= aEx+b (一项一项分开算)2. 方差:1) 定义:;2) 性质:Dc =0 (常数方差等于0)D(ax) =a2Dx (常数因子平方提)D (ax+b) =a2Dx3) 公式:(方差平方的期望期望的平方);3. 常用随机变量:1) 0-1分布: 随机变量X只能取0,1这两个值; XB(1,p); ExpDxp(1-p)2) 二项分布:a) 分布律:;b) XB(n,p)c) Ex=npd) Dx=np(1-p)e) 适用:随机试验具有两个可能的结果A或者,且P(A)=p,P()1p,将次贝努里试验重复n次。3) 泊松分布:a) 分布律:,0b) XP()c) Exd) Dxe) 适用:指定时间内某事件发生的次数。二、 连续型随机变量:1. 设X是一个连续型随机变量:1) X的均值,记做,就是X的数学期望,即 EX;2) X的方差,记做DX或,是的数学期望,即:3) X的标准差,记做,是X的方差的算术平方根,即;2. 常用连续型随机变量:名称分布律或密度记法EX期望DX方差均匀分布指数分布,0正态分布标准正态分布XN(0,1)013. 正态分布的密度曲线y=P(x)是一条关于直线x=的对称的钟形曲线,在x=处最高,两侧迅速下降,无限接近X轴;越小大,曲线越高扁。4. 标准正态分布的密度曲线y(x),是关于Y轴对称的钟形曲线。5. 随机变量的标准化 (减去期望除标差)。6. 标准化定理:设。三、 二维随机变量:1. 用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。2. X,Y的协方差:cov(X,Y)E(XEX)(YEY)=E (XY)-EXEY,cov(X,Y)0说明X与Y之间存在一定程度的正相关关系,cov(X,Y)0称X与Y不相关,cov(X,Y)0说明X与Y存在一定程度的负相关关系;3. X,Y的相关系数:,取值范围是,越接近1,表明X与Y之间的正线性相关程度越强,越接近于1,表明X与Y之间的负线性相关程度越弱,当等于0时,X与Y不相关。4. 随机变量的线性组合:1) E(aX+bY)=aEX+bEy;2)四、 决策准则与决策树:1. 对不确定的因素进行估计,从几个方案中选择一个,这个过程称为决策;2. 决策三准则:1) 极大极小原则:将各种方案的最坏结果(极小收益)进行比较,从中选择极小收益最大的方案;2) 最小期望损失原则:选择期望损失最小的方案;3) 最大期望收益原则:选择期望收益最大的方案。3. 决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。第四章 抽样方法与抽样分布一、 抽样基本概念:1. 总体:研究对象的全体;2. 个体:组成总体的每一个个体;3. 抽样:从总体中抽取一部分个体的过程;4. 样本:从总体中抽出的一部分个体构成的集合;5. 样本值:在一次试验或观察以后得到一组确定的值;6. 随机样本:1) 个体被抽到的可能性相同;2) 相互独立;3) 同分布。二、 抽样方法:1. 简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得所有可能的样本都有同样的机会被抽中。有放回抽样的样本个数为;无放回抽样的样本个数为。2. 系统抽样(等距抽样):将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔一定的间距抽取样本单元。3. 分层抽样:在抽样之前将总体划分为互不交叉重叠的若干层,然后从各个层中独立地抽取一定数量的单元作为样本。4. 整群抽样:在总体中由若干个总体单元自然或人为地组成的群体称为群,抽样时以群体为抽样单位,对抽中的各群的所有总体单元进行观察。三、 抽样中经常遇到的三个问题:1. 抽样选取不当;2. 无回答:处理无回答常用的方法:1) 注意调查问卷的设计和加强调查员的培训;2) 进行多次访问;3) 替换无回答的样本单元;4) 对存在无回答的结果进行调整。3. 抽样本身的误差。四、 抽样分布与中心极限定理:1. 不包含任何未知参数的样本函数称作统计量;2. 常用的统计量:1) 样本均值:;2) 样本方差:;3) 样本标差:。3. 统计量的分布叫做抽样分布,当样本容量n增大时,不论原来的总体是否服从正态分布,其样本均值都将趋向于正态分布,当n30时,样本均值就可以近似的服从正态分布。4. 中心极限定理:设随机变量X1,X2,Xn独立同分布,且EXi,DXi2,i1,2,n,;1) 设随机变量X1,X2,Xn独立同分布,且EXi,DXi2,i1,2,n,则;2) 设随机变量X1,X2,Xn独立同(0,1)分布,则,且。五、 常用的抽样分布1. 样本均值的抽样分布:总体均值、方差抽样方式样本的期望样本方差有限总体重复抽样有限总体不重复抽样无限总体任意若有限总体不重复抽样5%时,其修正系数近似为1,样本均值的方差可以简化为。 2. 样本比例的抽样分布:总体比例抽样方法EPDP无限总体任意有限总体有放回抽样有限总体无放回抽样若有限总体无放回抽样5%时,其修正系数近似为1,样本比例的方差可以简化为。六、 三种小样本的抽样分布:名称统计量记法上分位点2分布1,2n分布22(n)分布XN(0,1),Y2(n)X,Y相互独立F分布,U,V相互独立,七、 几种重要统计量的分布:设XN(,2),X1,X2,Xn是X的样本,样本均值,样本方差:1. 分布:;2. 2分布:;3. 设X1,X2,Xn是的样本,Y1,Y2,Yn是的样本,并且都相互独立,则:;第五章 参数估计一、 参数估计1. 参数点的估计:设总体分布中含有未知参数,从总体中抽取一个样本X1,X2,Xn,用来估计未知参数的统计量(X1,X2,Xn)称为参数的一个估计量,若X1,X2,Xn是样本的一组观察值,则(X1,X2,Xn)称为参数的一个点估计值。2. 估计量的评价标准:1) 无偏性:设是总体中未知参数的估计量,若则称是的无偏估计量。样本均值是总体均值的无偏估计量,;样本方差S2是总体方差2的无偏估计量,ES22。2) 有效性:的方差最小的无偏估计量称为的有效估计量;正态总体的样本均值是总体均值的有效估计量。(以上两种情况在样本容量固定的情况下发生;当样本容量增大是越来越接近真值。)3) 一致性:若当样本容量增大时,估计量的值越来越接近未知参数的真值,则称是的一致估计量。样本均值方差是总体均值方差的一致估计量。二、 总体均值的区间估计:1. 设是总体分布中的未知参数,X1,X2,Xn是总体的一个样本,若对给定的(01),参在两个估计量1(X1,X2,Xn)和2(X1,X2,Xn),使,则称随即区间(1,2)位参数的置信度位1的置信区间。称为显著水平。2. 意义:随机区间(1,2)包含真值的概率是1。3.4. 总体均值的置信区间(置信度1)总体分布样本量已知未知正态分布大样本正态分布小样本非正态分布大样本三、 总体比例的区间估计:总体比例的置信区间(置信度1)样本量抽样方式置信区间大样本有放回抽样无放回抽样四、 两个总体均值之差的置信区间(置信度1)总体分布样本量已知未知正态分布大样本用S1代替1用S2代替2正态分布小样本非正态分布大样本用S1代替1用S2代替2五、 大样本,两个总体比例之差()的置信区间,置信度(1):六、 样本容量的确定(置信度1):抽样方式置信区间允许误差样本容量有放回抽样(或抽样比5)总体均值总体比例不放回抽样总体均值先算出有放回抽样的样本容量n0;然后:总体比例第六章 假设检验一、 假设检验的基本概念:1. 小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。2. 对总体参数的取值所作的假设,称为原假设(或零假设),记做H0;原假设的对立假设称为备选假设(备择假设),记做H1。3. 犯“H0为真,但拒绝H0”这种错误的概率称为显著水平;这种错误称为第一类错误(弃真错误);4. “H0不成立,但接受H0”的这种错误称为第二类错误;犯这种错误的概率记做。5. 用来判断是否接受原假设的统计量称为检验统计量。6. 当检验统计量取某个范围D内的值时,我们拒绝原假设H0;这是D称为拒绝域;拒绝域的边界点称为临界点。7. 假设检验的基本思想:先假定H0成立,在这个前提下用样本数据进行推导、计算,如果导致小概率事件发生,择拒绝H0,否则就接受H0。8. 当检验的统计量N(0,1)时:H0:0H1:0双假检验:H0:0H1:0左侧检验:H0:0H1:0右侧检验:9. 假设检验的五个步骤:1) 提出原假设与备选假设。原则:1、把含有等号的式子作为原假设;2、从样本做出猜测而希望证实的问题作为备选假设;2) 选取统计量。通过选取适当的统计量来构造小概率事件;3) 按P(拒绝H0/H0真)确定拒绝域;4) 计算统计量的值;5) 做出判断:当样本值落在拒绝域内,小概率事件发生,拒绝H0;当样本值不落在拒绝域内,小概率事件没发生,接受H0。二、 总体均值的假设检验:已知条件H0H1检验统计量及其分布拒绝域XN(,2)0,已知0,或大样本000XN(,2)未知,小样本000三、总体比例的假设检验:已知条件H0H1检验统计量及其分布拒绝域大样本三、 两个总体均值比例之差的假设检验:已知条件H0H1检验统计量及其分布拒绝域,1,2已知,或大样本1212(设)12,1,2未知,或小样本121212大样本第七章 相关与回归分析一、 相关分析:1. 线性相关:数量的关系近似线性函数;1) 正线性相关:变量是同向变化;2) 负线性相关:变量是反向变化;2. 非线性相关:变量的关系近似非线性函数;3. 完全相关:变量是函数关系;1) 完全线性相关:变量的关系是线性函数;2) 完全非线性相关:变量的关系是非线性函数;4. 不相关:变量之间没有任何规律。5. 协方差:总体相关系数:样本相关系数:二、 一元线性回归:1. 若对控制变量X的每一个确定值,随机变量的数学期望存在,则此数学期望是X的函数,称为Y关于X的回归函数,记做:(X);2. 若医院回归函数是线性幻术,则称为一元线性回归(回归直线);3. 回归直线,其中称为斜率,称为截距。4. 总变差平方和剩余平方和回归平方和SSTSSESSR总变差平方和:Y1,Y2,Yn的分散程度;回归平方和:X1,X2,Xn的分散性引起的Y1,Y2,Yn的分散程度;剩余平方和:其他因素引起的分散程度。5. 判定系数:6. 最小二乘法:是使因变量的观察值yi与估计值的SSE(剩余平方和)达到最小来求得a和b的方法;即:。7. 估计标准误差:8. 判定系数的意义:0r21SSE意义r21SSE0, 观察点落在回归直线上,X,Y完全线性相关r21SSE0,观察点接近回归直线,X,Y高度线性相关r20SSE=SSTX的变化与Y无关,无线性相关关系9. 给定,置信度为1,的预测区间与的置信区间:的点估计:的预测区间:;的置信区间:。三、 多元线性回归和非线性回归:1. 多元线性回归:2. 可线性化的非线性回归:名称方程变量代换线性回归双曲函数对数函数幂函数多项式函数,第八章 时间数列分析一、 时间数列的对比分析:1. 现象在各个时间上的观察值称为发展水平(规模和发展的程度);2. 各个时期发展水平的平均数称为平均发展水平(序时平均数);3. 序时平均数:1) 绝对数时期数列:算术平均法 绝对数时点数列:首末折半法 其中:是时间间隔长度如果 ,则:2) 相对数或平均数时间数列的序时平均数:4. 时间数列的速度分析:1) 增长量报告期水平前期水平;2) 逐期增长量报告期水平前期水平;3) 累计增长量报告期水平固定基期水平;4) 发展速度;5) 环比发展速度;6) 定基发展速度;7) 增长速度;8) 环比增长速度;9) 定基增长速度;10) 平均增长量各个逐期增长量的算术平均数;11) 平均发展速度各环比发展速度的几何平均数;水平法:累积法:(查表)12) 平均增长速度平均发展速度1;二、 长期趋势分析及预测:1. 影响时间数列的因素T:长期趋势;S:季节变动;C:循环变动;I:不规则变动。2. 时间数列的模型:乘法模型:Y=TSCI;加法模型:YTSCI;混合模型3. 移动平均法:适当扩大时间间隔,逐期移动,算出移动平均趋势率,消除短期波动(偶数要算两次);4. 线性模型法:把时间t做自变量,把发展水平Yt做因变量,用最小二乘法得趋势直线方程。三、 季节变动分析:1. 季节变动得测定:1) 按月(季)平均法;计算同月(季)平均数(消除随机影响);计算总月(季)平均数();计算季节指数();四季季节指数之和400;平均数100;全年指数的和1200;平均数1002) 趋势剔除法:先消除趋势变动,再计算季节指数;算出四季(或全年)的移动平均趋势T;计算(),消除趋势变动;将按月(季)重新排列,计算同月(季)平均数。2. 季节变动的调整:算出(消除季节变动);根据的数据,配合趋势直线,(t为时间顺序号)由趋势直线方程,算出调整后的趋势值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年文化产业发展基金投资分红与项目评估协议
- 2025年砖厂与装饰公司战略合作伙伴关系建材供应合同
- 2025年度校园食堂标准化运营及劳务服务全面合作协议
- 2025年校园图书采购、分拣与流通服务合作协议
- 2025年布艺企业节能减排与环保责任履行合同
- 2025年学历类自考质量管理学-学前儿童科学教育参考题库含答案解析(5套试卷)
- 2025年中小企业财务管理体系建设与内部控制咨询合同
- 2025年体育场馆租赁印花税支付及赛事运营管理服务合同
- 2025年学历类自考西方行政学说史-学前教育研究方法参考题库含答案解析(5套试卷)
- 2025年跨境电商平台品牌授权合作框架协议
- 2025年交社保免责协议书
- 2025-2026学年北师大版小学数学六年级上册教学计划及进度表
- 语文开学第一课课件2025-2026学年统编版语文七年级上册
- 2025年军队文职招聘-军队文职技能岗-军队文职招聘(电工)历年参考题库含答案解析(5套)
- (2025年标准)签夫妻忠诚协议书
- 2025年宁夏中考数学试卷试题真题(含答案详解)
- 肿瘤重点专科汇报
- 2024年杭州市公务员考试行测真题及完整答案详解一套
- 2025 八项规定应知应会100题题库及参考答案详解(综合题)
- 单位保安执勤方案(3篇)
- 二三轮车安全知识培训课件
评论
0/150
提交评论