统计学复习大纲--考试重点_第1页
统计学复习大纲--考试重点_第2页
统计学复习大纲--考试重点_第3页
统计学复习大纲--考试重点_第4页
统计学复习大纲--考试重点_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学复习大纲第一章略第二章第 2章 统计数据的描述(以下没有包含的小节不作考试要求)2.1 数据的计量尺度2.2 统计数据的来源2.3 统计数据的质量2.4 统计数据的整理2.5 分布集中趋势的测度2.6 分布离散程度的测度2.7 茎叶图与箱线图2.1 数据的计量尺度一、列名尺度二、顺序尺度三、间隔尺度四、比率尺度2.3 统计数据的质量抽样误差和非抽样误差的区别2.4 统计数据的整理组距分组(步骤)确定组数:组数的确定应以能够显示数据的分布特征和规律为目的确定组距:组距(class width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距( 最大值 -

2、最小值) 组数统计出各组的频数并整理成频数分布表注意:组的开端以5或者0开始,组距最好是5的整数倍洛伦茨曲线和基尼系数的含义2.5 分布集中趋势的测度众数、中位数、四分位数与极端值无关均值、几何均值、切尾均值与极端值有关注意:以上几个值重点掌握众数、中位数、以及加权均值的求法一、众数没有分组 :例如 1 2 3 1 5 6 1 8 9 众数为1组距分组:需要根据公式运算:M0=&L+f-f-1i (f-f-1)+(f-f+1)L为众数组所在的组的下组限,f 代表的是众数所在组的频数,f-1代表的是众数组上一组的频数,f+1代表众数组下一组的频数M0=&120+14-85=123(个) (14-

3、8)+(14-10)二、中位数没有分组: 也就是对原始数据找中位数【例】 9个家庭的人均月收入数据原始数据: 1500 750 780 1080 850 960 2000 1250 1630排 序: 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9【例】:10个家庭的人均月收入数据排 序: 660 750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 中位数这时是:(960+1080)/2=1020分组数据求:中位数先确定中位数所在的组, 中

4、位数位置=N,确定所在的组以后套用公式:2N-Sm-1Me=i&L+fm50-16Me=5=123.21(个) &120+14先通过 N/2即50/2 求出 中位数所在的组为第25个数所在的组,这个数所在的组为120-125 接着头用公式。三、 四分位数四分位数(位置的确定)未分组数据:下四分位数(QL)位置 =(N+1)/4; 上四分位数(QU)位置 =3(N+1)/4 原始数据: 23 21 30 28 25 26排 序: 21 23 25 26 28 30位 置: 1 2 3 4 5 6QL位置 =6+1/4=1.75 QL= 21+0.75(23-21)=22.5QU位置 =3*(6+

5、1)/4=5.25 28+0.25(30-28)= 28.5分组数据:先确定四分位数所在的组的位置,确定了组以后套用公式,做法类似于中位数 LL代表的是四分位数所在的组的下组限,SL-1代表四分位数所在的组以前的累积频数和,fL表示四分位数所在组的频数N-SL-1iL 下四分位数: QL=&LL+fL3N-SU-1iU上四分位数: QU=&LU+fUQL位置50/412.5 所以是在第三组 115-12050-8QL=5=&115+&117.81(个)8QU位置350/437.5350-30QU=5=&125+&128.75(个)10四、 均值 组距分组的求法设一组数据为: x1 ,x2 ,

6、,xn 注意:这些为组中值 相应的频数为: f1 , f2 , ,fkxf+x2f2+L+xKfK=总体均值:m=11f1+f2+L+fKxfi=1KKiiifi=1xf+x2f2+L+xkfk=样本均值:=11f1+f2+L+fkxfi=1nkiiifi=1=&XFii=1KKi=Fi=16160=(个) &123.250i五 掌握众数、中位数和均值的比较 主要是在偏态时三者之间的关系本节的其他的问题比较简单,可以看书了解2.6 分布离散程度的测度重点掌握方差及标准差以及离散系数方差和标准差求法:未分组和分组数据不同,总体和样本的求法也不同未分组数据总体方差: s=K2(Xi=1Ni-)2N

7、组距分组总体数据:s=&2(Xi=1iK-)2FiiFi=1n未分组数据样本标准差:Sn-1=2(x-)ii=12n-1组距分组数据样本标准差:Sn-1=&2(x-)ii=1k2fifi=1ki-1总体标准差s=&=(个)&7.87样本方差原始数据: 10 5 9 13 6 8S2n-1=(x-)ii=1n2n-1(10-8.5)2+(5-8.5)2+L+(8-8.5)2=6-1=8.3离散系数1. 标准差与其相应的均值之比2. 消除了数据水平高低和计量单位的影响3. 测度了数据的相对离散程度4. 用于对不同组别数据离散程度的比较5. 计算公式为Vs=s或Vs=S X1=536.25(万元)

8、X2=32.5215(万元)S1=309.19(万元) S2=23.09(万元)V1=0.577 V2=0.710结论: 计算结果表明,V1V2,说明产品销售额的离散程度小于销售利润的离散程度2.7茎叶图和箱线图自己复习(略)第 3 章 概率与概率分布3.1 随机事件及其概率主要掌握概率的基本常识(略)掌握古典概率的求法、全概率公式、贝叶斯后验公式、两个随机变量的协方差和相关系数3.2掌握五个分布3.3 大数定律与中心极限定理 1. 独立同分布大数定律大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。独立同分布大数定律设X1, X2, 是独立同分布的随机变量序列,且存在有限的

9、数学期望E(Xi)和方差D(Xi ) 2(i=1,2,),则对任意小的正数, 有:1nlimP|Xi-m| 0,有:limP|nm-p|e=1 n它表明,当重复试验次数n充分大时,事件A发生的频率m/n依概率收敛于事件A发生的概率-阐明了频率具有稳定性,提供了用频率估计概率的理论依据。二、中心极限定理(重点掌握) 1. 独立同分布中心极限定理 (也称列维一林德伯格定理)设X1, X2, 是独立同分布的随机变量序列,且存在有限的和方差(2i=1,2,),当n 时,Xi=1niN(nm,ns2) N(m,s2/n ) 上述定理表明 独立同分布的随机变量序列不管服从什么分布,其n项总和的分布趋近于正

10、态分布。 可得出如下结论: 不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大,就趋于正态分布。 该定理为均值的抽样推断奠定了理论基础2. 棣莫佛拉普拉斯中心极限定理 设随机变量X服从二项分布B(n,p)的,那么当n 时,X服从均值为np、方差为 np(1-p) 的正态分布,即:XN(np,np(1-p)N(0,1) 上述定理表明:n很大,np 和 np(1p)也都不太小时,二项分布可以用正态分布去近似。第 4 章 抽样与抽样分布4.1 常用的抽样方法简单随机抽样1. 从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的机会(概率)

11、被抽中2. 抽取元素的具体方法有重复抽样和不重复抽样分层抽样将总体单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本系统抽样将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k等单位整群抽样将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查4.2抽样分布1. 在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2. 一种理论概率分布3. 推断总体均值m的理论基础【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体的均值、方差及分布如下总体分布.3.2.10现从总体中抽取n2的简

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论