统计学复习资料_第1页
统计学复习资料_第2页
统计学复习资料_第3页
统计学复习资料_第4页
统计学复习资料_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.正常条件下新生婴儿的性别比为107:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6农作物的产量与施肥量之间存在相关关系普查为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。5.抽样调查抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法6.抽样误差利用样本推断总体时产生的误差由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的7.非抽样误差由于调查过程中各有关环节工作失误造成的包括调查方案中有

2、关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中不回答8.总体研究的所有基本单位(通常是人、物体、交易或事件)的总和9.变量在研究总体时,我们重点关注的是总体单位具有哪些特征或属性,我们把这些特征称为变量10.样本总体的一部分单位组距分组将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况需要遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率几何平均:G=4104.5%x102.

3、1%x125.5%x101.9%-1=8.0787%算术平均:切尾均值【例】谋次比赛共有11名评委,对某位歌手的给分分别是:(一)经整理得到顺序统计量值为(二)去掉一个最高分和一个最低分,取1/111)分组数据的标准差计算公式为:2)未分组数据的标准差计算公式为:10甲乙两个企业生产二种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业A1521003255B2030001500C3015001500比较哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为X,产量为f则总成本为f工、由于:平均成本x=云=总产本,而已知数据中缺产量f的数据,又因个别产品产量f=

4、该产品成本该产品单位成本xfx从而x=于是得:甲企业平均成本=19.41(元)2100+3000+1500TOC o 1-5 h z210030001500+152030工xf3255+1500+1500“/一、乙企业平均成本=18.29(元)工f3255+1500+1500 x152030常用的抽样方法简单随机抽样分层抽样3.3.3系统抽样3.3.4整群抽样数据分布偏斜程度的测度偏态系数=0为对称分布偏态系数0为右偏分布偏态系数0为左偏分布5偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5-1或-0.5-1之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低数据分布扁平

5、程度的测度峰态系数=0扁平峰度适中峰态系数0为扁平分布峰态系数0为尖峰分布点估计用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等区间估计在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量置信水平将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平表示为(1-a%)a为是总体参数

6、未在区间内的比率常用的置信水平值有99%,95%,90%-相应的a为0.01,0.05,0.10置信区间由样本统计量所构造的总体参数的估计区间称为置信区间影响区间宽度的因素1总体数据的离散程度,用a来测度样本容量,3置信水平(1-a),影响z的大小评价估计量的标准无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数什么是假设?对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必需陈述什么是假设检验?先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻

7、辑上运用反证法,统计上依据小概率原理假设检验中的两类错误第I类错误(弃真错误)原假设为真时拒绝原假设第I类错误的概率记为a被称为显著性水平第II类错误(取伪错误)原假设为假时未拒绝原假设第I类错误的概率记为卩(Beta)假设检验步骤的总结1.陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策相关分析与回归分析的联系:共同的研究对象:都是对变量间相关关系的分析只有当变量间存在相关

8、关系时,用回归分析去寻求相关的具体数学形式才有实际意义。相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖于回归分析相关分析中相关系数的确定建立在回归分析的基础上。样本回归函数与总体回归函数的关系相互联系样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。是对总体回归函数参数的估计。是对总体条件期望的估计残差e在概念上类似总体回归函数中的随机误差u。回归分析的目的:用样本回归函数去估计总体回归函数。样本回归函数与总体回归函数的关系相互区别总体回归函数虽然未知,但它是确定的;样本回归线随抽样波动而变化,可以有许多条。样本回归线还不是总体回归线,至多只是未知总体回

9、归线的近似表现。总体回归函数的参数虽未知,但是确定的常数;样本回归函数的参数可估计,但是随抽样而变化的随机变量。总体回归函数中的值是不可直接观测的;而样本回归函数中的值是只要估计出样本回归的参数就可以计算的数值。什么是时间数列?按时间顺序记录并排列的数据序列称时间序列时间数列的基本要素:所属的时间范围反映数量特征的数值时间序列的分析目的:分析过去,描述动态变化;认识规律,揭示变化规律;预测未来,未来的数量趋势。编制时间数列的基本原则:各指标数值应当可比所属时间可比总体范围可比经济内容可比计算口径可比计算方法可比一、时间序列的构成要素长期趋势:现象在较长时期内受某种根本性因素作用而形成的总的变动

10、趋势季节变动:现象在一年内随着季节的变化而发生的有规律的周期性变动循环变动:现象以年为周期所呈现出的波浪起伏形态的有规律的变动若干不规则变动:是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型二、时间序列构成因素的组合模型乘法模型:Y=TSCI加法模型:Y=T+S+C+I一、测定长期趋势的移动平均法基本原理消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势移动平均方式选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的N项计算一系列序时平均数。测定长期趋势的意义:口把握现象随时间演变的趋势和规律;口对事物的未来发展趋势作出预测;口便

11、于更好地分解研究其他因素。测定长期趋势的基本方法:移动平均法趋势线拟合法移动平均法的步骤:口1确定移动时距(一般应选择奇数项进行移动平均;若原数列呈周期变动,应选择现象的变动周期作为移动的时距长度。)2计算各移动平均值,并将其编制成时间数列移动平均法的特点:1、对原序列有修匀或平滑的作用。时距项数N越大,对数列的修匀作用越强2、移动平均项数N为偶数时,需移正平均3、平均时距项数N与季节变动长度一致才能消除季节变动;时距项数N和周期一致才能消除周期波动。4、移动平均会使原序列失去部分信息,平均项数越大,失去的信息越多。5.由移动平均数组成的趋势值数列,较原数列的项数少,N为偶数时,趋势值数列首尾

12、各少N/2项;N为奇数时,首尾各少N-1/2项;2、时间序列分析指标平均发展水平时间序列速度分析指标发展速度、增长速度、平均发展速度、平均增长速度4、时间序列的长期趋势分析:线性趋势和非线性趋势常用测定方法:移动平均法和趋势模型法5、时间序列的季节变动分析:原始资料平均法;趋势剔除法;季节变动的调整6、循环变动测定方法直接法和剩余法第9章统计指数一、指数的概念一种专门的对比分析指标,具有相对数形式()对比方式:不同时间、不同空间、实际与计划二、指数的分类1“质量指标指数”与“数量指标指数”2“个体指数”与“总指数”3“动态指数”与“静态指数”4其他,如“综合指数”与“平均指数”、“简单指数”与

13、“加权指数”、“环比指数”与“定基指数”等一、总指数编制的基本问题先综合、后对比的方式,即“综合指数法”;编制综合指数的基本问题是“同度量”问题先对比、后平均的方式,即“平均指数法”;编制平均指数的基本问题之一是“合理加权”“简单综合指数”与“简单平均指数”都存在方法上的缺陷;需要改进,编制相应的加权指数。综合指数的两个问题:同度量因素指标的确定,同度量因素固定水平的选择。平均指数的两个问题:平均“型式”的选择,指数“权数”的选择。一、指数体系及其作用广义指数体系:类似于指标体系狭义指数体系:一个总值指数等于若干个因素指数的乘积。指数体系的分析作用:因素分析、指数推算9.4几种常用的经济指数一

14、、消费者价格指数和零售价格指数二、生产指数和生产者价格指数三、股票价格指数四、农产品收购价格指数一、综合评价及其方法单项评价:仅就一项指标进行对比和判断综合评价:须就多项指标进行综合判断常规的综合评价方法:“简易计分法”和“参数指标法”规范的综合评价方法:“综合评价指数法”“基本核算表”所包含的五大核算:1.国内生产总值核算。以国内生产总值为核心指标,对国民经济活动基本经济总量进行全面、系统的核算2.投入产出核算。运用投入产出表详细地反映国民经济各产品之间、部门之间互相依存的技术经济联系。3.资金流量核算。以全社会资金运动为对象,核算各部门资金的来源和运用。4.国际收支核算。综合反映国家的国际

15、收支平衡状况、收支结构和外汇储备状况。5.资产负债核算。反映一个国家在一定时点上的国民经济资产和负债总量、结构。11.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计120计算120家企业利润额的均值和标准差。:设各组平均利润为x,企业数为f则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润xfxf2003002501947503004003503010500400500450421890050060

16、0550189900600以上650117150合计12051200于是,120家企业平均利润为:工xf=Tf51200120=426.67(万元);分组数据的标准差计算公式为:手动计算须列表计算各组数据离差平方和(x426.67)f,并求和,再代入计算公式:列表计算如下组中值企业数(个)xf(入426.67丿f25019593033.489135030176348.6674504222860.133855018273785.200265011548639.1779合计1201614666.668表格中(x426.67)f的计算方法:方法一:将表格复制到Excel表中,点击第三列的顶行单元格后

17、,在输入栏中输入:=(a3426.67)*(a3426.67)*b3,回车,得到该行的计算结果;点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x426.67)f计算完毕;于是得标准差:(见Excel练习题2.11)工(XX)2f1614666.668-1=116.48(万元)。1201点击第三列的合计单元格后,点击菜单栏中的“E”号,回车,即获得第三列数据的和。方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再

18、点击菜单栏中“E”符号右边的小三角“”,选择“其它函数”一选择函数“STDEV”一“确定”,在出现的函数参数窗口中的Numbed右边的空栏中输入:A1:A30,f“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)于是得标准差:s=116.4845(万元)。12为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了1000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平

19、均身高相同?哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。13一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:是男生的体重差异大还是女生的体重差异大?为什么?以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?粗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论