应用统计知识点报告-第一课时统计与统计数据收集_第1页
应用统计知识点报告-第一课时统计与统计数据收集_第2页
应用统计知识点报告-第一课时统计与统计数据收集_第3页
应用统计知识点报告-第一课时统计与统计数据收集_第4页
应用统计知识点报告-第一课时统计与统计数据收集_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计与统计数据收集统计学概述统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。统计研究对象的特点1.数量性统计学研究的对象是客观现象的数量特征和规律性。2.总体性统计学研究的是客观现象总体的数量特征与规律性,而不是个体的量。3.具体性统计的对象是一定时间、地点、条件下事物的量,而不是抽象对象的量,这是统计学和数学的一个重要区别。4.差异性组成统计研究对象总体的个体是有差异的,否则就不需要进行统计分析。统计研究中需要对总体中大量的个体进行观察并进行综合分析,由此才能获得总体的数量分布特征。统计学的分类描述统计学和推断统计学这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。描述统计学是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。在二十世纪之前统计学基本上处于描述阶段。描述统计学是统计学的基础。推断统计学是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。推断统计学是近代统计学的核心,也是统计学中的主要内容。理论统计学和应用统计学理论统计学是研究统计学的数学原理,它基于概率论的原理,还包括不属于传统概率论的一些内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。在统计实践中经常会遇到一些原有的统计方法不能适应的新问题,需要创造新的统计模型和统计分析方法,这就需要统计理论的研究与指导。应用统计学将统计学的基本原理应用于各个领域就形成各种应用统计学的分支。它包括适用于各个领域的一般性的统计方法,如参数估计、假设检验、方差分析、回归分析等,还包括在某一领域中特定的分析方法,如经济统计中的时间数列分析和指数分析等。应用统计学侧重于阐明统计学的基本原理,并将理论统计学的成果作为工具应用于各个领域。统计基本术语变量:事物的特征,是运用统计方法所分析的对象。例如,在商业模型中,销售额、每年的开支和每年的净利润都是企业想要分析的变量。数据:是与变量相关的值。变量可能随时间变动,如某一公司的期望销售额、开支和净利润每年都有所不同。这些不同的值就是与变量相关的数据,或者简单地说,就是统计所要分析的“数据”。注意:变量需赋予可操作定义,否则会产生歧义。如:对销售额的操作性定义可能会发生这样错误的理解:一个人认为年销售额是指全部连锁店的年销售额,而另一个人则认为是每家店的年销售额。总体:所研究对象的全体。个体:指总体中的每个元素或单元。总体依其所包含的个体总数分为有限总体和无限总体。样本:从总体中挑选出来用于分析的一部分。这种挑选通常是相对独立的。样本是进行推断统计的依据。参数:参数是描述总体特征的数值。统计量:是描述样本特征的数值数据的收集统计数据的收集是统计整理和分析,以及统计推断和预测的基础。社会经济统计中所需要的数据与资料主要来源于统计调查。统计数据的收集就是根据统计研究的目的和要求,有组织、有计划地向调查对象搜集原始资料的过程。确定数据最合适的来源和收集数据的合理方法是非常重要的任务,因为如果收集的数据有偏差,模糊不清或有其他类型的错误时,即使最复杂的统计方法也无法得到有用的信息,即需要避免“GarbageInGarbageOut(垃圾数据产生垃圾统计结果)”的统计应用情况。数据采集的基本要求准确性,及时性,完整性,系统性普遍调查普遍调查简称普查,是专门组织的一次性的全面调查。如全国的人口普查、能源普查、工业普查等。组织方式有两种:1.建立专门的普查机构2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。普查时注意的原则:规定统一的标准时点规定统一的普查期限规定普查的项目和指标。例:第七次全国人口普查重点调查在总体中选择部分重点单位进行调查,以了解总体基本情况的一种非全面调查。重点调查的特点:(1)重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。(2)重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。(3)重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。典型调查是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入细致的调查。典型调查的作用和目的(1)研究新事物或某种倾向性的社会问题通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物发展变化的趋势,形成科学的预见。(2)分析事物的不同类型通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转化和发展。(3)典型调查可用来研究事务的变化规律。(4)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。抽样调查是指按随机原则从总体中抽取部分单位组成样本。目的是利用样本数据推断(估计)总体的数量分布特征。抽样调查是现代推断统计的核心,也是最重要的统计调查方法。在抽样调查中,应尽量避免以下4种误差:涵盖误差:当某一组代表性的样本被排除在抽样调查之外时所引起的选择偏差。无回应误差:抽样时,对样本个体数据收集失败会导致无回应偏差。抽样误差:选择抽样调查是因为这种方法简单、低成本和有效。但同时也意味着有的个体被抽中,有的个体没有被抽中。测量误差:测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。网上调查优势:及时性和共享性,便捷性和低成本,可靠性和客观性,更好的接触性,穿越时空性。问卷设计问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。合理性:合理性指的是问卷必须紧密与调查主题相关。一般性:即问题的设置是否具有普遍意义。逻辑性:问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。明确性:所谓明确性,事实上是问题设置的规范性。非诱导性:非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。便于整理和分析变量1.5.1变量类型统计学中将变量分为分类变量或数值变量。分类变量(也称为定性变量)的值只能按类别分开。例如下表中的“是”和“否”。数值变量(也称为定量变量)的值表示数量。数值变量可进一步分为离散变量和连续变量。1.5.2数据的计量尺度定类尺度计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或≠的数学特性定序尺度对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有>或<的数学特性定距尺度对事物的准确测度比定序尺度精确数据表现为“数值”没有绝对零点具有+或-的数学特性定比尺度对事物的准确测度与定距尺度处于同一层次数据表现为“数值”有绝对零点具有乘或除的数学特性统计表和统计图分类数据的图表汇总表汇总表列出了一系列分类数据的频率、总数或百分比,可以看出不同类别数据间的区别。条形图圆饼图帕累托图在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下剩余的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”数值数据的整理当数据量很大时,首先可以将数值数据进行排序或用茎叶图描述以获得初步信息。排序:从没有排序的数据中很难看出数据的整体范围。排序是把数据从小到大(或从大到小)进行排列。茎叶图:数值数据的图表当数据量很大时,排序和茎叶图都很难得出结论。此时需要使用图表。有多种不同类型的图表可以用来精确描述数值数据,包括频数分布表、折线图、面积图、柱形图、条形图、直方图、频数多边形、圆饼图、散点图、时间序列、曲线图以及对数图等等。频数分布表注意事项:分组的数量:实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通常应在5~15之间。分组的方法:分组的方法可以有等距分组和不等距分组两类。采用哪种分组方法应根据数据的分布特点而定。通常,当数据在一定范围内基本呈对称分布时,宜采用等距分组;而当数据的分布状态极度偏斜时,则宜采用不等距分组。组限:组限也即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。重叠和组限不重叠组限重叠组限——相邻组的上下限重合。适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是[a,b)的形式。注意:Excel在制作频数分布表时采用的是“上限在内”的规则。不重叠组限——相邻组的上下限不重合。适用于离散型变量。组中值:各组的代表值,在计算分组数据的许多统计指标时要用到。通常取该组上限和下限的平均值为组中值。如10~19的组中值是14.5,20~29的组中值是24.5,等等。表格线:统计表中的表格线应当是两边开口的表格。数值数据统计图统计图可以形象、直观、生动、简洁地显示数据的特征。折线图——通常用来描述时间序列数据,用以表示某些指标的变化趋势。制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。面积图面积图可以直观地表示时间序列各组成部分的变化情况。柱形图、条形图和直方图柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图。频数多边形频数多边形是直方图的另一种表现形式,是由直方图的顶端中点(各组的组中值)连线而成,其中两边都要连接到横轴上的某点,以便通过覆盖的面积反映总频数。当希望在一个图上比较两种频数分布的特征时,就需要使用频数多边形。饼图散点图、时间序列图和曲线图MicrosoftOffice中的曲线图属于平滑线散点图。散点图:在回归分析中,经常需要用样本数据的散点图来分析两个变量之间大致的曲线关系,如正相关关系,即一个变量的增长引起另一个变量的增长;负相关关系,即一个变量的增长引起另一个变量的减少。时间序列图:研究数值变量随时间变化的趋势。X轴代表时间,Y轴代表数值。时间序列图可用折线图来实现。曲线图:当变量是连续型数据时,通常使用曲线图来描述数据的分布情况,如连续型随机变量的密度函数和分布函数曲线。经济管理中几种常见的频数分布曲线①正态分布曲线——这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。正态分布曲线正态分布曲线②偏态曲线——按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。左偏(负偏)右偏(正偏)左偏(负偏)右偏(正偏)例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。③J形曲线正J形正J形倒J形倒J形其典型的应用分别是经济学中的供给曲线和需求曲线。供给曲线(正J形)表现为随着价格的增加,供给量以更快的速度增加;需求曲线(倒J形)表现为随着价格的增加,需求量以更快的速度减少。供给和需求曲线的交点即供求平衡点。④U形曲线——又称生命曲线或浴盆曲线人和动物的的死亡率、设备的故障率等通常都服从于U形曲线分布。UU形曲线对数图人们经常对时间序列变量的相对变化率而不是绝对数值的变化感兴趣,如各种经济变量的环比发展速度。此时若要用统计图直观反映增长率等现象的变动趋势,就需要使用对数图。对数图是以时间为横轴,以10为底的对数比率刻度为纵轴的折线图。可以通过对数图中各线段的斜率比较各时期增长率的大小。交叉表列联表列联表表示两类变量的结果。横轴表示一类变量,纵轴表示另一类变量。值位于横纵轴的交叉处,称为单元。并行条形图一个更有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论