第1章 数据与统计.ppt_第1页
第1章 数据与统计.ppt_第2页
第1章 数据与统计.ppt_第3页
第1章 数据与统计.ppt_第4页
第1章 数据与统计.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学,Statistics,1,国家教育部把统计学列为经济类、管理类大学本科学生的专业(核心)基础课。,2,感悟统计,为什么要学统计?统计能够做些什么?.,Whenyouanalyzeanytopic,youareinvolvedinstatistics.,3,“没有统计,其它科学可以存在,但是很渺小”“医学若无统计就不是科学”,4,台湾辅仁大学谢邦昌教授:“统计即生活,统计即人生”外国某机构评论:“统计是20世纪人类最伟大的发现之一”,5,一位资深的海外统计学家说:“统计就和柴、米、油、盐、酱、醋、茶一样,存在的时候并不是很突出,一旦不见了,人生就是黑白的了。”,6,为什么?,当今社会(时代)被称为信息社会.信息社会的主要特征:信息在各个领域的重要性;信息数量庞大;信息处理和传输迅速统计在信息社会中的重要作用:提供搜集信息的理论方法;提供加工处理信息的理论方法.,7,教育部社政司原司长顾海良在一次重要会议上说:“语言学、心理学和统计学是21世纪中国最有发展前途的三大学科”统计学已经渗透到人文社会科学的很多方面;21世纪是经济信息时代,准确的信息的收集、整理离不开统计学的发展;统计学在政治、文化领域的发展余地很大;国外,统计学是大学里最受重视的学科,统计学发展得如何是衡量某一大学学术水平的标志。,8,案例1:起名为“波澜”恰当吗案例2:后40回出自谁的手笔,感悟统计,9,中美纯水有限公司欲为其新推出的一种纯水产品起一个合适的名字,为此专门委托了当地的策划咨询公司,取了一个名字“波澜”。一个好的名字至少应该满足两个条件:(1)会使消费者联想到正确的产品“纯水”;(2)会使消费者产生与正确产品密切相关的联想,如“纯净”、“清爽”等。后来中美纯水有限公司委托调查统计研究所,进行了一次全面的市场研究,在调查中还包括简单的名称测试。,10,调查的代码和含义如下:,11,12,由直观图可以看出,“波澜”(Name5)与“洗衣机”(Product7)产品相联系,引起的感觉是“兴奋”,因此“波澜”不是合适的纯净水品牌名称。,13,中美纯水公司的产品是“纯水”,如果想要使该名称给人们一种“纯净”的感觉,那么“中美纯”将是最好的商品名称;如果想要使该名称给人们一种“清爽”的感觉,那么“玉泉”将是最好的商品名称。中美纯水公司接受了调查统计研究所的建议,没有用“波澜”这个名称,而用了“中美纯”作为品牌的名称。实践证明,它的确是一个成功的品牌名称。,14,众所周知,红楼梦一书共120回,一般认为前80回为曹雪芹所写,后40回为高鹗所续,长期以来对这个问题一直有争议。1985、1986复旦大学李贤平教授带领他的学生作了这项有意义的工作。,后40回出自谁的手笔,15,他们创造性想法是将120回看成是120个样本,然后确定与情节无关的虚词作为变量(所以要抛开情节,是因为在一般情况下,同一情节大家描述的都差不多,但由于个人写作特点和习惯的不同,所用的虚词是不会一样的),计算出每一回里变量出现的次数,用统计的方法聚类,果然将120回分成两类即前80回为一类,后40回为一类,很形象地证实了不是出自同一人的手笔。,16,之后又进一步分析前80回是否为曹雪芹所写?这时又找了一本曹雪芹的其它著作,结果证实了用词手法完全相同,断定为曹雪芹一人手笔。而后40回是否为高鹗写的呢?结果推翻了后40回是高鹗一个人所写。这个论证在红学界轰动很大,他们用多元统计分析方法支持了红学界观点,使红学界大为赞叹。红楼梦成书新说,17,无论我们是否学过统计、懂得统计学,我们生活中的每一天都会遇到大量的统计问题和统计数字。我们生活在信息时代,信息的主体就是统计数据。所以,不仅从事统计和经济研究、管理的人必须懂得如何运用统计数据,从事各行各业的人都应该有一点统计知识,能正确运用和读懂统计数据。,18,第一章数据与统计,第一节统计及其应用第二节数据第三节数据来源第四节描述统计与统计推断,19,学习目标,学习本章后,您应该做到:1.了解统计学的应用领域;2.明确统计学在数据分析过程中的地位与作用;3.掌握数据测量尺度的基本形式;4.熟悉数据来源的几种方式5.理解并掌握描述统计与推断统计的关系;6.熟悉数据来源的几种方式;7.描述统计分析过程的基本过程。,20,第一节统计及其应用,一、什么是统计二、统计学的含义三、统计学的应用,21,一、什么是统计,统计有三种含义,即统计活动、统计数据和统计学。1.统计活动统计活动又称统计工作,是指收集、整理和分析统计数据,并探索数据的内在数量规律性的活动过程。2.统计数据统计资料或称统计数据,即统计活动过程所获得的各种数字资料和其他资料的总称。表现为各种反映社会经济现象数量特征的原始记录、统计台帐、统计表、统计图、统计分析报告、政府统计公报、统计年鉴等各种数字和文字资料。3.统计学统计学是指阐述统计工作基本理论和基本方法的科学,是对统计工作实践的理论概括和经验总结。它以现象总体的数量方面为研究对象,阐明统计设计、统计调查、统计整理和统计分析的理论与方法,是一门方法论科学。,22,三者之间的联系,1.统计工作同统计资料之间是过程同成果之间的关系,统计资料是统计工作的直接成果。2.统计工作属于实践的范畴,统计学属于理论的范畴,统计学是统计工作实践的理论概括和科学总结,它来源于统计实践,又高于统计实践,反过来又指导统计实践,统计工作的现代化同统计科学研究的支持是分不开的。统计工作同统计学之间属于理论与实践的关系。,23,二、统计学的含义,本书对统计学作如下解释:统计学是一门搜集、整理和分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对客观事物的科学认识。统计数据的搜集是取得统计数据的过程,进行统计分析的基础。统计数据的整理是对统计数据加工的过程,目的是使统计数据系统化、条理化,符合统计分析的要求。统计数据的分析是统计学的核心内容,它是通过运用统计描述和统计推断等方法探索数据内在规律的过程。,24,统计研究的工作过程,25,三、统计学的应用,26,第二节数据,一、要素,变量和观测二、测量尺度三、定性数据与定量数据四、截面数据与时间序列数据,27,一、个体、变量、观测和数据集,1、数据是所收集、分析、汇总表述和解释的事实及数字。2.数据的基本构成通常分为三部分:个体(要素)(element)、变量(variable)与观测值(observation)。3.所谓个体(要素),就是指被收集数据的实体。4.变量,是说明个体(要素)某种特征的概念;变量在个体(要素)上的具体数值称作观测值。5.对特定要素全部变量所收集到的所有数值,即为一个观测.6.所有观测的数据值集合称为数据集.,28,标志与变量,标志是用来说明总体单位特征的概念或名称。标志的承担者是总体单位。,(一)标志,标志按其是否可以用数字来表示分为数量标志和品质标志。数量标志表明总体单位的数量特征。品质标志表明总体单位的属性特征。,标志在各个单位的具体表现称为标志表现。数量标志的标志表现是数字,品质标志的标志表现是文字。,29,(二)变量,可变标志在总体各个单位具体表现上的差异就是变异,包括质的变异和量的变异。变量就是可变的数量标志。,变量按其取值是否连续,可分为连续变量和离散变量。,按标志在总体各个单位的具体表现是否有差异区分,可分为不变标志和可变标志。当某一标志的具体表现在总体各个单位上相同时,则为不变标志,它是使许多个别单位组合成为总体的前提。可变标志是指其具体表现在总体各个单位上不尽相同的那些标志。,30,请你指出表1-1中要素、变量和观测值分别是什么?,31,二、测量尺度,数据的计量尺度,32,定类尺度(Nominalscale),也称名义尺度或分类尺度计量层次最低对事物进行平行的分类各类别可以指定数字代码表示使用时必须符合类别穷尽和互斥的要求数据表现为“类别”具有=或的数学特性,33,定序尺度(Ordinalscale),也称顺序尺度对事物分类的同时给出各类别的顺序比定类尺度精确未测量出类别之间的准确差值数据表现为“类别”,但有序具有或的数学特性,34,定距尺度(Intervalscale),也称间隔尺度对事物的准确测度比定序尺度精确数据表现为“数值”没有绝对零点具有+或-的数学特性,35,定比尺度(Ratioscale),也称比率尺度对事物的准确测度与定距尺度处于同一层次数据表现为“数值”有绝对零点具有或的数学特性,36,四种计量尺度的比较,“”表示该尺度所具有的特性,37,三、定性数据与定量数据,数据的类型,38,分类数据、顺序数据、数值型数据,分类数据(Categoricaldata)只能归于某一类别的非数字型数据,是由定类尺度计量形成的;顺序数据(Rankdata)只能归于某一有序类别的非数字型数据,是由定序尺度计量形成的;数值型数据(Metricdata)按定距和定比计量尺度测量的观察值。,39,定性数据与定量数据,分类数据和顺序数据说明的是事物的品质特征,通常用文字来表述,其结果均表现为类别,因而也可统称为定性数据或者品质数据(Qualitativedata);数值型数据说明的是现象的数量特征,通常使用数值来表示的,因此也可称为定量数据或数量数据(Quantitativedata)。,40,四、截面数据与时间序列数据,截面数据是指在相同或近似相同的时点上采集的数据,用于描述要素在某一时点的变化情况。通常情况下,这类数据是在不同的空间上获得的。时间序列数据是指在不同时间上采集到的数据的集合,同于描述要素随时间变化的情况。通常情况下,这类数据是按时间顺序收集到的,其中常用的为年度、季度和月度数据等。,41,第三节数据来源,一.统计数据的直接来源统计调查的组织方式数据的搜集方法二.统计数据的间接来源三.数据收集的误差,42,一.统计数据的直接来源,43,来源渠道,调查是取得社会经济数据的重要手段,其中包括政府统计部门进行的调查,如人口普查,也有其他部门或机构为特定的目的而进行的调查,如市场调查等;观察法是调查者在现场对被调查者的情况直接观察、记录,以取得资料的方法;实验则是取得自然科学数据的主要手段。,44,统计调查的组织方式,45,统计调查组织方式,普查(census),普查(Census)是为某一特定目的而专门组织的一次性全面调查方式它主要用于搜集处于某一时点状态下的、不能够或者不适宜定期用全面统计报表搜集的社会经济现象的数据,目的是掌握特定社会经济现象的基本全貌通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄,46,抽样调查(samplingsurvey),从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法2.具有经济性、时效性强、适应面广、准确性高等特点3.抽样调查的组织方式:简单随机抽样、分层抽样、等距抽样(机械抽样、系统抽样)、整群抽样和多阶段抽样。,47,统计报表(statisticalreportforms),统计报表(Statisticalreportforms)是按照国家有关法规规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。在我国政府统计工作中,经过几十年的改进和完善,已形成了一套比较完备的统计报告制度,它要求以一定的原始数据为基础统计报表按调查范围不同可分为全面报表和非全面报表;按报送时间不同可分为日报、月报、季报和年报等;按报送范围不同可分为国家、部门、地方统计报表。,48,重点调查(key-pointinvestigation),从全部总体中选择少数重点单位进行调查重点单位:尽管在全部总体单位中出现的频数极少,但其某一数量标志在所要研究的数量标志值总量中却占有很大的比重如鞍钢、宝钢、首钢等进行调查,就可对全国的钢铁生产总量有个大致的认识重点调查的目的在于了解事物的基本情况,结果不用于推断总体,49,典型调查(modelsurvey),从全部总体单位中选择一个或几个有代表性的单位进行深入细致的调查所选择的典型单位应能反映所研究问题的本质属性或特征典型调查主要用于定性研究,调查结果一般不能推断总体,50,数据的收集方法,数据的收集方法,51,二.统计数据的间接来源,52,二手数据的来源渠道,统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料,53,二手数据的特点,收集容易,采集成本低作用广泛分析所要研究的问题提供研究问题的背景帮助研究者更好地定义问题检验和回答某些疑问和假设寻找研究问题的思路和途径收集二手资料在研究中应优先考虑,54,二手数据的评估,数据是谁收集的?可信度评估为什么目的而收集的?数据是怎样收集的?什么时候收集的?,55,三.数据收集的误差,56,抽样误差,由于抽样的随机性所带来的误差所有样本可能的结果与总体真值之间的平均性差异影响抽样误差大小的因素样本量的大小总体的变异性抽样的组织方式和方法,57,非抽样误差,指除抽样误差以外由其他因素引起的样本数据与总体对象真实结果之间的差异。存在于所有的调查之中概率抽样,非概率抽样,全面性调查各种各样的原因都可能导致非抽样误差。比如,调查员的工作认真

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论