多元统计分析方法 第一讲 统计学科体系统计学多元统计.ppt_第1页
多元统计分析方法 第一讲 统计学科体系统计学多元统计.ppt_第2页
多元统计分析方法 第一讲 统计学科体系统计学多元统计.ppt_第3页
多元统计分析方法 第一讲 统计学科体系统计学多元统计.ppt_第4页
多元统计分析方法 第一讲 统计学科体系统计学多元统计.ppt_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元统计分析方法,兰州商学院 傅德印,参考书目,张尧庭,方开泰多元统计分析引论,科学出版社,1982。 英M.肯德尔多元分析,科学出版社,1983。 方开泰 编著实用多元统计分析,华东师范大学出版社,1989年9月。 罗积玉 邢瑛经济统计分析及预测,清华大学出版社,1987年。 T.W.Anderson, Introduction to Multivariate Statistical Analysis, John Wiley,1958. Ben W. Bolch and Cliff J. Huang, Multivariate Statistical Methods for Business

2、 and Economics, Prentice-Hall,Inc.,1974,第一讲 统计学科体系、统计学、多元统计,统计学体系 统计学 多元统计分析,统计学科体系,新中国统计学科发展的回顾 解放前 49年到三中全会期间(峨眉山会议) 三中全会到92年(两大统计学并存时期) 两个权威定义,以及相应的统计学科体系的内容 三大学会 相应的教育体系 92年到现在(大统计讨论时期) 90年开始的关于一级学科统计学的努力 92年GB标准的颁布以及讨论 92年GB标准中统计学科体系,国外统计学发展的回顾 国外的社会统计学派与数理统计学派 20世纪初到40、50年代现代统计学的确立 表现 国外“统计学”“

3、数理统计学”及与国内使用上的区别 数理统计学派内部的争论 (经典学派、贝叶斯学派、信念学派) 国外的统计学会 国外的统计教育,研究,二、 统计学概述,“统计”一词的基本含义 统计工作 对客观事物数量特征的有关资料进行搜集、整理和分析的活动过程 统计数据 统计工作的对象和成果 统计学 对统计工作及统计资料规律进行总结和理论概括的系统学说,统计工作,统计工作的含义。 即对客观事物数量特征的有关资料进行搜集、整理和分析的活动过程 统计工作类型 按照统计工作主体的不同包括,政府统计工作、企业统计工作、民间统计工作、其他统计工作等。 统计工作的一般程序 统计设计、统计调查、统计整理、统计分析四个阶段。

4、统计的功能 统计活动具有对政府、企业、个人及投资人等进行决策提供信息服务的职能, 对各种决策、规划、计划的执行情况进行监督的职能。,统计数据,统计数据的含义 数据是统计工作所搜集、分析、汇总表述和解释的事实及数字。统计数据不是指单个的数字,而是所搜集的有关资料的数据集。 数据的种类 按照数据的计量尺度:定类数据、定序数据、定距数据和定比数据 按照表现形式:时间数列数据、截面数据和合并数据 按照反映内容:数量数据与品质数据 数据的来源 抽样调查方法是从调查研究中搜集数据的方法 实验设计方法是从实验研究中搜集数据的方法。 数据与误差,定类数据、定序数据、定距数据和定比数据,定类尺度(Nominal

5、 scale)是只按照事物的某种属性对其进行平行分类或分组所进行的测度,是最粗略、计量层次最低的计量尺度。如人口按照性别分为男、女两类。 定序尺度(Ordinal scale)又称顺序尺度,是对事物之间等级差或顺序差别的一种测度,如将产品等级分为一等品、二等品、三等品及次品等。 定距尺度(Interval scale)也称为间隔尺度,是对事物类别或次序之间间隔的测度,通常使用自然或度量衡单位作为计量尺度。如收入用人民币元度量、考试成绩用百分制度量、温度用摄氏度或华氏度来度量、重量用克度量、长度用米度量等。定距尺度的计量结果表现为数量。 定比尺度(Ratio scale)也称为比率尺度,它与定距

6、尺度属于同一层次,一般可不作区分,其计量结果也表现为数值,但其特性是可以计算两个测度值之间的比值。定距尺度与定比尺度之间的唯一差距是定比尺度有一个绝对固定的“零点”。定距尺度中没有绝对的零点,即定距尺度计量值可以为0,“0”表示一个数值,即“0”水平,而不表示“没有”或“不存在”。如温度为0度,表示温度的水平,并不表示没有温度。所以定距尺度中的0是一个有意义的数值。定比尺度则不同,它有一个绝对“零点”,也就是说,在定比尺度中,“0”表示“没有”或“不存在”,如产量为0,表示没有这种产品;收入为0,表示这个人没有收入,现实生活中大多数情况下使用的都是定比尺度。 统计数据采用不同的计量尺度也就形成

7、不同的数据,即定类数据、定序数据、定距数据和定比数据。,时间数列数据、截面数据和合并数据,时间数列数据是按照时间序列排列收集得到的数据。如GDP、失业、就业、货币供给、政府赤字等。数据是按照一定时间间隔收集的每日(如股票),每周(如货币供给),每月(如失业率),每季(如GDP),每年(如政府预算)。 截面数据(cross-sectional data)是指一个或多个变量在某一时点上的数据的集合。如定期进行的人口普查数据。 合并数据(pooled data)中既有时间序列数据又有横截面数据。如20间10个国家的失业率数据就是合并数据。在合并数据中有一类特殊数据,称为panel数据(panel d

8、ata),又称纵向数据(ongitudinal or micropanel data),即同一个横截面单位,比如一个家庭或一个公司,在不同时期的调查数据。,数量数据与品质数据,数据可以既包括定性数据又包括定量数据两方面 定量数据测量事物的多少 而定性数据是为了对事物进行分类而提供标签、或名称。,统计数据的来源,从统计数据本身的来源看,统计数据最初都来源于直接的调查或试验。 从使用者的角度看,统计数据主要来源于两种渠道: 一是直接的调查和科学试验,这是统计数据的直接来源,我们称之为第一手或直接的统计数据; 二是别人调查或试验的数据,这是统计数据的间接来源,我们称之为第二手或间接的统计数据。这里主

9、要从使用者的角度介绍统计数据的搜集方法。,社会经济数据主要取得方式方法,统计调查是取得社会经济数据的主要来源,也是获得直接统计数据的重要手段。 实际中常用的统计调查方式主要有普查、抽样调查、统计报表等 。另外还有重点调查和典型调查。 不论采取何种方式进行调查,在取得统计数据时,都有一些具体的数据搜集方法。调查方法归纳起来可分为询问调查和观察实验两大类。 询问调查。询问调查是调查者与被调查者直接或间接接触以获得数据的一种方法,具体包括访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深度访问等。 观察与实验。观察与实验是调查者通过直接的观察或实验获得数据的种方法。,第二手数据,第二手数据主

10、要是公开出版的或公开报道的数据,也有些是尚未公开的数据。 在我国,公开出版或报道的社会经济统计数据主要来自国家和地方的统计部门以及各种报刊媒介。例如,公开的出版物有(中国统计年鉴)、中国统计摘要、中国社会统计年鉴、中国工业经济统计年鉴、中国农村统计年鉴、中国人口统计年鉴、(中国市场统计年鉴),以及各省、市、地区的统计年鉴等。提供世界各国社会和经济数据的出版物也有许多,如世界经济年鉴、国外经济统计资料,世界银行各年度的世界发展报告等。联合国的有关部门及世界各国也定期出版各种统计数据。 除了公开出版的统计数据外还可以通过其他渠道使用一些尚未公开的统计数据,以及广泛分布在各种报刊、杂志、图书、广播、

11、电视传媒中的各种数据资料。现在随着计算机网络技术的发展,也可以在网络上获取所需的各种数据资料,数据与误差,统计数据的误差通常是指统计数据与客观现实之间的差距,误差主要有登记性误差和代表性误差两类。 登记性误差是调查过程中由于调查者或被调查者的人为因素所造成的误差。调查者所造成的登记性误差主要有:调查方案中有关的规定或解释不明确导致的填报错误、抄录错误、汇总错误等;被调查者造成的登记性误差主要有:因人为因素干扰形成的有意虚报或瞒报调杏数据,这种误差在统计调查中应予以特别重视。从理论上讲,登记性误差是可以消除的。 代表性误差主要是指在用样本数据进行推断时所产生的随机误差。其产生的原因主要有:抽取样

12、本时没有道循随机原则;样本结构与总体结构存在差异;样本容量不足等等。这类误差通常是无法消除的,但事先可以进行控制或计算。 数据的质量包括多方面的含义,而不仅仅是指数据本身的准确性或误差的大小。就一般的统计数据而言,可将其质量评价标准概括为六个方面:(1)精度,即最低的抽样误差或随机误差;(2)淮确性,即最小的非抽样误差或偏差;(3)关联性,即满足用户决策、管理和研究的需要;(4)及时性,即在最短的时间里取得并公布数据;(5)一致性,即保持时间序列的可比性;(6)最低成本,即在满足以上标淮前提下,以最经济的方式取得数据。,统计学,统计学定义 统计学的内容体系 统计的应用,统计学定义,统计学是一门

13、独立的学科。 统计学是关于如何搜集、分析客观现象数据,以便给出正确认识结论的方法论科学。对定义的注释: 客观现象数据是为了进行认识客观现象而搜集、分析概括的数字与事实。 数据搜集包括科学实验和社会调查两大类渠道,数据分析包括描述性分析和推断性分析。 数学是统计学发展的重要理论基础,计算机科学是统计学应用的重要工具。 统计学的发展应用离不开哲学、以及经济学、社会学、生物学、医学等学科的发展。 统计学的应用领域十分广泛。,统计学,方法,统计描述,统计推断,Statistical,Methods,Descriptive,Statistics,Inferential,Statistics,反映客观 现

14、象数据,样本数据,总体数据,描述统计 (包括搜集、整 理、显示数据),概率论 (分布理论、 中心极限定理),推断统计 (估计、 假设检验),总体内在 数量规律,统计方法探索客观现象数量规律性的过程如下图:,数据收集,数据类型,用表格和图形 表示,趋中、离散程度 分布形状,用表格和图形 表示,调查 .,描述统计,数值数据,类型数据,探索性数据分析,基础概率,分布的 种类,二项分布 泊松分布 超几何分布,正态分布 指数分布,抽样分布,参数估计,检验假设,方差、回归、 判别、因子、 聚类、相关、 主成分分析等,离散,连续,推断统计,统计学的应用领域,从大的方面包括自然科学、社会科学、人文科学等各个领

15、域,从具体学科上看,可应用于物理学,化学,生物学,医学,生态学,气象学,天文学,军事科学遗传学,地理学,地质学,水文学,人类学,历史及考古学,教育学,心理学,人口学,经济学,精算,建筑工程学,农业,工业,法律,语言学,文学,管理科学,政治学,宗教研究,社会学,分类学等等。,三、多元统计分析,多元统计分析的研究对象和主要内容 多元统计分析方法与一元统计的比较 统计分析方法在经济统计中具体应用领域 统计分析方法在经济统计中的运用的一般步骤,(一)研究对象以及主要内容,研究对象 多元分析是以多维随机变量的内在联系及统计规律为其研究对象。是统计中讨论多维随机变量的统计方法的总称。 主要内容 从形式上看,一类是单变量常用的统计方法在多维随机变量情况下的应用;另一类是对多维变量本身进行研究的一些特殊方法。,具体内容包括,多元回归分析 主成分分析 因子分析 聚类分析 判别分析 对应分析 典型相关分析 时间序列分析 马尔科夫概型分析,一元统计与多元统计简单比较,统计分析方法在经济统计中具体应用领域,对多个变量进行降维处理,而选择数目较少的变量子集合; 主要方法:主成分分析、因子分析、对应分析等。 对现象进行分类研究、分类处理、构造分类模式 主要方法:聚类分析、判别分析等 建立经济模型和利用模型进行外

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论