版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,以Excel 和SPSS为工具的管理统计,同济大学经济与管理学院 管理科学与工程系 张建同 教授,2,主要参考书: 1.马庆国.管理统计数据获取、统计原理SPSS工具与应用研究。北京:科学出版社,2003 2.张建同、孙昌言、王世进.应用统计学.北京:清华大学出版社,2010,3 3.何晓群.多元统计分析.北京:中国人民大学出版社,2004 4.戴维 M.莱文、戴维 F.斯蒂芬等 (张建同、刘文驰等译)以Excel为决策工具的商务统计.北京:机械工业出版社,2009年5月,以Excel 和SPSS为工具的管理统计,3,几种常用的统计软件(Software),典型的统计软件 SAS SPSS
2、 MINITAB STATISTICA Excel,4,本章教学目标: 了解统计学的基本知识; 统计数据的收集、调查; 掌握利用统计图表整理和表示统计数据的基本方法; 掌握利用 Office 软件绘制各种统计图表、计算各种统计综合指标。,第一章 统计数据的收集与整理,5,本章主要内容,1.1 统计学概述 1.2 统计数据的收集 1.3 问卷设计 1.4 统计表和统计图,6,1.1 什么是统计学?,1. 数据搜集:例如,调查与试验 2. 数据整理:例如,分组 3. 数据展示:例如, 图和表 数据分析:例如,回归分析, 统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,
3、以达到对客观事物的科学认识,7,Statistics的定义(不列颠百科全书),Statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc. (不列颠百科全书),8,统计数据的内在规律(一些例子),正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现16点的频率各为1/6 农作物的产量与施肥量之间存在相关关系,9,统计学的应用领域
4、,10,基于统计学的数据转换应用,11,应用统计的领域,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineer
5、ing (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学),12,应用统计的领域(续),hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management scienc
6、e (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) soc
7、iology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),13,二、统计研究对象的特点,1.数量性 统计学研究的对象是客观现象的数量特征和规律性。 2.总体性 统计学研究的是客观现象总体的数量特征与规律性,而不是个体的量。 3.具体性 统计的对象是一定时间、地点、条件下事物的量,而不是抽象对象的量,这是统计学和数学的一个重要区别。 4.差异性 组成统计研究对象总体的个体是有差异的,否则就不需要进行统计分析。统计研究中需要对总体中大量的个体进行观察并进行综合分析,由此才能获得总体的数量分布特征。,
8、14,三、统计学的分类,统计学大致有以下两种主要的分类方法。 1.描述统计学和推断统计学 这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。 描述统计学 是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。 在二十世纪之前统计学基本上处于描述阶段。描述统计学是统计学的基础。 推断统计学 是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。 推断统计学是近代统计学的核心,也是统计学中的主要内容。,15,统计学的分科,统计学的分科,16,描述统计与推断统计的关系,反映客观现象的数据,描述统计 (统计数据的搜集、整理、显示和分析等),统计学探索现象数量规律性的
9、过程,17,2.理论统计学和应用统计学,理论统计学 是研究统计学的数学原理,它基于概率论的原理,还包括不属于传统概率论的一些内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。 在统计实践中经常会遇到一些原有的统计方法不能适应的新问题,需要创造新的统计模型和统计分析方法,这就需要统计理论的研究与指导。 应用统计学 将统计学的基本原理应用于各个领域就形成各种应用统计学的分支。它包括适用于各个领域的一般性的统计方法,如参数估计、假设检验、方差分析、回归分析等,还包括在某一领域中特定的分析方法,如经济统计中的时间数列分析和指数分析等。 应用统计学侧重于阐明统计学的基本原理,并
10、将理论统计学的成果作为工具应用于各个领域。,18,统计基本术语,变量:事物的特征,是运用统计方法所分析的对象。例如,在商业模型中,销售额、每年的开支和每年的净利润都是企业想要分析的变量。 数据 :是与变量相关的值。变量可能随时间变动,如某一公司的期望销售额、开支和净利润每年都有所不同。这些不同的值就是与变量相关的数据,或者简单地说,就是统计所要分析的“数据”。 注意:变量需赋予可操作定义 ,否则会产生歧义。如:对销售额的操作性定义可能会发生这样错误的理解:一个人认为年销售额是指全部连锁店的年销售额,而另一个人则认为是每家店的年销售额。,19,统计基本术语,总体:所研究对象的全体。 个体:指总体
11、中的每个元素或单元。总体依其所包含的个体总数分为有限总体和无限总体。 样本:从总体中挑选出来用于分析的一部分。这种挑选通常是相对独立的。样本是进行推断统计的依据。 参数:参数是描述总体特征的数值。 统计量:是描述样本特征的数值,20,1.2 数据的计量与类型,统计学中将变量分为分类变量或数值变量。 分类变量(也称为定性变量)的值只能按类别分开。 数值变量(也称为定量变量)的值表示数量。数值变量可进一步分为离散变量和连续变量。,21,四种计量尺度,1.2 数据的计量与类型,数据的计量尺度,22,定类尺度(概念要点),计量层次最低 对事物进行平行的分类 各类别可以指定数字代码表示 使用时必须符合类
12、别穷尽和互斥的要求 数据表现为“类别” 具有=或的数学特性,23,定序尺度(概念要点),对事物分类的同时给出各类别的顺序 比定类尺度精确 未测量出类别之间的准确差值 数据表现为“类别”,但有序 具有或的数学特性,24,定距尺度(概念要点),1.对事物的准确测度 2.比定序尺度精确 3.数据表现为“数值” 4. 没有绝对零点 5.具有 + 或 - 的数学特性,25,定比尺度(概念要点),1.对事物的准确测度 2.与定距尺度处于同一层次 3.数据表现为“数值” 4. 有绝对零点 5.具有 或 的数学特性,26,四种计量尺度的比较,计量尺度,数学特性,“”表示该尺度所具有的特性,27,数据类型与统计
13、方法,数据类型与统计方法,28,数据是统计分析的基础,社会经济统计中所需要的数据与资料主要来源于统计调查。 一.数据采集的基本要求 1.准确性 2.及时性 3.完整性 4.系统性 指统计调查的数据资料应配套,要能从不同侧面反映所研究总体的特征,才能为科学的判断和决策提供依据。,1.3 统计数据的收集,29,二.普遍调查,普遍调查简称普查,是专门组织的一次性的全面调查 。如全国的人口普查、能源普查、工业普查等。 组织方式有两种: 1.建立专门的普查机构 2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。 普查时注意的原则: 规定统一的标准时点 规定统一的普查期限 规定普查的项目和
14、指标。,30,普遍调查实例,【例1.1】 2002年在国务院统一部署下,开展全国“基本单位普查”。关于这次普查的部分重要要求与规定如下: 调查目的:统计分析全国和各省市地区的单位总数、性质、隶属关系、分布情况等。 标准时间:2001年12月31日。 调查对象:各类法人单位,各类法人单位所属的产业活动单位。 调查项目:单位总数; 性质分类(企业法人、事业法人、社团法人、机关法人、其他法人); 基本情况 性质划分、隶属关系(中央、省市、区县、街道等); 主要构成(产业结构、行业分布、地区分布、经济成分、规模结构); 分布情况。,31,三.重点调查,在总体中选择部分重点单位进行调查,以了解总体基本情
15、况的一种非全面调查。 重点调查的特点: (1) 重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。 (2) 重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。 (3) 重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。,32,四.典型调查,也是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入细致的调查。 典型调查的作用和目的 (1) 研究新事物或某种倾向性的社会问题 通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物发
16、展变化的趋势,形成科学的预见。 (2) 分析事物的不同类型 通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转化和发展。,33,五.典型调查(续),(3)典型调查可用来研究事务的变化规律。 (4)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总体。,34,六.抽样调查,是指按随机原则从总体中抽取部分单位组成样本。目的是利用样本数据推断(估计)总体的数量分布特征。 抽样调查是现代推断统计的核心,也是最重要的统计调查方法。,35,抽样调查中四种误差,涵盖误差 :当某一组代表性的样本被排除在抽样调查之外时所引起的选择偏差。 无回应误差 :抽样时,对样本个体数据收集
17、失败会导致无回应偏差。 抽样误差:选择抽样调查是因为这种方法简单、低成本和有效。但同时也意味着有的个体被抽中,有的个体没有被抽中。 测量误差:测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。 课堂讨论:举例说明这几种误差。,36,七.网上调查,截至2009年6月底,中国网民规模达到3.38亿人,较2008年底增长13.4%,上网普及率达到25.5%。网民规模持续扩大,互联网普及率平稳上升。其中宽带网民数达到3.2亿,占比高达94.3%,较2008年底上升了3.7个百分点。另外,截至2009年6月底,作为国家域名,CN域名总计达到1,296万个。作为我国互联网的重要基础资源,CN域
18、名已经广泛地应用在金融、汽车等各个行业中。截止2009年6月我国互联网用户发展情况如图1.2所示。,37,图1-2 2008-2009年我国互联网用户发展情况 (资料来源:第23次中国互联网络发展状况统计报告),38,网上调查优势,及时性和共享性 便捷性和低成本 可靠性和客观性 更好的接触性 穿越时空性,39,问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。 1.合理性 合理性指的是问卷必须紧密与调查主题相关。 2.一般性 即问题的设置是否具有普遍意义。 3. 逻
19、辑性 问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能出现逻辑上的谬误。 4. 明确性 所谓明确性,事实上是问题设置的规范性。 5.非诱导性 非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。,1.4 问卷设计,40,在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。,1.4统计表和统计图,41,一、分类数据的图表,
20、1、频数分布表 频数分布表列出了一系列分类数据的频率、总数或百分比,可以看出不同类别数据间的区别。,表2-1 1 000美元用途的频数分布表,42,一、分类数据的图表,2、条形图,43,一、分类数据的图表,3、圆饼图,44,一、分类数据的图表,4、 帕累托图 在帕累托图中,不同类别的数据是按其频率降序排列的,并在同一张图中画出累积百分比图。帕累托图可以体现帕累托原则:数据的绝大部分存在于很少类别中,极少剩下剩余的数据分散在大部分类别中。这两组经常被称为“至关重要的极少数”和“微不足道的大多数”,45,二、数值数据的图表,例:某公司汽车销售量 (单位:辆),46,1、频数分布表,分组统计整理后,
21、 将杂乱无章的 60 个原始数据压缩到8组,清晰地反映了更多的有用信息。,47,制作频数分布表的注意事项,分组的数量 实际应用中分组的数量和组距应根据对象的特点和分析的需要决定。 如果分组是为了揭示数据的分布规律,则分组不能过多和过少。通常应在515 之间。在绘制直方图时可以参照下表:,48,制作频数分布表的注意事项,2) 分组的方法 分组的方法可以有等距分组和不等距分组两类。采用哪种分组方法应根据数据的分布特点而定。通常,当数据在一定范围内基本呈对称分布时,宜采用等距分组;而当数据的分布状态极度偏斜时,则宜采用不等距分组。,49,例: 按雇工人数分组的私营企业规模统计,50,制作频数分布表的
22、注意事项,3)组限:组限也即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。 重叠和组限不重叠组限 重叠组限相邻组的上下限重合。 适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是 a, b)的形式。 注意:Excel在制作频数分布表时采用的是“上限在内”的规则。 不重叠组限相邻组的上下限不重合。 适用于离散型变量。,51,例:离散型变量的分组(不重叠组限),某公司某月汽车销售量的频数分布表,52,例:连续型变量的分组(上限不在内),某企业职工工资的分组统计,53,制作频数分布表
23、的注意事项,4) 组中值 组中值是各组的代表值,在计算分组数据的许多统计指标时要用到。通常取该组上限和下限的平均值为组中值。如表2-7所示,1019的组中值是14.5,2029的组中值是24.5,等等。 5) 表格线 统计表中的表格线应当是两边开口的表格。,54,使用 Excel 制作频数分布表,利用 Excel 的 FREQUENCY 函数 语法规则: 格式:FREQUENCY(,) 接收区间各组上限值组成的一列区域 功能:返回各组的频数。 使用【工具】“数据分析”“直方图”功能,55,统计图可以形象、直观、生动、简洁地显示数据的特征。 常用的统计图有以下几种: 1.折线图 通常用来描述时间
24、序列数据,用以表示某些指标的变化趋势。 制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。,二、 统计图,56,图1.2 失业人数统计图,过分压缩了Y轴,57,图1.3 失业人数统计图,过分压缩了X轴,58,2.柱形图、条形图和直方图,柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。 (1)柱形图 主要用于表示时间序列数据。,59,图1.4 各类进口商品的变化情况,柱形图示例,60,(2)直方图用以表示数据的频数分布规
25、律。,图1.5 比特公司啤酒销售量的频数分布,61,未分组数据的茎叶图,用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 对于n(20n300)个数据,茎叶图最大行数不超过 L = 10 log 10 n 茎叶图类似于横置的直方图,但又有区别 直方图可大体上看出一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息,62,树茎,树叶,788,022347778889,0012222333344466777889,0133445799,数据个数,未分组数据茎叶
26、图(茎叶图的制作),图 某车间工人日加工零件数的茎叶图,63,4.曲线图,用于描述连续型变量的分布特征。 Office 中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标签下选“平滑线”复选框,就将折线图转换为曲线图。,64,Cumulative Distribution累积分布,累积分布表示的是小于或等于每一组上限的项目数 累积相对频数分布表示的是小于或等于每一组上限的项目比例 累积百分数分布表示的是小于或等于每一组上限的项目的百分数,65,Ogive穹形图,穹形图是一种累积频数分布或累积相对频数分布的图形 数据值列示在横轴上 纵轴为累积频数或相对累积频数,66,Example:比特啤酒公司销售
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年四川省巴中市从“五方面人员”中选拔乡镇领导班子成员考试强化练习题及答案
- 2025年卫生高级职称面审答辩普通外科副高面审经典试题及答案
- 2025年一级建造师考试(机电工程管理与实务)题库含答案佛山
- 2026年高级育婴师学习考试试题及答案解析
- 宁德市一级建造师考试(机电工程管理与实务)题库含答案(2025年)
- 除颤操作失误纠错模拟应急演练
- 跨河桥梁汛期漂浮物撞击应急预案
- 机动车检测站内审年度计划及实施细则
- Giparmen-生命科学试剂-MCE
- FTC-146-precursor-生命科学试剂-MCE
- 中职机械教学中数字化教学资源的开发与应用课题报告教学研究课题报告
- 宜宾市自然资源和规划局竞争性比选工作人员的考试参考试题及答案解析
- 《道路运输企业主要负责人和安全生产管理人员安全考核机动车维修企业》专业部分题库(附答案)
- 20.2电生磁教案(表格式)2025-2026学年初中物理人教版九年级全一册
- 霍桑红字介绍
- TGXAS-抗肿瘤药物临床试验护理工作规范编制说明
- 美团推广合同范本
- 网络金融部业务知识考试题库
- 税务领导选拔面试题目及答案
- 内分泌危象识别与应急处理
- 机关人员公务出差审批单
评论
0/150
提交评论