统计与数据课件_第1页
统计与数据课件_第2页
统计与数据课件_第3页
统计与数据课件_第4页
统计与数据课件_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学绪论统计学中的基本概念统计数据的分类统计软件简介统计学绪论统计学中的基本概念“统计”一词的三种含义统计工作:获取、分析、展示和解释数据的过程。统计数据,统计资料。统计学。中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社“统计”一词的三种含义统计工作:获取、分析、展示和解释数据的什么是统计学统计学是一门收集、分析、展示和解释数据的艺术和科学。(collection,analysis,interpretationorexplanation,andpresentationofdata)是一系列从数据中获取有用信息以帮助决策的原理和方法。什么是统计学统计学是一门收集、分析、展示和解释数据的艺术和科统计学的广泛应用由于大部分学科都涉及数据分析工作,因此统计学几乎可以与任何一个学科结合起来……统计学经济学管理学医学工程学社会学…统计学的广泛应用由于大部分学科都涉及数据分析工作,因此统计学应用案例:制定宏观经济政策制定当前金融危机的各项应对措施需要大量的统计支持(数据收集、影响程度的预测、政策效果的预测等等)。对失业农民工数量的调查:农业部不久前组织的一次抽样调查显示,到春节前返乡的农民工约占总数的38.5%。其中,有60.4%的农民工是正常的春节回家探亲,他们在城市的工作仍然保留着,节后会回去正常上班。剩余39.6%的农民工则属于失去工作或者还没有找到工作而提前返乡。据此测算,失业返乡农民工约占农民工总量的15.3%,即约2000万人。应用案例:制定宏观经济政策制定当前金融危机的各项应对措施需要应用案例:通用电气(GE)“六西格玛”是当前流行的质量管理思想,其核心是利用统计方法不断改进产品的质量。Welch1995年底在通用电气开始发起“六西格玛”项目,这些项目的实施取得了令人诧异的成功:1997年带来的效益是3.2亿美元。应用案例:通用电气(GE)“六西格玛”是当前流行的质量管理应用案例:抽样调查美国大选2008年11月02日民意调查机构调查结果(选民票得票率)

马里斯特:奥巴马50,麦凯恩43.

拉斯马森:奥巴马51,

麦凯恩47.

盖洛普:奥巴马52,麦凯恩43.

佐格比:奥巴马50,麦凯恩43.

迪亚乔:奥巴马48,麦凯恩41.

战场:

奥巴马49,

麦凯恩45.

IBD:

奥巴马48,

麦凯恩44.实际结果:奥巴马和麦凯恩的选民票得票率分别为52%和46%。

应用案例:抽样调查美国大选2008年11月02日民意调查机构课程重点掌握各种统计方法的原理和应用范围使用统计软件实现这些统计方法的能力能够用Excel/SPSS进行统计分析,熟悉Excel/SPSS的输出结果对计算机输出结果的解释和使用能力课程重点掌握各种统计方法的原理和应用范围二、统计学中的基本概念描述统计和推断统计总体和样本参数和统计量数据和变量类型统计指标及其分类二、统计学中的基本概念描述统计和推断统计1、描述统计与推断统计描述统计(DescriptiveStatistics):用表格、图形和数字来概括、显示数据特征的统计方法。例1:2005年我国出生人口性别比(男:女)已经升高到119.92,与正常值106相比有严重的偏离。例2:中国经济增长的起伏1、描述统计与推断统计描述统计(DescriptiveSt推断统计推断统计(InferentialStatistics):

从总体中抽取样本,并利用样本数据来推断总体特征的统计方法。总体(population):由统计研究所涉及的那些同质个体(也称单位)所形成的集合。样本(sample):所研究总体的一部分。总体样本推断统计推断统计(InferentialStatistic参数(parameter):描述总体数量特征的概念常用希腊字母。例如总体均值用表示;总体方差用表示等。统计量(statistic):描述样本数量特征的概念,常用英文字母表示,如样本均值用表示,样本方差用表示等。推断统计的主要任务:用统计量估计参数总体样本参数(parameter):描述总体数量特征的概念常用希腊字推断统计的例子例1:2003年人口变动抽样调查以全国为总体,在全国抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。根据调查结果推算,2003年末全国总人口为129227万人,出生人口为1599万人,死亡人口为825万人,净增人口为774万人。例2:一家大公司的会计部门会从所有的发票中选择一部分来检查公司所有发票的准确性。推断统计的例子例1:2003年人口变动抽样调查以全国为总体描述统计与推断统计的关系总体内在的数量规律性推断

统计概率论与数理统计描述

统计

总体数据样本数据描述统计与推断统计的关系总体内在的数量规律性推断

统计概率论2数据和变量类型“数据!数据!数据!”他不耐烦地喊道,“我不能做无米之炊!”

—Sherlock·福尔摩斯2数据和变量类型“数据!数据!数据!”他不耐烦地喊道数据的计量尺度与类型:例子定类尺度定序尺度定距尺度定比尺度精确程度良好1980134公斤中国国籍:健康状况:出生年份:体重:数据的计量尺度与类型:例子定类尺度定序尺度定距尺度定比尺度精(1)、定类尺度(NominalScale)也称列名尺度、名义尺度、分类尺度例如:性别、民族、职业数据表现为“类别”各类之间无等级次序

各类别可以用数字代码表示根据定类尺度得到的数据为分类数据。(1)、定类尺度(NominalScale)也称列名尺度(2)、定序尺度(OrdinalScale)也称顺序尺度例如健康状况、质量等级数据表现为“类别”可对等级、大小等排序未测量出类别之间的准确差值根据定序尺度得到的数据为顺序数据。(2)、定序尺度(OrdinalScale)也称顺序尺度(3)、定距尺度

IntervalScale也称间隔尺度例如年份、摄氏温度数据表现为“数值”可以进行加减运算“0”是只是尺度上的一个点,不代表“不存在”根据定距尺度得到的数据为间距数据。(3)、定距尺度IntervalScale也称间隔尺(4)、定比尺度RatioScale也称比率尺度例如体重、身高数据表现为“数值”可以进行加减、乘除运算“0”表示“没有”或“不存在”根据定比尺度得到的数据为比率数据。(4)、定比尺度RatioScale也称比率尺度定距尺度与定比尺度的区别定距尺度中“0”表示一个具体数值,不表示“没有”或“不存在”,定比尺度中“0”表示“没有”或“不存在”。定距尺度

0℃

-

273.15℃-123.15℃26.85℃定比尺度

0K

150K300K定距尺度与定比尺度的区别定距尺度中“0”表示一个具体数值,不定距尺度与定比尺度的区别(续)

在实际应用中定距尺度与定比尺度差别微不足道,往往不作区分。例如在SPSSStatistics软件中,数据的计量尺度被分为3类:名义(Nominal)有序(Ordinal)度量(Scale

)定距尺度与定比尺度的区别(续)四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级别由低到高。2、根据较高层次的计量尺度可以获得较低层次的计量尺度。3、不同的尺度数据对应这不同数据显示方法和分析方法。四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级数据和变量类型:总结数据的类型定类数据定序数据定性数据定量数据定距数据定比数据品质变量AttributeCategorical数量变量Numerical变量类型数据和变量类型:总结数据的类型定类数据定序数据定性数据定量数变量的概念和类型变量是用来描述现象某种令人感兴趣的特征的概念。品质变量是描述个体有关属性特征的变量,本质上不能用数字来表示。例如性别。数量变量是描述个体有关数量特征的变量,都是用数字来表示的。例如人数,年龄等。离散型变量指的是有限个数值或诸如0,1,2……之类无限可列值的变量。

如果某一变量可以取某一区间或多个区间中任意数值,则该变量称为连续型变量。

变量的概念和类型变量是用来描述现象某种令人感兴趣的特征的概横截面、时间序列和面板数据横截面数据(Cross-sectionaldata)是在同一时点或是大约在同一时点所收集的数据。例如2008年我国各直辖市的GDP。时间序列数据(Timeseriesdata)是按时间顺序取得的一系列数据。例如我国历年的GDP。面板数据(PanelData):对多个事物在不同时期或时点上进行测量得到的数据。如1990-2008年全国各个省份的GDP横截面、时间序列和面板数据横截面数据(Cross-sect3、统计指标的概念一般有两种理解和两种使用方法:1、统计指标是指反映现象数量特征的概念。如年末人口数、商品销售额、劳动生产率等。2、统计指标是反映现象数量特征的概念和具体数值。我国2004年的国内生产总值为136515亿元。

3、统计指标的概念一般有两种理解和两种使用方法:统计指标的分类(概括)统计指标的分类总量指标相对指标平均指标时点数时期数统计指标的分类(概括)统计指标的分类总量指标相对指标平均指标总量指标也称为绝对数:以绝对数形式表现现象规模和水平的统计指标。可以分为时点数和时期数。例如,2007全年入境旅游人数13187万人次;2007年全年国内生产总值246619亿元;2007年末全国参加城镇基本养老保险人数为20107万人.

总量指标也称为绝对数:以绝对数形式表现现象规模和水平的统计指时点数是描述某种现象在某一个特定时刻(某一瞬间或某一时点)数量表现的数据。例如,2007年年末全国总人口为132129万人。时期数是描述某种现象在某一个特定时间范围内所实现的成果的数据。例如,2004年我国全年各种运输方式完成货物运输周转量66698亿吨公里。区分数据是时点数还是时期数的方法之一看其加总后的结果是否有意义。若有意义则该指标必定是时期数。反之,则必定是时点数。时点数和时期数时点数是描述某种现象在某一个特定时刻(某一瞬间或某一时点)相对指标:采用两个有联系的数值进行对比而得到的比值。也称为相对数,如产业结构比例、性别比、人口密度等等。平均指标:也称为平均数,反映现象在某一时间或空间上的平均数量水平。例如职工的平均工资,平均考试成绩,等等。相对数和平均数相对指标:采用两个有联系的数值进行对比而得到的比值。也称为相三、常用统计软件简介应用统计学涉及大量数据的处理工作,需要借助统计软件完成。统计软件的种类很多。本课程要求使用Excel和SPSSStatistics软件。由于软件的操作很容易,对统计软件的教学主要采取视频课件+自学的方式完成。对统计软件的掌握情况通过课程作业来进行考核。三、常用统计软件简介应用统计学涉及大量数据的处理工作,需要借SPSSStatistics17.0软件在课程网站提供试用下载(文件在网站上只保留一个月)或者自己google一下。大部分统计方法都可以通过鼠标操作得到相应的分析结果,学习成本非常低。包含的统计方法较为齐全。SPSSStatistics17.0软件在课程网站提供试ExcelExcel软件也具有较强的统计分析功能。其数据分析模块提供了常用的统计方法可以做出美观的图形ExcelExcel软件也具有较强的统计分析功能。R软件完全免费的开源统计软件需要学习编程技术,学习成本稍高;功能非常强大,适合专门的数据分析人员使用。从国际来看用户增长很快。R软件完全免费的开源统计软件SAS软件具有非常强大的数据分析能力,是数据分析和统计分析领域的巨无霸。《财富》全球500强企业前100家企业中的91家在用SAS。需要学习一定的编程技术;软件的使用成本非常高。SAS软件具有非常强大的数据分析能力,是数据分析和统计分析领小结“统计”有统计工作、统计资料和统计学三种含义统计学是一门收集、分析、展示和解释数据的艺术和科学描述统计和推断统计总体和样本,参数和统计量分类数据、顺序数据、间距数据和比率数据统计指标的概念和表现形式小结“统计”有统计工作、统计资料和统计学三种含义思考题

下面是我国《2002年国民经济和社会发展统计公报》中的部分内容,请说出这些数据的计量尺度和类型:

城乡居民生活继续得到改善。全国城镇居民人均可支配收入7703元,比2001年实际增长13.4%;农村居民人均纯收入2476元,实际增长4.8%。下列数据中哪些采用了定距尺度?海拔8848米960万平方公里23岁北纬38度思考题下面是我国《2002年国民经济和社会发统计学绪论统计学中的基本概念统计数据的分类统计软件简介统计学绪论统计学中的基本概念“统计”一词的三种含义统计工作:获取、分析、展示和解释数据的过程。统计数据,统计资料。统计学。中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社“统计”一词的三种含义统计工作:获取、分析、展示和解释数据的什么是统计学统计学是一门收集、分析、展示和解释数据的艺术和科学。(collection,analysis,interpretationorexplanation,andpresentationofdata)是一系列从数据中获取有用信息以帮助决策的原理和方法。什么是统计学统计学是一门收集、分析、展示和解释数据的艺术和科统计学的广泛应用由于大部分学科都涉及数据分析工作,因此统计学几乎可以与任何一个学科结合起来……统计学经济学管理学医学工程学社会学…统计学的广泛应用由于大部分学科都涉及数据分析工作,因此统计学应用案例:制定宏观经济政策制定当前金融危机的各项应对措施需要大量的统计支持(数据收集、影响程度的预测、政策效果的预测等等)。对失业农民工数量的调查:农业部不久前组织的一次抽样调查显示,到春节前返乡的农民工约占总数的38.5%。其中,有60.4%的农民工是正常的春节回家探亲,他们在城市的工作仍然保留着,节后会回去正常上班。剩余39.6%的农民工则属于失去工作或者还没有找到工作而提前返乡。据此测算,失业返乡农民工约占农民工总量的15.3%,即约2000万人。应用案例:制定宏观经济政策制定当前金融危机的各项应对措施需要应用案例:通用电气(GE)“六西格玛”是当前流行的质量管理思想,其核心是利用统计方法不断改进产品的质量。Welch1995年底在通用电气开始发起“六西格玛”项目,这些项目的实施取得了令人诧异的成功:1997年带来的效益是3.2亿美元。应用案例:通用电气(GE)“六西格玛”是当前流行的质量管理应用案例:抽样调查美国大选2008年11月02日民意调查机构调查结果(选民票得票率)

马里斯特:奥巴马50,麦凯恩43.

拉斯马森:奥巴马51,

麦凯恩47.

盖洛普:奥巴马52,麦凯恩43.

佐格比:奥巴马50,麦凯恩43.

迪亚乔:奥巴马48,麦凯恩41.

战场:

奥巴马49,

麦凯恩45.

IBD:

奥巴马48,

麦凯恩44.实际结果:奥巴马和麦凯恩的选民票得票率分别为52%和46%。

应用案例:抽样调查美国大选2008年11月02日民意调查机构课程重点掌握各种统计方法的原理和应用范围使用统计软件实现这些统计方法的能力能够用Excel/SPSS进行统计分析,熟悉Excel/SPSS的输出结果对计算机输出结果的解释和使用能力课程重点掌握各种统计方法的原理和应用范围二、统计学中的基本概念描述统计和推断统计总体和样本参数和统计量数据和变量类型统计指标及其分类二、统计学中的基本概念描述统计和推断统计1、描述统计与推断统计描述统计(DescriptiveStatistics):用表格、图形和数字来概括、显示数据特征的统计方法。例1:2005年我国出生人口性别比(男:女)已经升高到119.92,与正常值106相比有严重的偏离。例2:中国经济增长的起伏1、描述统计与推断统计描述统计(DescriptiveSt推断统计推断统计(InferentialStatistics):

从总体中抽取样本,并利用样本数据来推断总体特征的统计方法。总体(population):由统计研究所涉及的那些同质个体(也称单位)所形成的集合。样本(sample):所研究总体的一部分。总体样本推断统计推断统计(InferentialStatistic参数(parameter):描述总体数量特征的概念常用希腊字母。例如总体均值用表示;总体方差用表示等。统计量(statistic):描述样本数量特征的概念,常用英文字母表示,如样本均值用表示,样本方差用表示等。推断统计的主要任务:用统计量估计参数总体样本参数(parameter):描述总体数量特征的概念常用希腊字推断统计的例子例1:2003年人口变动抽样调查以全国为总体,在全国抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。根据调查结果推算,2003年末全国总人口为129227万人,出生人口为1599万人,死亡人口为825万人,净增人口为774万人。例2:一家大公司的会计部门会从所有的发票中选择一部分来检查公司所有发票的准确性。推断统计的例子例1:2003年人口变动抽样调查以全国为总体描述统计与推断统计的关系总体内在的数量规律性推断

统计概率论与数理统计描述

统计

总体数据样本数据描述统计与推断统计的关系总体内在的数量规律性推断

统计概率论2数据和变量类型“数据!数据!数据!”他不耐烦地喊道,“我不能做无米之炊!”

—Sherlock·福尔摩斯2数据和变量类型“数据!数据!数据!”他不耐烦地喊道数据的计量尺度与类型:例子定类尺度定序尺度定距尺度定比尺度精确程度良好1980134公斤中国国籍:健康状况:出生年份:体重:数据的计量尺度与类型:例子定类尺度定序尺度定距尺度定比尺度精(1)、定类尺度(NominalScale)也称列名尺度、名义尺度、分类尺度例如:性别、民族、职业数据表现为“类别”各类之间无等级次序

各类别可以用数字代码表示根据定类尺度得到的数据为分类数据。(1)、定类尺度(NominalScale)也称列名尺度(2)、定序尺度(OrdinalScale)也称顺序尺度例如健康状况、质量等级数据表现为“类别”可对等级、大小等排序未测量出类别之间的准确差值根据定序尺度得到的数据为顺序数据。(2)、定序尺度(OrdinalScale)也称顺序尺度(3)、定距尺度

IntervalScale也称间隔尺度例如年份、摄氏温度数据表现为“数值”可以进行加减运算“0”是只是尺度上的一个点,不代表“不存在”根据定距尺度得到的数据为间距数据。(3)、定距尺度IntervalScale也称间隔尺(4)、定比尺度RatioScale也称比率尺度例如体重、身高数据表现为“数值”可以进行加减、乘除运算“0”表示“没有”或“不存在”根据定比尺度得到的数据为比率数据。(4)、定比尺度RatioScale也称比率尺度定距尺度与定比尺度的区别定距尺度中“0”表示一个具体数值,不表示“没有”或“不存在”,定比尺度中“0”表示“没有”或“不存在”。定距尺度

0℃

-

273.15℃-123.15℃26.85℃定比尺度

0K

150K300K定距尺度与定比尺度的区别定距尺度中“0”表示一个具体数值,不定距尺度与定比尺度的区别(续)

在实际应用中定距尺度与定比尺度差别微不足道,往往不作区分。例如在SPSSStatistics软件中,数据的计量尺度被分为3类:名义(Nominal)有序(Ordinal)度量(Scale

)定距尺度与定比尺度的区别(续)四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级别由低到高。2、根据较高层次的计量尺度可以获得较低层次的计量尺度。3、不同的尺度数据对应这不同数据显示方法和分析方法。四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级数据和变量类型:总结数据的类型定类数据定序数据定性数据定量数据定距数据定比数据品质变量AttributeCategorical数量变量Numerical变量类型数据和变量类型:总结数据的类型定类数据定序数据定性数据定量数变量的概念和类型变量是用来描述现象某种令人感兴趣的特征的概念。品质变量是描述个体有关属性特征的变量,本质上不能用数字来表示。例如性别。数量变量是描述个体有关数量特征的变量,都是用数字来表示的。例如人数,年龄等。离散型变量指的是有限个数值或诸如0,1,2……之类无限可列值的变量。

如果某一变量可以取某一区间或多个区间中任意数值,则该变量称为连续型变量。

变量的概念和类型变量是用来描述现象某种令人感兴趣的特征的概横截面、时间序列和面板数据横截面数据(Cross-sectionaldata)是在同一时点或是大约在同一时点所收集的数据。例如2008年我国各直辖市的GDP。时间序列数据(Timeseriesdata)是按时间顺序取得的一系列数据。例如我国历年的GDP。面板数据(PanelData):对多个事物在不同时期或时点上进行测量得到的数据。如1990-2008年全国各个省份的GDP横截面、时间序列和面板数据横截面数据(Cross-sect3、统计指标的概念一般有两种理解和两种使用方法:1、统计指标是指反映现象数量特征的概念。如年末人口数、商品销售额、劳动生产率等。2、统计指标是反映现象数量特征的概念和具体数值。我国2004年的国内生产总值为136515亿元。

3、统计指标的概念一般有两种理解和两种使用方法:统计指标的分类(概括)统计指标的分类总量指标相对指标平均指标时点数时期数统计指标的分类(概括)统计指标的分类总量指标相对指标平均指标总量指标也称为绝对数:以绝对数形式表现现象规模和水平的统计指标。可以分为时点数和时期数。例如,2007全年入境旅游人数13187万人次;2007年全年国内生产总值246619亿元;2007年末全国参加城镇基本养老保险人数为20107万人.

总量指标也称为绝对数:以绝对数形式表现现象规模和水平的统计指时点数是描述某种现象在某一个特定时刻(某一瞬间或某一时点)数量表现的数据。例如,2007年年末全国总人口为132129万人。时期数是描述某种现象在某一个特定时间范围内所实现的成果的数据。例如,2004年我国全年各种运输方式完成货物运输周转量66698亿吨公里。区分数据是时点数还是时期数的方法之一看其加总后的结果是否有意义。若有意义则该指标必定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论