统计学与SPSS第章统计与数据PPT课件.ppt_第1页
统计学与SPSS第章统计与数据PPT课件.ppt_第2页
统计学与SPSS第章统计与数据PPT课件.ppt_第3页
统计学与SPSS第章统计与数据PPT课件.ppt_第4页
统计学与SPSS第章统计与数据PPT课件.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

可编辑 统计学绪论 统计学课程简介统计学中的基本概念统计数据的分类统计软件简介 可编辑 一 统计学 课程简介 主讲教师 Email 电话 可编辑 统计 一词的三种含义 统计工作 获取 分析 展示和解释数据的过程 统计数据 统计资料 统计学 可编辑 什么是统计学 统计学是一门收集 分析 展示和解释数据的科学 thescienceofcollecting analyzing presenting andinterpretingdata 是一系列从数据中获取有用信息以帮助决策的原理和方法 可编辑 统计学的广泛应用 由于大部分学科都涉及数据分析工作 因此统计学几乎可以与任何一个学科结合起来 可编辑 应用案例 制定宏观经济政策 政府制定各项经济政策对需要大量的统计支持 数据收集 趋势预测 政策效果的评价等等 未来的就业形势 经济增长前景 物价形势 国际收支状况 可编辑 应用案例 通用电气 GE 六西格玛 是当前流行的质量管理思想 其核心是利用统计方法不断改进产品的质量 Welch1995年底在通用电气开始发起 六西格玛 项目 这些项目的实施取得了令人诧异的成功 1997年带来的效益是3 2亿美元 可编辑 应用案例 抽样调查 美国大选2008年11月02日民意调查机构调查结果 选民票得票率 马里斯特 奥巴马50 麦凯恩43 拉斯马森 奥巴马51 麦凯恩47 盖洛普 奥巴马52 麦凯恩43 佐格比 奥巴马50 麦凯恩43 迪亚乔 奥巴马48 麦凯恩41 战场 奥巴马49 麦凯恩45 IBD 奥巴马48 麦凯恩44 实际结果 奥巴马和麦凯恩的选民票得票率分别为52 和46 可编辑 课程的主要内容 数据的搜集数据的描述统计分析参数估计和假设检验 回顾 方差分析非参数检验相关与回归分析时间序列分析统计指数多元统计分析方法 主成分与因子分析 聚类与判别分析 列联分析与对应分析等 可编辑 教学资料 教材 刘扬主编 统计学 预计2010年4月份出版 教材出版之前的章节提供电子版讲义 ftp下载 本课程为北京市精品课程 课程网站 ftp 用户名 statistics 密码 stat2010 注意 部分内部资料只在ftp提供下载 网站提供的为公共资料 任课教师可能根据教学需要对公共课件进行修改和补充 可编辑 课程重点 掌握各种统计方法的原理和应用范围使用统计软件实现这些统计方法的能力能够用SPSS进行统计分析 熟悉SPSS的输出结果对计算机输出结果的解释和使用能力 可编辑 课时安排和考核方式 总课时 54 3学分考核 期末统一的闭卷考试 70 课程作业 30 可编辑 关于课程作业 1 课程提供的作业题目供任课教师参考 在网站公布 任课教师可以提出不同的作业题目和要求 作业建议分三次提交 占总成绩的30 第一次作业包括问卷设计 描述统计分析 假设检验 第二次作业包括方差分析 非参数检验 回归分析 时间序列分析 第三次作业包括统计指数计算 主成分与因子分析 聚类与判别分析 列联表和对应分析 可编辑 关于课程作业 2 作业应符合格式要求 以电子版的方式通过FTP系统提交 学生应保留每次作业的备份直到课程结束 每次作业最多可以有3个学生合作完成 合作者按相同的成绩记分 严重雷同的作业均按0分计算 可编辑 学习统计学的一些建议 不要缺课 由于课程内容是前后呼应的 缺课非常不利于后续内容的学习 多做练习 通过练习加深对统计方法的理解 通过实际操作熟悉相应的统计软件 可编辑 二 统计学中的基本概念 描述统计和推断统计总体和样本参数和统计量数据和变量类型统计指标及其分类 可编辑 1 描述统计与推断统计 描述统计 DescriptiveStatistics 用表格 图形和数字来概括 显示数据特征的统计方法 例1 2005年我国出生人口性别比 男 女 已经升高到119 92 与正常值106相比有严重的偏离 例2 中国经济增长的起伏 可编辑 推断统计 推断统计 InferentialStatistics 从总体中抽取样本 并利用样本数据来推断总体特征的统计方法 总体 population 由统计研究所涉及的那些同质个体 也称单位 所形成的集合 样本 sample 所研究总体的一部分 推断统计的主要任务 用统计量估计参数 中央财经大学统计学院19 可编辑 推断统计的例子 例1 2003年人口变动抽样调查以全国为总体 在全国抽取了990个县 市 区 3734个乡 镇 街道 6544个调查小区的126万人 根据调查结果推算 2003年末全国总人口为129227万人 出生人口为1599万人 死亡人口为825万人 净增人口为774万人 例2 一家大公司的会计部门会从所有的发票中选择一部分来检查公司所有发票的准确性 可编辑 描述统计与推断统计的关系 总体内在的数量规律性 推断统计 概率论与数理统计 描述统计 总体数据 样本数据 可编辑 2数据和变量类型 数据 数据 数据 他不耐烦地喊道 我不能做无米之炊 Sherlock 福尔摩斯 可编辑 数据的计量尺度与类型 例子 定类尺度 定序尺度 定距尺度 定比尺度 精确程度 良好 1980 134公斤 中国 国籍 健康状况 出生年份 体重 2020 1 15 24 可编辑 1 定类尺度 NominalScale 也称列名尺度 名义尺度 分类尺度例如 性别 民族 职业数据表现为 类别 各类之间无等级次序各类别可以用数字代码表示根据定类尺度得到的数据为分类数据 可编辑 2 定序尺度 OrdinalScale 也称顺序尺度例如健康状况 质量等级数据表现为 类别 可对等级 大小等排序未测量出类别之间的准确差值根据定序尺度得到的数据为顺序数据 可编辑 3 定距尺度IntervalScale 也称间隔尺度例如年份 摄氏温度数据表现为 数值 可以进行加减运算 0 是只是尺度上的一个点 不代表 不存在 根据定距尺度得到的数据为间距数据 可编辑 4 定比尺度RatioScale 也称比率尺度例如体重 身高数据表现为 数值 可以进行加减 乘除运算 0 表示 没有 或 不存在 根据定比尺度得到的数据为比率数据 可编辑 定距尺度与定比尺度的区别 定距尺度中 0 表示一个具体数值 不表示 没有 或 不存在 定比尺度中 0 表示 没有 或 不存在 定距尺度0 273 15 123 15 26 85 定比尺度0K150K300K 可编辑 定距尺度与定比尺度的区别 续 在实际应用中定距尺度与定比尺度差别微不足道 往往不作区分 例如在SPSSStatistics软件中 数据的计量尺度被分为3类 名义 Nominal 有序 Ordinal 度量 Scale 可编辑 四种计量尺度的比较 1 四种尺度所包含的信息量是依次递增的 级别由低到高 2 根据较高层次的计量尺度可以获得较低层次的计量尺度 3 不同的尺度数据对应这不同数据显示方法和分析方法 可编辑 数据和变量类型 总结 数据的类型 变量类型 可编辑 变量的概念和类型 变量是用来描述现象某种令人感兴趣的特征的概念 品质变量是描述个体有关属性特征的变量 本质上不能用数字来表示 例如性别 数量变量是描述个体有关数量特征的变量 都是用数字来表示的 例如人数 年龄等 离散型变量指的是有限个数值或诸如0 1 2 之类无限可列值的变量 如果某一变量可以取某一区间或多个区间中任意数值 则该变量称为连续型变量 可编辑 横截面 时间序列和面板数据 横截面数据 Cross sectionaldata 是在同一时点或是大约在同一时点所收集的数据 例如2008年我国各直辖市的GDP 时间序列数据 Timeseriesdata 是按时间顺序取得的一系列数据 例如我国历年的GDP 面板数据 PanelData 对多个事物在不同时期或时点上进行测量得到的数据 如1990 2008年全国各个省份的GDP 可编辑 3 统计指标的概念 一般有两种理解和两种使用方法 1 统计指标是指反映现象数量特征的概念 如年末人口数 商品销售额 劳动生产率等 2 统计指标是反映现象数量特征的概念和具体数值 我国2004年的国内生产总值为136515亿元 可编辑 统计指标的分类 概括 可编辑 总量指标 也称为绝对数 以绝对数形式表现现象规模和水平的统计指标 可以分为时点数和时期数 例如 2007全年入境旅游人数13187万人次 2007年全年国内生产总值246619亿元 2007年末全国参加城镇基本养老保险人数为20107万人 可编辑 时点数是描述某种现象在某一个特定时刻 某一瞬间或某一时点 数量表现的数据 例如 2007年年末全国总人口为132129万人 时期数是描述某种现象在某一个特定时间范围内所实现的成果的数据 例如 2004年我国全年各种运输方式完成货物运输周转量66698亿吨公里 区分数据是时点数还是时期数的方法之一看其加总后的结果是否有意义 若有意义则该指标必定是时期数 反之 则必定是时点数 时点数和时期数 可编辑 相对指标 采用两个有联系的数值进行对比而得到的比值 也称为相对数 如产业结构比例 性别比 人口密度等等 平均指标 也称为平均数 反映现象在某一时间或空间上的平均数量水平 例如职工的平均工资 平均考试成绩 等等 相对数和平均数 可编辑 三 常用统计软件简介 应用统计学涉及大量数据的处理工作 需要借助统计软件完成 统计软件的种类很多 本课程要求使用Excel和SPSSStatistics软件 由于软件的操作很容易 对统计软件的教学主要采取视频课件 自学的方式完成 对统计软件的掌握情况通过课程作业来进行考核 可编辑 IBMSPSSStatistics 软件在ftp提供内部试用下载 也可以自己google一下 大部分统计方法都可以通过鼠标操作得到相应的分析结果 学习成本非常低 包含的统计方法较为齐全 可编辑 Excel Excel软件也具有较强的统计分析功能 其数据分析模块提供了常用的统计方法可以做出美观的图形 可编辑 R软件 完全免费的开源统计软件需要学习编程技术 学习成本稍高 功能非常强大 适合专门的数据分析人员使用 从国际来看用户增长很快 可编辑 SAS软件 具有非常强大的数据分析能力 是数据分析和统计分析领域的巨无霸 财富 全球500强企业前100家企业中的91家在用SAS 需要学习一定的编程技术 软件的使用成本非常高 可编辑 小结 统计 有统计工作 统计资料和统计学三种含义统计学是一门收集 分析 展示和解释数据的科学描述统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论