第2章 统计数据的收集整理与显示ppt课件.ppt_第1页
第2章 统计数据的收集整理与显示ppt课件.ppt_第2页
第2章 统计数据的收集整理与显示ppt课件.ppt_第3页
第2章 统计数据的收集整理与显示ppt课件.ppt_第4页
第2章 统计数据的收集整理与显示ppt课件.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章统计数据的收集整理与显示 2 1统计数据的收集2 2统计数据的整理 2 1统计数据的收集 数据来源 按照统计研究的任务 运用科学的统计调查方法 有计划 有组织地向客观实际搜集资料的过程 在实验中控制实验对象而收集到的数据 称为实验数据 收集数据的要求 准确 及时 拟定统计调查方案 确定统计调查的目的 调查的对象 调查的项目等内容 天津广播听众调查问卷 目的 了解我市听众收听天津人民广播电台节目的一些基本情况 为提高节目质量 推出优秀节目提供科学依据 对象和单位 天津市市民调查项目和调查表 调查项目 听众收听天津人民广播电台节目的一些基本情况调查表 调查项目以表格的形式来表现 调查什么 2 1 1统计调查方案的确定1 确定调查目的2 确定调查对象和调查单位3 设计调查项目和调查表4 方案设计中的其他内容 调查方式 调查时间调查的组织与实施 2 1 2常用的统计调查方法 1 普查 是专门组织的一般用来调查属于一定时点上社会经济现象数量的全面调查 优点 全面 系统缺点 只限于有限总体 工作量大 时间性强 4 抽样调查 是从调查对象中随机抽取一部分单位作为样本进行调查的一种非全面调查优点 经济灵活 时效性强 适应面广和准确性高 3 典型调查 在对研究对象进行全面分析的基础上 有意识地选择部分有代表性单位进行调查优点 调查范围小 省时省力 具体深入缺点 具有主观性 2 重点调查 只在对象中选择一部分重点单位进行调查以了解总体情况的一种非全面调查优点 省时 省力 不带主观性 比重较大 人为选择的典型单位 随机原则 调查单位以等可能被抽到 保证代表性最大抽样效果原则 误差尽量小or调查费用尽可能小 5 统计报表是按照国家有关法规的规定 自上而下地逐级提供统计数据的一种调查方式 特点 是由政府部门组织 采用统一的表格 自上而下布置 自下而上报告 统计报表是经常性的全面调查 种类 1 调查范围 全面报表 非全面报表全面报表 要求调查对象每一个单位都填报 非全面报表 要求调查对象中的部分单位填报 2 内容和实施范围 国家 部门 地方统计报表 3 报送周期长短 日报 旬报 月报 季报 半年报 年报 4 报送单位不同 基层统计报表 综合统计报表 2 1 3调查问卷设计与问卷调查表的编码 2 1 3 1调查问卷设计 1 问卷的基本结构 问卷是调查者根据调查目的和要求所设计的 一般由开头部分 甄别部分 主体部分和背景部分组成 主体部分是调查问卷的核心内容 它包括了所要调查的全部问题 例 见案例一天津市房地产市场调查问卷设计 开头部分 开头部分也是问候语 说明调查的目的 消除被调查者的顾虑 争取合作 见P18问卷 甄别部分 甄别部分是为了符合调查的需要 而对被调查者进行筛选 背景部分主要是有关被调查者的一些背景资料 背景部分 主体部分 主体部分是调查问卷的核心内容 包括了所要调查的全部问题 2 设立问卷问题的注意事项 1 提问的内容尽可能短 2 问题设计的用词要准确 用语要含义明确 例 您通常喜爱选购什么样的鞋 您外出旅游时 会选购什么牌号的旅游鞋 例 您对它的价格和服务质量满意还是不满意 您对它的价格是否满意 您对它的服务质量是否满意 例 您最常用的获取新闻的方式是什么 只适合单选 例 最近您是否浏览过网站 今天您是否浏览过网站 3 在问卷中的问题 必须是能够获得诚实回答的问题 例 你对本课程的任课教师是否满意 实名调查 4 问题的不同提法 可能导致不同的回答结果 例 1941年罗格 Rugg 进行的试验 A 您是否认为美国应该禁止反对民主的公开言论 B 您是否认为美国应该允许反对民主的公开议论 调查结果 A54 是 B75 否 5 尽量避免诱导性 否定性和敏感性问题 例 购买盗版制品是不道德的 你是否购买过盗版制品 您并不认为应该增加反污染法规吧 您的个人收入是多少 3 设立问卷答案的注意事项 1 对单选问题 备选答案应当是一个空间的完整划分 A 您对食堂的伙食满意么 a 非常满意 b 满意 c 不满意 2 对单选 备选答案不应当是两个空间 层面 的混淆 A 您至今未买电脑的原因是什么 单选不可以 多选可以 a 买不起 b 没有用 c 不懂 d 其它 3 无论多 单选题 任一个备选答案都不能有多重含义 A 您选择信息专业的目的是 a 自己喜欢 好就业 b 4 无论多 单选题 备选答案之间不能有包含关系 A 您上大学的目的是 a 将来有一份收入高的工作 b 能够过上比较富裕的生活 c 4 问卷设计的基本原则主题鲜明目的明确 重点突出 没有可有可无的问题 2 结构合理先封闭后开放 先易后难 封闭性问题 事先设计好答案开放性问题 自由回答例如 您对学校的教学管理有何更具体的看法 3 适当控制回答时间 尽量不超过30分钟 4 便于计算机处理易于编码 录入 汇总和数据出表 2 1 3 2问卷调查表的编码1 单选题问卷调查表的编码 1 题号代号不能重复 2 同一量表的题号最好有相同的识别码 3 名义或类别问题的代号最好与其意义内涵有关 以3 6个英文字母简写代表最好 例 年龄为AGE 年级为YEAR 工作类别为JOB等 学生性别为SEX 教育程度为EDU等 2 复选题问卷调查表的编码 表2 1问卷调查表 A1 A11 A15 A14 A13 A12 A2 A21 A24 A23 A22 表2 2变量编码表 编码表说明 NUM 编码SEX 性别jOB 职务A11 A15代表第一题中5个选项 选中者输入1 未选中者输入0 A21 A24代表第二题中4个选项 选中者输入1 未选中者输入0 2 1 4统计数据的误差 统计数据的误差 指统计数据与客观现实之间的差距 研究误差的目的 找出导致误差产生的原因 进而采取对策避免 减少误差或控制误差水平 误差的主要来源 登记性误差和代表性误差 1 登记性误差 非抽样误差 登记性误差 人为因素所造成的误差 调查者规定或解释不明确导致的填报错误 调查员粗心 记录出现错误 调查员的态度 情绪以及责任心等 被调查者不理解规定或解释不明确导致的填报错误 有意虚报或瞒报调查数据等 注 登记性误差理论上讲是可以消除的 2 代表性误差 抽样误差 代表性误差 用样本数据推断总体时所产生的误差 影响误差的主要因素样本容量的大小 样本容量越大 代表性误差就越小总体的离散程度的高低 总体中各个体间的差异越大 抽样误差也就越大注 代表性误差通常无法消除 但事先可以进行控制和计算 2 2统计数据的整理 整理数据的中心任务 分组 编制频数分布表 2 2 1统计数据分组统计数据分组 就是根据统计研究的需要 将统计数据按照一定的标志划分为若干组成部分的一种统计方法 分组的标志 1 按品质标志分组品质型数据 主要是做分类整理 例如 按所有制性质划分 我国的经济类型可分为国有经济 集体经济 私营经济 个体经济 联营经济 股份制经济 外商投资经济 港 澳 台投资经济8组 例如 你是否认为你的任课教师在本门课程方面学识渊博 为学生提供了以下几个选择 1 非常赞同2 赞同3 不赞同4 非常不赞同从九个学生处得到如下数据 3 2 2 4 2 1 3 1 4 对数据进行分组得到 1 12 2 23 34 4 2 按数量标志分组数值型数据 主要是按照数值进行分组 例 对学生成绩分组 可分为60分以下 60 70分 70 80分 80 90分 90分以上5个组 按数量标志分组的方法 单项式分组 组距式分组 单项式分组 把每一个变量值作为一组 适用条件 通常只适于离散变量且变量值较少的情况 例2 1某车间50个工人看管机床台数资料如下 36243264324252623543236542432235456226432634545235试对数据进行分组 解 由于机器台数属于离散型变量 因此使用单项式分组方法 将原始资料按变量值升序排列 然后将相同变量值分为一组 最后将资料分成若干组 222222222222233333333334444444445555555666666 2 组距式分组组距式分组 将全部变量值依次划分为若干区间 并将这一区间的变量值作为一组 适用条件 连续变量 离散变量且变量值较多组距 等距分组 适用于变量值的变动比较均匀不等距分组 适用于变动很不均匀 且变动幅度大例 对学生成绩的分组可以分为0 20分 20 40分 40 60分 60 80分 80 100组例 学生成绩分组也可分为0 60 D 60 80 C 80 90 B 90 100 A 关键问题 分组数目的确定 组距的确定 等距分组 不等距分组 等距分组的基本步骤 数据排序分组数目的确定使每组所包含的数据个数 平均不少于4个或5个 或采用斯特吉斯经验公式 即k 1 3 322lgNk为组数 N为总体中的个体数 表2 3分组组数参考表 组距的确定组距 最大值 最小值 组数 组限的确定 1 第一组的下限应略低于最小变量值 最后一组的上限应高于最大变量值 2 对于离散型变量 相邻组的上下限可以不重叠 如 对于连续型变量 相邻两组的上下限应重叠 用 上限不在内 原则解决不重问题 左闭右开 如 3 开口组 当变量值变动范围较大时 最小组为 以下 或最大组为 以上 如 以下 以上 组中值的确定组中值 上限 下限 2开口组的组中值 下限 邻组组距 2 缺上限 上限 邻组组距 2 缺下限 见例2 2 P27 2 2 2频数分布频数 frequency 分布在各组内的数据个数 频率 percentage 各组频数 全部频数之和频数分布 在统计分组的基础上 将总体中所有的个体按某一标志进行归类排序2 2 2 1频数分布表频数分布表 将频数分布用表格的形式表现出来频数分布品质频数分布 按品质标志分组变量频数分布 按数量标志分组1 品质频数分布 表2 5职工性别的频数分布表 2 变量频数分布单项式频数分布 每一组只有一个值组距式频数分布 按组距式分组1 单项式频数分布 表 宿舍所住学生数的频数分布表 2 组距式频数分布步骤 a 分组b 统计出每组变量的频数 频率c 按各组组限的大小顺序列出组距式变量数列d 给出频数分布表 表2 7某品牌汽车的销售量的频数分布表 2 2 2 2累计频数和累计频率1 累计频数 cumulativefrequencies 频数逐级累加2 累计频率或百分比 cumulativepercentages 频率逐级累加累计频数 率 方法 例 某单位按某种产品的销售量分组统计 可以得到如表2 8所示的频数分布 表2 8某种产品的销售量的频数分布表 140 150 160 170 销量 台数 10 20 30 40 向上累计 140 150 160 170 销量 台数 10 20 30 40 120 向下累计 2 2 3统计表与统计图2 2 3 1统计表 统计表将数据资料经汇总整理后 按一定顺序填在以纵横交叉的线条所绘制的表格内 统计表的结构由表头 行标题 列标题 数字资料组成 2 统计表的设计 1 表头设计要明确地表达其内容 2 左右两边通常不封口 列标题之间通常用竖线分开 而行标题之间通常不用横线分开 3 应注明数字资料的计量单位 4 数字应对准位数 3 统计表的分类1 简单分组下的统计表简单分组 只按一个标志进行的分组 表2 111982 1990年北京市人口 单位 万人 资料来源 80年代中国人口变动分析 中国人口续篇 2 复合分组下的统计表复合分组 采用两个或两个以上的标志进行分组 表2 12东北三省1993 1996年国内生产总值 单位 亿元 资料来源 中国统计年鉴 1997 2 2 3 2统计图统计图 利用各种几何图形表现统计资料的形式 1 条形图 barchart 条形图 用宽度相同的条形的高度或长短来表示数据频数分布变化的图形 适用条件 用于比较 分析同类指标在不同时间或地区的发展差异 多用于顺序和分类变量的分析 2 饼形图 piechart 饼形图 用圆形及圆内扇形的面积来表示频数分布变化的图形 适用条件 用于研究事物内在结构组成等问题 例 学生评教调查中第十题的频率分布表 条形图 例 学生评教调查中第十题的频率分布表 饼形图 3 直方图 Histogramschart 直方图 用矩形的面积来表示频数分布变化的图形 横轴表示各组组限 纵轴表示频数或频率 适用条件 适用于定距形变量的分析 注 可以在直方图上附加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论