




已阅读5页,还剩137页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章统计数据的收集与整理第一节统计数据的来源第二节统计数据的图表描述第三节统计数据的指标描述第四节统计表 第一节统计数据的来源 统计数据的类型 从使用者角度 统计数据获取的途径统计数据获取的组织方式 直接数据 一 统计数据的类型 一手资料 直接数据 二手资料 间接数据 是早已存在的他人已作整理分析的资料 如合同 生产记录 财务报表 政府公报 商业调查报告 媒体消息等 来源于别人调查和实验的数据 一手资料 二手资料 根据特定的目的和要求而专门收集的资料 如原始记录 调查问卷答案 实验结果等 一手资料一般通过统计调查得到 来源于直接的调查和实验 二手资料的来源 1 公开出版物 中国统计年鉴 中国统计摘要 中国社会统计年鉴 中国工业经济统计年鉴 中国农村统计年鉴 中国人口统计年鉴 中国市场统计年鉴 世界经济年鉴 国外经济统计资料 世界发展报告 2 还有专门提供数据信息服务的综合和专业数据库 3 政府 行业协会 咨询机构 研究机构 私人调查数据 各级政府统计局和各部委都有定期的较具权威的数据发布4 网络提供的一些搜索引擎服务项目 二 统计数据获取的途径 调查 Survey 从事物存在 发生的现场获取数据 但对现场行为不干预实验 Experiment 从事物存在 发生的现场获取数据 但对现场行为有计划 有选择地施加影响模拟 Simulation 依据一定的基本数据使用计算机产生大量的随机数据 帮助进行决策 例 某食品饮料公司为其主营饮料开发出了一个新配方 希望顾客能够喜欢 以便推向市场 但是如果多数顾客都喜欢原配方饮料 那么就不生产新配方饮料 为此 该公司邀请了一组顾客共100人进行品尝 目的是比较新配方饮料和原配方饮料哪个口感好 方案1 让100名顾客都尝新饮料 然后让他们说新饮料是否优于原饮料 倘若说 是 的明显多于说 不 的 则可以得出新饮料优于原饮料的结论 否则 不宜得出此结论 方案2 拿出印有不同包装标记的新 原饮料各100包 让每名顾客各饮新 原饮料各一包 然后表态 方案3 两种饮料都斟入相同的玻璃杯中 请评价者先饮原饮料 后饮新饮料 玻璃杯无标签 然后表态 方案4 将100名顾客随机分成两组 各带入一个房间 让一组顾客先品尝无标签的原饮料 后品尝无标签的新饮料 另一组品尝顺序相反 最后把两组的意见综合在一起 得出结论 分析 方案1 没有很好体现对照原则 一则研究者没有确认顾客是否有饮原饮料的经验 二则即使有此经验 那也是以前的事 应当场品尝 方案2 存在品牌忠诚性和守旧与求新的消费哲学问题 有的求新 有的守旧 因此回答在多大程度上反映了饮料本身的质地 又在多大程度上掺杂了评价者的消费哲学 不得而知 破坏了齐同原则 方案3 排除了新旧偏好的因素干扰 但却没有排除饮用次序的因素干扰 后饮饮料将长久地显示其口感 破坏了随机原则 实验设计 遵循的原则 对照原则 PrincipleofComparison 实验因素作用的辨别和测定只有在不同情况的对照中才能实现 没有对照 就不会有比较和鉴别齐同原则 PrincipleofHomogeneity 在实验中所相互比较的各组之间 除有计划地变动实验因素外 其他因素要尽可能保持相对固定 只有这样 才能显示实验因素的作用 随机原则 PrincipleofRandomness 确保总体中每一个单位都有被选取的同等机会 总体单位的分配以及总体单位接受实验因素的程度或形式都应该遵循随机原则 吸烟的观察研究 三种原则之间的关系 对照原则是实验设计的根本 齐同原则和随机原则是实现对照的前提条件 齐同原则侧重强调外界条件 确保实验因素外 其他一切因素都不得在实验中起作用 当然只能做到相对而不能做到绝对 随机原则则强调内部条件 确保接受实验因素的各组之间没有系统性差别 三 统计数据获取的组织方式 统计调查 1 统计调查的概念2 统计调查的种类3 统计调查方案的设计4 统计调查的主要方法5 调查问卷的设计 政府统计调查机构体系 1 中国政府统计调查机构体系 2 企业调查总队 省企业调查队 省城市调查队 抽中县市城市调查队 农村调查总队 县级统计局 地级统计局 乡镇 街道 统计站 抽中地级城市企业调查队 省农村调查队 抽中县市农村调查队 省级统计局 1 统计调查的概念 指直接从各调查单位搜集的用来反映个体特征的数据资料 统计调查是整个统计认识活动的基础 决定着统计认识过程及其结果的成败 2 统计调查的种类 按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 普查 人口普查 经济普查 特点 一次性全面调查 收集的资料全面准确 但工作量大 注意事项 高质量的普查队伍明确规定标准时点调查项目应简明普查应尽可能按一定周期进行 根据特定目的 如为了解国情 国力 而专门组织的一次性全面调查 普查的标准时点 必须明确规定调查资料所属的标准时点 使所有普查资料都反映这一时点上的状况 避免重复和遗漏 我国第五次人口普查规定的调查时间为2000年11月1日0点 11月3日登记时 下面哪些不应计入人口普查人口总数 1 2000 11 1日5时出生的婴儿 2 2000 11 1日0点活着 2日死亡的人 3 2000 10 31日23时出生 11 2日死亡的婴儿 4 2000 10 31日13时出生 23时死亡的婴儿 中国的普查 人口普查 0年份工业普查 5年份农业普查 7年份三产普查 3年份R D普查经济普查 抽样调查 特点 遵循随机原则根据部分推断总体 从所研究的总体中 按照随机原则 抽取部分单位进行调查 并将调查整理得出的数量特征 用来推断总体综合数量特征的调查形式 抽样调查的优越性 1 对于破坏性的实验 只能用抽样调查 2 大规模的社会调查 在实践上只能用抽样调查 3 节约费用 4 时效性 5 准确性 小常识 二次人口普查之间各年份的人口数据都是通过抽样调查获得的 城镇劳动力抽样调查企业抽样调查人口变动情况抽样调查农产量抽样调查农村住户抽样调查乡村社会经济调查价格调查城市住户调查城镇劳动力调查 统计报表调查 特点 报表所包含的范围全面 分组齐全 项目系统 指标内容和调查周期相对稳定 但也有局限性 如缺乏灵活性 时效性差等 按照国家或上级部门统一规定的表式 统一的内容和项目 统一的报送程序和报送时间 自下而上逐级提供基本统计资料的一种调查方式 种类 按主管系统的不同 分基本统计报表和专业统计报表 按填报单位的不同 分基层报表和综合报表 按报送周期长短的不同 分日报 旬报 月报 季报 半年报 年报 基本单位统计报表调查农林牧渔业统计报表调查农业产值综合统计报表调查工业统计报表调查运输邮电业综合统计报表调查建筑业统计报表调查批发零售贸易 餐饮业统计报表调查固定资产投资统计报表调查劳动统计报表调查科技统计报表调查大中型工业企业科技活动统计报表调查城镇劳动力统计调查企业调查统计报表调查价格统计报表调查 重点调查 特点 重点单位易于确定 很少受主观因素影响 调查单位少 花费少 属于一次性或经常性调查 注意事项 选出单位应尽可能少 但其标志值所占比重应尽可能大 选出的单位应易于取得统计资料 从调查对象总体的全部单位中 选择一部分在全局中举足轻重的重点单位进行的调查 高校收入调查 典型调查 特点 强调被选单位的代表性 典型性 注重定性调查 重点调查则注重定量调查 其缺点是典型单位的选择易受调查者主观意识的影响 且是否 典型 难于用科学的手段测定 根据调查目的 从调查对象中有意识地选择有代表性的单位进行调查 独立学院运行调查 典型单位的分类 中等典型先进典型落后典型特殊典型 典型单位的选择方法 择中选典法划类选典法择优 劣 选典法 我国统计调查方法体系改革的目标模式 建立以周期性普查为基础 以经常性的抽样调查为主体 以必要的统计报表 重点调查 综合分析等为补充 搜集 整理基本统计资料的统计调查方法体系模式 注意各种调查方法的结合应用 把全面调查和非全面调查结合起来 或用非全面调查核实全面调查资料的质量 如人口普查 全面调查和抽样调查结合 如美国 曾选择20 的人口调查出生地 文化教育程度 收入等 选择15 的人口调查父母出生地 童年语言 是否服兵役等 选择5 的人口调查行业 职业和来美时间 3 调查方案设计 调查方案的内容 调查目的 why 1 调查要达到的具体目标2 回答 为什么调查 3 调查之前必须明确 调查对象和调查单位 who 1 调查对象调查研究的总体或调查范围2 调查单位需要对之进行调查的单位 可以是调查对象的全部单位 全面调查 也可以是调查对象中的一部分单位 非全面调查 3 回答 向谁调查 调查项目和调查表 what 1 调查项目调查的具体内容2 调查表 表现调查项目的表格或问卷3 回答 调查什么 2000年全国人口普查根据调查项目拟定了姓名 性别 年龄 民族 文化程度 职业 行业 婚姻状况 迁来本地的原因等26个调查项目 方案设计中的其他问题 1 明确调查所采用的方法2 确定调查资料的所属时间和调查工作的期限3 调查的组织与实施细则调查时间 调查资料所属的时期和时点 调查期限 从收集资料到报送整个工作所需的时间 4 统计调查的主要方法 访问调查 概念要点 1 调查者与被调查者通过面对面地交谈而获得资料2 有标准式访问 结构式访问 和非标准式访问 非结构式访问 标准式访问通常按事先设计好的问卷进行非标准式访问事先一般不制作问卷3 用于市场调查和社会调查 对不起 打扰了 邮寄调查 概念要点 1 也称邮寄问卷调查2 是一种标准化调查3 调查者与被调查者没有直接的语言交流 信息的传递依赖于问卷4 通过某种方式将调查表或问卷送至某调查者手中 由被调查者填写 然后将问卷寄回指定收集点5 问卷或表格的发放方式有邮寄 宣传媒介传送 专门场所分发三种 电话调查 概念要点 1 调查者利用电话与被调查者进行语言交流以获得信息2 时效快 成本低3 问题的数量不宜过多 您好 我是 调查公司的调查员 座谈会 概念要点 1 也称集体访谈2 将一组被调查者集中在调查现场 让他们对调查的主题发表意见以获得资料3 参加座谈会的人数不宜过多 一般为6 10人4 侧重于定性研究 用于收集专家学者意见 头脑风暴法 个别深度访问 概念要点 1 一次只有一名受访者参加 针对特殊问题的调查2 适合于较隐秘的问题 如个人隐私问题 或较敏感的问题 如政治方面的问题3 侧重于定性研究 网上调查 1 省时 省力 节省费用2 在视觉效果上吸引人3 样本的代表性不好控制4 存在无限制样本问题 准确性难以辨别5 互联网的安全性问题 观察法 概念要点 1 就调查对象的行动和意识 调查人员边观察边记录以收集所需信息2 调查人员不是强行介入3 能够在被调查者不察觉的情况下获得资料4 对调查人员素质要求高 交通流规律的调查 实验法 概念要点 1 在设定的特殊实验场所 特殊状态下 对调查对象进行实验以获得所需资料2 有室内实验法和市场实验法 新产品的市场实验 5 调查问卷设计 调查问卷的含义调查问卷设计的要求调查问卷的基本结构调查问卷设计程序案例分析操作训练 调查问卷的含义 调查问卷又称调查表 是调查者根据调查目的和要求设计的由一系列问题 备选答案 说明及代码表组成的书面文件 其目的是为了从被调查者那里获得有关某个主题的信息 调查问卷设计中面临的主要问题是 提什么问题 这些问题如何措辞以及如何编排才能获得调查者所需要的信息 成功的问卷设计必须满足两个条件 1 问卷所列的问题能够让被调查者明白无误地理解 愿意并易于回答 2 调查者所获得的信息是所需了解的完整 准确的信息 并能适合于随后的统计数据的处理 调查问卷设计的要求 突出主题问题的措辞必须清楚 避免使用专业术语及不规范的简称 语气亲切 对敏感性问题采取一定技巧 问题的排列顺序要符合逻辑 先易后难 先简后繁 先问事实 后问态度和意向 感兴趣的问题放前 敏感问题放后 调查内容的量要适当调查前对问卷进行测试 调查问卷的基本结构 题目 准确 醒目 突出 说明信 致被调查者的一封短信 目的是让被调查者了解调查的意义 引起被调查者足够的重视和兴趣 争取他们的支持和合作 说明信要说明调查者的身份 调查的中心内容及要达到的目的和意义 选样原则和方法 调查结果的使用和依法保密的措施与承诺 有时还需将奖励的方式 方法及奖金 奖品等问题叙述清楚 被调查者的基本情况 这是对调查资料进行分类研究的基本依据 被调查者若是个人 包括姓名 性别 民族 年龄 文化程度 职业 技术职称 个人或家庭收入等项目 被调查者若是企事业等单位 则包括单位名称 经济类型 行业类别 职工人数 规模 资产等项目 调查事项的问题和答案 最基本 最主要的组成部分 优点 比较灵活 适合收集深层次的信息 如 想了解客户的真实呼声 对某一问题的看法 感受 要求和评价等均适合采用开放式问题 缺点 由于答案各异 有时甚至出现答非所问的情况 给资料整理带来困难 描述性的回答较多 难以定量处理 1 开放式问题 只提出问题而不向被调查者提供任何具体的答案 由被调查者根据自己的想法自由填写 2 封闭式问题 在提出问题的同时 给出问题的若干可能答案 由被调查者从中进行选择 两项选择 答案只有两项 被调查者任选其一 多项选择 列出三个或以上的答案 由被调查者从中选择 单选 选一个 多选 选两个或以上 限选 注明可任选几项 排序选择 对所选的答案按要求的顺序进行排序等级评定 答案是不同等级的 优点 有利于被调查者的回答及研究者的资料整理 适合定量分析缺点 应答者的创造性受约束 答案一旦设计有缺陷 将影响调查质量 开放式问题 1 您喜欢看什么电视节目 2 您过去从事什么工作 3 您对您未来收入的最高估计是多少 封闭式问题 1 您家有电脑吗 A 有B 无 2 请问您的年龄是多少 A 20岁以下B 20 29岁C 30 39岁D 40 49岁E 50岁以上 3 你上大学时确定专业方向考虑的因素有哪些 按考虑因素的先后顺序排序 A 个人兴趣B 就业率C 发展方向D 预期收入E 别人的建议F 工作安稳舒适 4 您对我们提供的客户服务满意程度如何 A 非常满意B 满意C 较满意D 不满意E 很不满意 开放式提问的设计 内容 用词 提问的内容尽可能短 用词确切 通俗 一项提问只包括一项内容 避免诱导性提问 避免否定式提问 6W Who where when Why what how 避免敏感性问题 这些问题设计合理吗 请问您使用什么牌子的洗发水 您觉得这种新款轿车的加速性能和制动性能如何 您觉得这种电视机的画面质量如何 人们认为长虹牌彩电质量不错 您觉得怎么样 您觉得这种产品的新包装不美观吗 您们家有多少存款 半封闭式问题 在对一个问题的回答中 既有封闭式又有开放式 先进行封闭式问题的选择 然后是开放式问题的选择 您最喜欢的运动项目是什么 A 球类运动B 跳绳C 游泳D 滑冰E 体操F 太极拳G 走步H 其他 请用文字注明 填写说明和解释 指导语 填写问卷的要求 调查项目的含义 被调查者应注意的事项等 其目的在于明确填写问卷的要求和方法 作业证明的记载 调查人员的姓名 调查时间 作业完成情况等 以明确调查人员的责任 编码 为了使计算机能对问卷进行定量分析 往往需要对调查事项的问题和答案进行编码 即用事先规定的代号 阿拉伯数字 来表示某些事物及其不同状态的信息 开放式问题一般是在问卷回收后再进行编码 因为开放式问题的答案只有在回收后才知道 封闭式问题一般采取预编码 即在问卷设计的同时进行编码 您是否吸烟 如果选 则跳过 题 吸烟 不吸 您每天大约吸多少支烟 5支以下 5 10支 10 15支 15 20 20 25支 25支以上 您的吸烟历史大约有多长 1年以下 1 5年 5 10年 10年以上 您是否认为吸烟有害健康 请写出理由 调查单位中吸烟人所占比例 吸烟人群日吸烟数量情况 吸烟人群吸烟历史情况 调查对象对吸烟的看法 调查问卷设计程序 1 根据调查目的确定调查资料根据调查主题的要求研究调查内容 首先初步列出调查主题所需要的全部信息 判断主要信息和次要信息 删除不必要信息 再分析哪些信息需要通过问卷调查来取得 以及需要向谁进行调查等 最后确定调查的对象 时间和地点 2 分析调查对象的特征根据第一步拟定的调查对象群体 分析它们的社会环境 行为习俗 文化水平 理解能力等基本特征 并根据这些特征来拟定问题 3 参考以前的问卷参考相同或相似主题的其他调查所使用过的问题 可为本次调查的问题提供良好的基础 在某些情况下 例如 不同时期数据的比较 可以使用同样的问题 但要注意总体概念是否一致 4 草拟编排问题数据的收集方法 决定问卷的长度和提问的方式 例如 人员面访问卷最长 自填式问卷稍短 电话访问问卷最短 考虑被调查者的特点每个问题必须有其写入问卷的理由 审议问卷 测试问卷 问卷定稿 中国台湾学者林振春先生就良好问卷提出了10点评价标准 问卷中所有的题目都和研究目的相符合 亦即题目都是测量所要调查的选项 问卷能显示出和一个重要主题有关 使填答者认为重要 且愿意花时间去填答 亦即具有表面效度 问卷仅在收集由其他方法所无法得到的资料 如调查社区的年龄结构 应直接向户政机关取得 以问卷访问社区居民是无法得到的 问卷尽可能简短 其长度只要足以获得重要资料即可 问卷太长会影响填答 最好30分钟以内 问卷的题目要依照心理的次序安排 由一般性至特殊性 以引导填答者组织其思想 而让填答具有逻辑性 问卷题目的设计要符合编题原则 以免获得不正确的回答 问卷所收集的资料 要易于列表和解释 问卷的指导语或填答说明要清楚 使填答者不致有错误的反应 问卷的编排格式要清楚 翻页要顺手 指示符号要明确 不致有瞻前顾后的麻烦 印刷纸张不能太薄 字体不能太小 间隔不能太小 装订不能随便 要能符合精美的原则 尊敬的先生 女士 我们是武汉大学经济与管理学院的学生 为了积极参与贯彻国家关于扩大内需推动经济增长的方针和理论与实践相结合的教育原则 在老师指导下我们组织了这次千户居民的社会调查 请您给予支持 调查不记名 全部资料用计算机处理 绝对保密和安全 您只需在符合您的情况的答案上打个勾 花费几分钟时间 谢谢 范例 武汉市城市居民消费与投资倾向调查问卷 1 您家是否已经拥有下列耐用家电设备1 彩电 2 组合音箱 3 VCD 或DVD 4 冰箱 5 空调 6 电脑 2 您家的住房是 1 租赁公房 2 有产权公房 3 新商品房 4 其他 请注明 3 您家今明两年是否准备以下项目支出 1 购买家电设备5 现有住房装修2 购买成套家俱6 支付子女教育费3 购买汽车7 国内或国际旅游4 购买 或置换 房屋 4 您今明两年不准备上列大项目支出的主要原因是 选填3项 1 没有必要5 售后服务差2 经济不宽裕6 价格不合理3 品牌不中意7 其他 请注明 4 质量信不过 5 您购买商品考虑的主要因素是 1 实用价值4 品牌2 商品质量5 售后服务3 价格 请按您认为的重要性在 中写上位序 6 您家平均每月总收入是 1 500元以下5 2000 3000元2 500 1000元6 3000 5000元3 1000 1500元7 5000 8000元4 1500 2000元8 8000元以上 7 您家平均每月日常生活费开支是元A 其中用于吃 食品 支出大约是元 8 您认为您家近几年生活水平是1 提高很多2 略有提高3 没有变化4 略有下降5 下降很多 9 您收入节余用予以下哪些项 各项约占多大比重 1 银行储蓄 4 其他债券 2 国债 国库卷 5 股票 3 基金 6 保险 7 其他 10 您存钱的主要目的是 1 购买设备4 子女教育2 购买住房5 养老防病3 结婚6 旅游 请按你认为的重要性在 中写位序 11 您是否了解现在推行的信贷消费1 不了解 2 了解一点 3 了解 4 很了解 12 您是否打算参加信贷消费 1 是 2 不 跳过第13问题 13 您信贷消费的项目是 请按第3题的编号填写 14 您是否同意下列看法 很同无不很同意所同不意谓意同意1 信贷消费不合中国国情2 信贷消费是资本主义国家的做法3 信贷消费是先甜后苦4 借债享受有风险5 借债消费不光彩6 信贷消费是现代通行的做法7 只要量力借贷 有利无害8 发展信贷消费能促进经济增长 15 最后 了解一下您的基本情况A 您的性别 1 男 2 女B 您的年龄 周岁C 您的文化程度 1 不识字或识字不多 2 小学3 初中4 高中或中专5 大专或大学以上D 您家庭人口数人其中D 1 在业人 D 2 离退休人D 3 失业 下岗人 D 4 在校学生人E 您的职业 见卡片 F 职务 范例 购物调查问卷 对购物妇女进行一项关于对柜台服务的商店和自选商店的态度的调查 1 您的年龄是多少岁 20以下20 3030 4040 5050 6060以上2 您的婚姻状态 已婚单身丧偶3 您在这个地区住了多长时间 4 您在什么地方购买主要的日常用品5 它是柜台服务还是自选服务 自选服务柜台服务6 您熟悉售货员或售货员熟悉你 是不是7 买日常用品时您总是一次买很少种类一次买一周的日用品 8 在您光顾的商店 您也买肉 水果 蔬菜 是不是9 哪种商店您觉得更自由且更独立 柜台自选10 您觉得自选商店的商品由于更高的流通而可能更新鲜 是不是11 您认为自选商店更大 非私人化且不需要那种对您认识的小店主那样忠诚 是不是12 您同意下列说法 自选商店便宜 有效率且清洁 自选商店昂贵 无效率且不卫生 柜台商店友善 热情且有特点 柜台商店的服务员比自选商店更周到且更有效率13 您外出工作了吗 是不是14 您有汽车吗 有没有15 您认为您属于哪个社会阶级工人阶级下中等阶级中产阶级上中等阶级 操作训练 统计调查 训练目的 以校园生活为课题 设计一项统计调查项目 体验完整的统计实践过程 训练内容 制定调查方案设计问卷组织实施调查数据分析撰写调查报告 调查项目参考 大学生生活费收支状况调查报告本科生衣物支出情况的调查报告眼镜消费的统计调查本科生手机普及情况的调查报告本科生使用电脑情况调查研究本科生参加课余培训班的情况的调查关于逃课问题的调查报告本科生自习情况的调查报告图书馆利用状况的调查报告上网收费问题的调查关于毕业生去向问题的调查关于校风问题的调查 训练要求 1 分组进行 每组一个选题 本周分组 选好组长第四周各组将本组名单和选题交给班长 班长统一协调 2 第五周交调查方案和调查问卷 调查方案至少要包括调查目的 调查对象 调查时间 调查内容 调查方法 调查的组织和实施计划等 3 第六 七两周实施调查 按调查方案的要求搜集资料 保留原始调查数据 4 第八 九周进行数据处理和分析 5 第十 十一周各组提供调查报告及调查方案 问卷 调查结果汇总表和调查小结等6 各组派代表评议全部的实践成果 好的在课堂上报告 报告人和成员可以加分 各组要上交的调查方案及问卷1份调查分析报告原始数据汇总表 每一问题的各选择出现的次数 调查小结 对调查及分析的实施过程作简要的总结 包括 为什么选该题 设计问卷的思路 样本选择思路 调查时间及分工 调查和分析中的收获 感受 遇到的困难 有什么不足或需要改进的等 格式要求A4大小纸张 宋体 四部分总标题用三号字 一级标题用小三号字 二级标题用四号字 正文用小四号字 标题加粗 页边距上下左右各2 5 行距1 2倍 第二节统计数据的图表描述 统计整理过程统计分组频数分布 图 表 一 统计整理过程 系统化 条理化 1 调查数据的审核 排序和筛选 预处理 2 科学的分组3 对各项目进行汇总和必要的计算4 编制统计图表 表现统计整理的结果 数据的审核 直接来源数据 全面性和准确性间接来源数据 适应性和时效性数据的准确性是统计的生命计算检查和逻辑检查异常数据的处理 记录错误 正确值 异常值 目标自上而下 层层加码 统计数据自下而上 层层加水 原国家统计局局长李德水披露一组令人吃惊的数字 2004年各省区市上报的全年GDP汇总数据 与国家统计局公布的GDP增速相比 高出3 9个百分点 总量差距高达26582亿元 李德水委员7日在政协经济界联组讨论会上坦承 在中国目前的分级核算体制下 数据出现一定差距不可避免 但差距这么大 确实不正常 数据的排序和筛选 升序 降序数据 排序筛选符合特定条件的数据筛选不符合特定条件的数据数据 筛选 自动 高级筛选 二 统计分组 根据统计研究的目的 按照某个或某几个标志将总体划分为若干性质不同的组成部分的统计方法 1 划分社会经济现象的类型2 研究现象内部的结构3 发现现象之间的依存关系 作用 没有加以结算 总结分组和复合的资料 这个汇编只有几乎等于零的一点微不足道的科学价值 列宁 谈谈关于地方自治局统计任务的问题 1914年1月 列宁全集 第一版第20卷第74页 统计名言 统计分组标志的选择及统计分组的种类 1 分组标志的选择 以反映现象本质特征的标志作为分组标志选取最有实际意义的分组标志考虑现象的历史条件变化 如果根据土地面积来判断农户规模 结论是随着农户规模的扩大 农业的集约程度在下降 如果根据农户产值来判断农户规模 结论是随着农户规模的扩大 农业的集约程度在提高 对于这个特别重要的方面 现时的经济学家和统计学家注意得最不够 列宁 关于农业中资本主义发展规律的新材料 1915年 列宁全集 第1版 第22卷 第57 60页 统计名言 2 统计分组的种类 简单分组及平行分组体系 性别 男教师 女教师学历 本科 硕士 博士职称 助教 讲师 副教授 教授 简单分组 用一个标志分组 平行分组体系 用两个或两个以上标志进行简单分组后平行排列而成的体系 复合分组及复合分组体系 男教师 助教 讲师 副教授 教授女教师 助教 讲师 副教授 教授 复合分组 对同一总体运用两个或以上标志重叠起来分组 复合分组体系 由复合分组形成的体系 统计分组的程序与原则 选择分组标志 总体单位归类 确定分组体系 科学性 组间差异大 组内差异小 穷尽性和互斥性 每个单位均能且只能归到某个组中 对大学生月生活费支出情况进行分组研究 按家庭收入水平分组 按城乡分组 按性别分组 按年龄分组 常用的国民经济统计分类 经济类型分类 国有经济集体经济私营经济个体经济联营经济股份制经济外商投资经济港 澳 台投资经济其他经济 国民经济行业分类 16个门类99个大类999个中类近万个小类三次产业分类 农业工业和建筑业流通部门和服务部门 三 频数分布 频 次 数分布的概念 结构和种类频数分布数列的编制数据的图形显示常见频数分布的类型 一 频 次 数分布 概念 结构和种类 在统计分组的基础上 将总体分组后形成的总体单位数在各组间的分布 分组标志各组名称各组单位数 绝对数 相对数 结构 例1 历次普查总人口性别构成 频数分布的种类 品质分布数列 按品质标志分组形成的次数分布数列变量分布数列 按数量标志分组形成的次数分布数列单项式分布数列 每个变量值是一个组 按变量值大小顺序排列 组距式分布数列 每个组由一个变量值的区间表示等距数列异距数列 二 频数分布数列的编制 1 品质分布数列的编制品质数列一般较稳定 通常有多少类就分成多少组 分组类型可参考有关的分类标准 例 高校教师按职称分组的品质分布数列 2 变量数列的编制 单项数列的编制 1 将一个变量值作为一组2 适合情况 1 离散变量2 变量值较少 变量值变动幅度不大 例3 频数分布表的编制 实例 例3 某生产车间50名工人日加工零件数如下 单位 个 试采用单项数列对数据进行分组 117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121 单项数列分组表 实例 组距数列的编制 1 将变量值的一个区间作为一组2 适合情况 3 必须遵循 不重不漏 的原则4 可采用等距分组 也可采用不等距分组 1 连续变量2 变量值较多 变量值变动幅度大的离散变量 有关概念 上限 下限 组距 全距 上限 每组的最大值下限 每组的最小值 组距 每个组上限和下限之间的距离全距 全部变量的最大值和最小值的距离 组数的确定 斯特吉思公式 组数 1 3 22lgN 有关概念 组中值 1 闭口组组中值的计算 上限 下限2 2 缺下限的开口组组中值 上限 邻组组距的一半 3 缺上限的开口组组中值 下限 邻组组距的一半 组中值 各组变量值范围的中间数值 假设 开口组组距 邻组组距 例 变量数列的末组为开口组 邻组组距为40 组中值为80 则末组的组中值为多少 下限为多少 例 某连续变量数列 其末组为500以上 又知邻近组的组中值为460 则末组的组中值为多少 几个注意问题 1 何时用等距分组 何时用异距分组 总体中变量值分布较均衡 应用等距分组 若变量值分布不均衡 且变动范围大 则用异距分组 2 何时用开口组 何时用闭口组 若变量值中存在极端值 对最大组和最小组用开口组 3 组限如何确定 最小组下限 最小值最大组上限 最大值 4 划分离散变量的组限时 相邻组限可以间断也可以重叠 对连续型变量而言 相邻组的组限必须重叠 5 统计频数时 遵循 上限不在内 原则 编制步骤 1 将原始资料按大小顺序排列 分析资料的特点 2 确定组数和组距 组数 全距 组距 等组距 尽可能区分组与组之间性质上的差异反映出总体单位的分布情况 3 确定组限 最小组下限略低于最小变量值 最大组上限略高于最大变量值有极小值或极大值时要用开口组连续型变量划分组限时 相邻组限必须重合统计各组总体单位时 遵循 上限不在本组内 的原则 4 计算次数 频率或次数密度 编制次数分布表 绘制次数分布图 频数分布表 累计频数分布表频数分布图 直方图和折线图 累计次数分布图频数分布类型 钟形分布 U形分布 J形分布 单项数列分组表 实例 等距分组表 上下组限重叠 等距分组表 上下组限间断 等距分组表 使用开口组 累计频数分布表 累计频数 频率 向上累计 向下累计 从变量值低的组开始 将各组次数 频率 逐次向变量值高的组累计 说明某一组上限以下各组的累计次数 频率 从变量值高的组开始 将各组次数 频率 逐次向变量值低的组累计 说明某一组下限以上各组的累计次数 频率 向上累计 向下累计 例4 等距数列的频数分布 练习 某单位30名职工的月工资额资料如下 单位 元 106 84 110 91 109 91 111 107 99 94 119 87 118 97 103 106 85 106 101 105 96 105 107 121 105 95 106 128 111 101 累计频数分布表 异距数列的频率分布表 在不等距的情况下 各组的分布不仅受变量值大小的影响 还受各组组距大小的影响 因此 有必要先消除不等组距的影响 计算各组的频数密度或标准组距人数 从而客观准确地反映次数分布的特征 1 频数密度 2 标准组距人数 频数密度 标准组距 例5 异距数列的频数分布 某地区20名居民月工资额资料如下 单位 元 500 480 580 670 400 900 760 1000 1400 2500 850 4000 1800 400 470 460 500 410 490 700 400 400 410 460 470 480 490 500 500 580 670 700 760 850 900 1000 1400 1800 2500 4000 排序 异距数列的频数分布表 三 统计数据的图形显示 直方图 折线图 饼形图 条形图 柱形图 散点图 茎叶图 直方图 直方图的制作 1 用矩形的宽度和高度来表示频数分布的图形 实际上是用矩形的面积来表示各组的频数分布2 在直角坐标中 用横轴表示数据分组 纵轴表示频数或频率 各组与相应的频数就形成了一个矩形 即直方图 Histogram 直方图 直方图的绘制 频数 人 15 12 9 6 3 日加工零件数 个 我一眼就看出来了 大多数人的日加工零件数在120 125之间 折线图 折线图的制作 1 折线图也称频数多边形图 Frequencypolygon 2 是在直方图的基础上 把直方图顶部的中点 组中值 用直线连接起来 再把原来的直方图抹掉3 折线图的两个终点要与横轴相交 具体的做法是在直方图的左右两端各自延伸一个假想组 并将折线两端连接假想组中点而形成的图形折线图下所围成的面积与直方图的面积相等 二者所表示的频数分布是一致的 15 12 9 6 3 105 110 115 120 125 130 135 140 日加工零件数 个 频数 人 折线图下的面积与直方图的面积相等 折线图 折线图的绘制 图 某车间工人日加工零件数的折线图 茎叶图 茎叶图的制作 1 用于显示未分组的原始数据的分布2 由 茎 和 叶 两部分构成 其图形是由数字组成的3 以该组数据的高位数值作树茎 低位数字作树叶4 茎叶图类似于横置的直方图 但又有区别直方图可大体上看出一组数据的分布状况 但没有给出具体的数值茎叶图既能给出数据的分布状况 又能给出每一个原始数值 保留了原始数据的信息 树茎 树叶 788 022347778889 0012222333344466777889 0133445799 数据个数 茎叶图 茎叶图的制作 图 某车间工人日加工零件数的茎叶图 条形图 条形图的制作 1 条形图是用宽度相同的条形的高度或长短来表示数据变动的图形2 条形图的高度表示各类别数据的频数或频率3 绘制时 各类别可以放在纵轴 称为条形图 也可以放在横轴 称为柱形图 条形图 条形图的绘制 圆形图 圆形图的制作 1 也称饼图 是用圆形及园内扇形的面积来表示数值大小的图形2 主要用于表示总体中各组成部分所占的比例 对于研究结构性问题十分有用3 在绘制圆形图时 总体中各部分所占的百分比用园内的各个扇形面积表示 这些扇形的中心角度 是按各部分百分比占3600的相应比例确定的4 例如 关注服务广告的人数占总人数的百分比为25 5 那么其扇形的中心角度就应为3600 25 5 91 80 其余类推 圆形图 圆形图的绘制 环形图 环形图的制作 1 环形图中间有一个 空洞 总体中的每一部分数据用环中的一段表示2 环形图与圆形图类似 但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列 每一个总体的数据系列为一个环3 环形图可用于进行比较研究 环形图 环形图的绘制 四 常见频数分布的类型 第四节统计表 统计表的意义统计表的种类统计表的结构和内容统计表的设计 一 统计表的意义 1 概念 纵横交叉的线条所绘制的表格 是表现统计资料的最常用的形式2 作用 1 在统计中运用广泛 2 能使资料条理化 系统化 标准化 3 一目了然 便于阅读和对比 二 统计表的种类 1 用途 调查表整理表分析表2 分组 简单表简单分组表复合分组表3 性质
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年河北邯郸市肥乡区公开选聘农村党务(村务)工作者100名模拟试卷附答案详解
- 北京市中医院肝内胆管结石手术处理考核
- 北京市中医院慢性腹泻病因诊断思路考核试题
- 2025年河北雄安新区雄县卫健系统公开招聘专业技术人员71名模拟试卷附答案详解(典型题)
- 唐山市人民医院内分泌高血压病因筛查考核
- 秦皇岛市人民医院药物生产质量管理考核
- 大学课件兼职
- 2025年4月重庆市妇幼保健院部分岗位招聘考前自测高频考点模拟试题及完整答案详解
- 衡水市中医院小儿推拿技术专项技能考核
- 张家口市人民医院后勤人力资源调配与绩效考核方案
- 血源性传播疾病暴露后处理
- 2024年湖北省科学技术馆度招聘真题
- 《习作:缩写故事》教学课件
- DB44∕T 2418-2023 公路路堤软基处理技术标准
- 钻芯法检测混凝土强度技术规程JGJ-T384-2024
- 人货场的培训课件
- 图书馆寻宝活动方案
- 2025年广西专业技术人员继续教育公需科目(三)答案
- 护理低温烫伤课件
- 2025至2030LED电源行业产业运行态势及投资规划深度研究报告
- 搅拌站泵车管理制度
评论
0/150
提交评论