




已阅读5页,还剩116页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据收集 数据整理 数据分析 数据解释 通过第一章的学习我们知道 统计的主要过程包括 第二章统计数据的收集与整理 引导案例 人民网2月9日电 高中取消文理分科的必要性和可行性 作为教育部公开向社会征求意见的 国家中长期教育改革和发展规划纲要 20大问题之一 在意见征集首日便在网民 教育界人士间引发热火朝天的争论 人民网于2月9日推出调查 取消高中文理分科有益于人才培养吗 截至2月9日19点整 共有44928名网友参与了调查 其中选项 有弊 白白增加学生负担 得到的票数为22536票 占整个网友投票的50 2 选项 有益 能够适应更多专业需求 得到的票数为20900票 占整个网友投票的46 5 有1 8 的网友表示 不清楚 似乎都有道理 这个选项得到的票数为792票 从网友的投票数量可以看出 赞成和反对高中文理分科的网友几乎旗鼓相当 反对的声音稍占上风 本章内容 统计数据的计量与类型 统计数据的来源与收集 第一节 第二节 调查问卷的设计 第三节 统计数据的整理 第四节 统计数据的误差与误差控制 第五节 统计数据的显示 第六节 第二章内容结构图 第一节统计数据计量与类型 第二节统计数据的来源与收集 第三节调查问卷的设计 第四节统计数据的误差与误差控制 第六节统计数据的显示 第五节统计数据的整理 第一节统计数据的计量与类型 1 数据的计量尺度定类尺度定序尺度定距尺度定比尺度思考 如下数据的计量尺度分别属于哪一种 性别年级学习成绩身高 一 分类数据 顺序数据 数值型数据 定类尺度 Nominalscale 是依据客观事物的某种属性对其进行平行的分类或分组它是最粗略 计量层次最低的计量尺度定类尺度只是测度了事物之间的类别差 各类别之间是平等的并列关系 无法区分优劣或大小 各类之间的顺序是可以改变的例如 性别 民族 所有制类型 定序尺度 Ordinalscale 又称顺序尺度 它是对事物之间等级差或顺序差别的一种测度该尺度不仅可以将事物分成不同的类别 而且还可以确定这些类别的优劣或顺序定序尺度的计量结果虽然也表现为类别 但这些类别之间是可以比较顺序的例如 产品等级就是对产品质量好坏的一种次序测度很显然 定序尺度对事物的计量要比定类尺度精确一些 定距尺度 Intervalscale 也称间隔尺度 是对现象类别或次序之间间距的计量定距尺度是比定序尺度高一层次的计量尺度 它不仅能将现象区分为不同类型并进行排序 而且可以准确地指出类别之间的差距例如 学生某门课程的考试成绩用 百分制 测量定距尺度的计量结果表现为数值 可以准确地指出两个计数之间的差值 例如 学生的考试成绩从0分到100分进行分类排序 得到从0分 50分 60分 70分 90分 直到100分的序列序列中不仅有明确的高低之分 而且可以计算差距 如 50分与60分之间相差10分 70分与90分之间相差20分 等等 天气预报 沈阳 最高温度3 最低 7 大连 最高温度6 最低 2 两地最高温度相差3 沈阳最低温度较大连最低温度低5 大连最高温度是沈阳最高温度的2倍 温度 定距尺度的基本特征是 有确定的计量单位 这是定距尺度区别于定类尺度和定序尺度的基本特征由于定距尺度的计量结果表现为数值 所以定距变量的值可以用数字表示 是真正意义上的值 可以进行加 减运算 但不能进行乘或除的运算 因为在等级序列中没有固定的 有确定意义的 零 位 定比尺度 Ratioscale 也称比例尺度 它与定距尺度属于同一层次 是在定距尺度的基础上 确定可以作为比较的基数 可以测量不同变量 社会现象 之间的比例或比率关系其计量的结果也表示为数值 定比尺度除了具有上述三种计量尺度的全部特征外 还有自己的基本特征 在定比尺度中 0 表示 没有 或 不存在 例如 一个企业某种产品产量为 0 表示该企业没有生产这种产品 一个人的月收入为 0 元 则表明这个人当月没有收入定比尺度既能作加减也能作乘除运算 零高度 零重量 零体积 零面积 零人口 零产量 零资产 真正的零 一无所有 指出下列数据计量尺度的类型 籍贯职称民族宗教信仰托福成绩体重产品等级缺勤次数 分类数据是由定类尺度计量 只能归于某一类别的非数字型数据 如 人口的性别 男和女产品类别 食品 衣着 家电等等顺序数据是由定序尺度计量 只能归于某一顺序类别的非数字型数据 如 产品的质量等级 一等品 二等品等数值型数据是由定距尺度和定比尺度计量的数据 2 数据类型 P18 19 分类数据和顺序数据说明是事物的品质特征 定性数据 数值型数据是说明事务物的数量特征 定量数据 区分数据的类型是很重要的 因为对不同类型的数据将采取不同的统计方法处理和分析 例如 分类数据 通常计算各组的频数或频率 计算众数 标准差等顺序数据 除可以计算上述指标外 可以计算中位数 累计频数 率 等对于数值型数据 统计方法就更加灵活 二 观测数据和实验数据 观测数据 通过统计调查或观测而收集到的数据称为观测数据实验数据 通过在实验中控制实验对象而收集到的数据称为实验数据如有关社会经济数据均为医药疗效试验数据 生物成长的试验数据等均为 观测数据 实验数据 三 截面数据和时间序列数据 按照被描述对象与时间的关系 可将统计数据分为 截面数据 是指在同一时间不同空间收集的数据 它描述的是某一时期或时点上现象在不同地理区域 不同行业或部门的变化情况比如 2009年我国各地区的国内生产总值数据时间序列数据 是指在不同时间上收集的数据 即按时间顺序排了的数据 它所描述的是现象随时间而变化的情况比如 2000年至2009年国内生产总值数据 第二节统计数据的来源与收集 从统计数据本身的来源看 最初都是来源于直接的调查或实验从使用者角度看 统计数据来源于两种渠道 直接的调查和实验别人调查或实验的数据 一 统计数据的直接来源 统计数据的直接来源主要有两个渠道 调查与观察实验 统计调查方式 普查 抽样调查 统计报表 1 普查 普查是为特定研究目的而专门组织的一次性全面调查 如 人口普查农业普查经济普查 普查具有以下四个特点 普查属于一次性或周期性调查普查需要规定统一的标准时间对于时期资料 应规定资料所反映的是从何时起至何时止的资料对于时点资料 应明确规定统一的标准调查时点普查是专门组织的全面调查普查的适用领域有限 第五次全国人口普查的标准时间是11月1日零时 普查现场登记工作从11月1日开始到11月10日以前结束 调查员到过的几家遇到情况并作处理 A 11月2日在1号家 这一家11月1日中午生个小孩 调查员把小孩的材料填入普查表 B 11月3日在2号家 这一家11月2日一成员死亡 调查员把关于死亡的材料填入调查表 C 11月4日到3号家 11月2日新婚夫妇到户籍登记处登记自己的婚姻 统计员将调查表有关项目填为已婚 该调查员的处理登记处理方法正确吗 2 抽样调查 抽样调查是从认识对象中抽取一部分单位作为样本进行调查 并根据调查结果来推断总体数量特征的一种数据收集方法抽样调查有以下特点 经济性好实用性强适应面广准确性高 利用随机数表进行随机抽样 Excel函数 RANDBETWEEN Bottom Top RAND 3 统计报表 统计报表是按国家有关法律的规定 自上而下地统一布置 自下而上地逐级提供基本统计数据的调查方式 除了以上三种主要调查方式外 实际工作中还常用到以下两种调查方式 重点调查 从全部调查对象中选择少数重点单位进行调查典型调查 typicalinvestigation 从全部调查对象中选择选择一个或少数有代表性的单位进行全面深入地调查重点调查和典型调查都不能推算总体 重点单位是从现象数量方面进行考虑的 即这些单位在全部总体单位数中比重很小 但是就调查的主要标志值来说 在总体标志总量中占有很大比重例如 要了解全国原油生产的基本情况 只要调查占全国原油产量比重很大的大庆油田 胜利油田等即可例如 要了解全国钢铁生产的基本情况 只要调查少数几个重点钢铁企业如鞍钢 宝钢 武钢 首钢等进行调查 重点单位是动态变化的重点单位在某问题上是重点 在另一问题上不一定是重点在某一调查中是重点在另一次调查中不一定是重点某时期时重点 另一时期不一定是重点 总结抽样调查 重点调查和典型调查的异同 相同点 都是非全面调查抽取单位的方法不同 抽样调查是随机抽样重点调查是选择重点单位典型调查是选择典型单位 实际调查中 应根据需要结合应用各种调查方式 二 统计数据的间接来源 各种统计年鉴中国统计年鉴 国际统计年鉴 地方统计年鉴 中国金融年鉴 中国统计摘要 报纸杂志 中国经济数据分析 经济预测分析 等 网络中国统计信息网 国研网 中国经济信息网 中国经济时报网等 三 统计数据的收集方法 数据收集方法 四 调查方案的设计 调查目的调查对象和调查单位调查项目和调查表 其它内容调查时间 调查资料所属时间例如 年第六次全国人口普查的标准时点是 年 月 日零时调查工作所需时间例如第六次全国人口普查规定2010年11月1日零时进行 11月10日结束 调查工作所需时间为10日 指出下列调查的调查对象及单位 1 商店网点调查 2 城市职工家庭生活调查 3 食品部门零售物价调查 4 住宅调查 5 机械工业设备调查 6 科技人员调查 7 科研机构调查 8 自行车质量调查 9 农产品成本调查 10 扩大企业自主权试点调查 11 基本建设大 中型企业投资效果调查 12 港口货运情况调查 调查目的 确定调查对象 设计调查表 其他内容 第三节调查问卷设计 采用调查问卷的形式收集数据资料 是统计调查的一种重要手段一份高质量的问卷 既要满足调查目的需要 又要照顾到调查者和调查者对象的接受能力和感受等 一 调查问卷的概念和分类 调查问卷 是把所要调查的内容以问题及其可能的答案按照一定的形式顺序排列所形成的调查表问卷可分为 自填问卷访问问卷 二 问卷的基本结构 一个完整的调查问卷通常由以下三个部分构成 引言填写说明问题与答案 三 问题与答案的设计 1 问题的形式问题主要有两种提问形式 选择型单项选择型 多项选择型 限制选择型问答型 三 问题与答案的设计 2 问题的表述问题表述设计的基本原则 问题表述准确 简洁问题回答的可行性一项提问只包含一项内容 避免否定形式的提问和诱导性提问 三 问题与答案的设计 3 问题的排序问题的安排应具有逻辑性问题的顺序先易后难把开放型问题放在问卷的最后 三 问题与答案的设计 4 问题答案的设计问题答案的设计要做到穷尽性和互斥性穷尽性 所列答案应包含所有可能的回答互斥性 答案之间不能相互重叠或相互兼容另外 答案的表述应当简明易懂 标准规范 第四节统计数据的误差与误差控制 一 统计数据的质量要求 就一般的统计数据而言 质量标准可概括为以下六个方面 精度准确性关联性时效性一致性经济性 二 数据误差的分类 根据来源的不同 可将误差分为 登记性误差 在调查过程中由于调查者和被调查者的人为因素所造成的误差代表性误差 在抽样调查中用样本数据推断总体数据时产生的随机误差登记性误差是可以消除的 代表性误差不可以消除 试判断 全面调查中只存在登记性误差 抽样调查中既存在登记性误差 也存在着代表性误差 那么抽样调查的误差一定比全面调查的误差大 T F 第五节统计数据的整理 统计调查所搜集的原始资料是比较分散凌乱的 无法看出或显示现象总体的本质特征 如欲研究某社区居民消费品的支出情况 根据抽样调查 的该社区100户居民购买消费品支出金额 元 原始数据的资料如下 234 159 187 155 172 183 182 177 163 158 195 202 213 203 165 196 172 176 182 188 原始数据杂乱无章 无法看出规律性 如果对原始数据进行分组 如分为140 150 150 160 220 230 230 240通过对总体各单位分组 显示了各单位标志值在各组的分布状况 从而使杂论无章的原始数据显示出一定的规律性 如本例中分组后可以看出 月消费额在160 200元之间占全部户数的66 67 而低支出和高支出居民户所占比重比较小 若再根据分组数据画出频数直方图 则可更直观地看出居民消费品支出额呈现出一种近似 两头小 中间大 的钟形分布的规律 一 统计数据的审核 数据的审核就是坚检查数据是否有错误 对于原始数据 应检查 完整性准确性二手数据 除了检查完整性和准确性外 还应考察 适用性时效性 二 统计数据的分组 1 统计分组的概念统计分组 就是根据统计研究的目的和要求以及总体的内在的差异 按照某一标志将现象总体区分为若干部分或不同的类型组 统计分组有两方面含义 对总体而言 是 分 即将总体区分为性质相异的不同部分对个体而言 是 组 即将性质相同或相近的个体组合起来 构成一个组分组突出了组间差异 而掩盖了组内差异 分组前 分组后 25 33 42 注意几点 分组的关键在于选择分组标志必须根据统计研究的目的 选择分组标志选择能够反映现象本质或主要特征的标志根据现象所处的具体历史条件及经济条件来选择分组标志 以工业生产为例 当研究的目的是分析企业规模即大中小企业的生产情况时 我们应该选择产品数量或生产能力作为分组标志当研究的目的在于确定工业内部比例及平衡关系时 我们要按部门划分 将企业分为 重工业 轻工业冶金 电力 化工 机械 轻工 组内差异尽可能小 组间差异尽可能大 正确划分组限分组不能过大或过小必须穷尽必须互斥 划分性质不同的各种类型 研究其特征和规律性 某地近几年农业总产值情况单位 亿元 2 统计分组的作用 分析总体中各个组成部份的构成情况 我国国内生产总值构成情况 分析现象之间的依存关系 二 统计数据的分组 3 统计分组的方法按照分组标志的性质不同 统计分组的方法可以分为 品质标志分组比如人口按职业 民族分组 工人按照技术等级分组等数量标志分组比如人口按收入 年龄分组 工人按照工龄分组等 数量标志分组有分为两种 单变量分组 就是把一个变量值作为一组所进行的分组组距式分组 就是把某一区间的变量值作为一组所进行的分组 什么分组类型 某班学生的性别构成情况 例如 某生产车间20名工人日加工零件数资料如下 117108110117110117130114110114128120110124108117124114120117 某车间20名工人日加工零件分组表 什么分组类型 某车间20名工人日加工零件分组表 下限 上限 组距 组距式分组 组距式分组的几个概念 组限 每组变动范围的界限值 即每组两端的数值称为组限上限 组限中较大的值称作该组的上组限 简称上限下限 组限中较小的值称作该组的下组限 简称下限组距 上下限之间的距离称为组距开口组 上下限缺一的组成为开口组闭合组 上下限齐全的组称为闭合组 某车间20名工人日加工零件分组表 某车间20名工人日加工零件分组表 开口组 开口组 思考 单项式分组和组距式分组的适用条件是什么 对于离散型变量 当变量取值较少时 应采用单项式分组 当当变量取值较多时 应采用组距式分组 对于连续型变量 应采用组距式分组 对于组距式分组根据组距是否相等 可分为等距分组 各组的组距相等不等距分组 各组的组距不全相等根据相邻组组限是否重叠 可分为 间断式分组 凡是组限不相连 以整数位断开的分组 称为间断组距式分组连续式分组 凡是组限相连 即相邻组上 下限重叠 称为连续式分组 某车间20名工人日加工零件分组表 等距分组 某车间20名工人日加工零件分组表 不等距分组 表某车间20名工人日加工零件分组表 间断式分组 某车间20名工人日加工零件分组表 连续式分组 思考 对于连续型分组标志 可以采用间断式分组吗 不可以 只能采用连续式分组 即相邻组限必须重叠当标志值恰好等于相邻两组上下限的数值时 怎么分组 遵循 上组限不在内 的原则 把此值归入作为下限的那一组 即任一组所包含的变量根据下式确定 对于离散型分组标志 一定采用间断式分组吗 不一定 可以采用间断式分组 也可以采取连续式分组 同样遵循 上组限不在内 的原则 4 组中值 组中值 上下限之间的中点数值经常需要确定一个能代表各组标志值一般水平的值 这个数值就是组中值在组距分组中 通常假定标志值均匀分布 则组中值为 开口组如何计算组中值 综合上述 组中值计算公式如下 某地区100个百货商店月销售额与流通费用情况 试计算各组组中值 2575150250350 三 变量数列的编制 1 分配数列的概念在统计分组的基础上 把总体的全部调查数据按组归类排列 就形成总体单位在各组之间的分布 称作频率分布或分配数列分配数列是由分组标志和各组相对应的分布频数两个要素构成的 将各组组别与各组次数依次排列而形成的数列叫次数分布数列 简称分配数列 某班学生的性别构成情况 三 变量数列的编制 2 分配数列的种类品质数列 分组标志为品质标志变量数列 分组标志为数量标志单项数列组距数列 获金牌项目金牌数占总数比例跳水 枚0 1786举重 枚0 1786乒乓球 枚0 1429羽毛球 枚0 1429体操 枚0 1071射击 枚0 1071柔道 枚0 0714田径 枚0 0357跆拳道 枚0 0357 品质数列 例 己知某车间有24名工人 他们的日产量 件 分别是 20 23 20 24 23 21 22 25 26 20 21 21 22 22 23 22 22 24 25 21 22 21 24 23 要求根据以上资料编制变量数列 编制结果如下 某班学生某学期统计学成绩 三 变量数列的编制 3 变量数列的编制步骤 1 将原始资料按照数值大小依次排列 2 确定变量的类型和分组方法 单项式分组或组距式分组 3 如果是组距式分组 确定组数 组距 确定组限第一组的下限要小于或等于最小变量值 最后一组的上限要大于最大变量值组限尽可能取整数 是10或5的倍数 4 汇总各组的单位数 计算频数和频率 P35 有时需要计算累计频数和累计频率 包括两种方法 向上累计 向下累计 某组向上累计频数 率 表示该组上限以下的单位数 比重 某组向下累计频数 率 表示该组下限以上的单位数 比重 生成频数分布表 例题分析 例 某电脑公司2008年前4个月各天的销售量数据 单位 台 生成一张频数分布表观察销售额分布的特征 使用Excel编制分配数列 使用FREQUENCY函数使用 工具 数据分析 直方图如何计算累计频数 频率 Excel的 直方图 工具的缺陷是 频数分布及直方图没有与数据链接 当改变任何一个数据时 频数分布表和直方图不会跟着改变使用统计函数 FREQUENCY 创建频数分布表和直方图可解决这一问题 具体步骤是选择与接受区域相临近的单元格区域 作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 口腔医生个人工作总结
- 急诊护士年终工作总结29篇
- 夫妻协议书(集合15篇)
- 店铺股份转让的协议书
- 年度房地产销售工作总结(15篇)
- 庆三八活动小结5篇
- 八年级物理上册 第6章 第3节 测量物质的密度说课稿 (新版)新人教版
- 2025年医疗健康行业信息化发展与医疗服务创新研究报告
- 2025年区块链行业区块链技术创新与数字资产管理研究报告
- 2025年能源行业可再生能源发展与能源供应安全研究报告
- 植物生理学植物的抗逆境生理
- 渔业资源与渔场学PPT完整全套教学课件
- 不同持股比例的“母、子、孙”结构的合并报表处理
- GB/T 1871.1-1995磷矿石和磷精矿中五氧化二磷含量的测定磷钼酸喹啉重量法和容量法
- 第五节 重力流输水管线设计计算
- 元数据教学讲解课件
- CCP与备货0403 (华为培训)课件
- 小学数学西南师大四年级上册二加减法的关系和加法运算律简便计算综合练习PPT
- ASCVD时代总体心血管风险评估工具的更新ppt参考课件
- GB 15579.3-2014 弧焊设备 第3部分:引弧和稳弧装置
- 世界经济史课件PPT
评论
0/150
提交评论