




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Chapter1MeasureofCentraltendencyandDispersion 数据特征的描述 中国最庞大的资料库下载 数据特征的描述过程 数据收集整理显示描述 中国最庞大的资料库下载 第一节 统计数据的搜集 两种数据来源 原始数据次级数据两种数据形式横截面数据时间数列数据 中国最庞大的资料库下载 统计资料可利用组织 国际劳工组织统计局 劳动力 就业 工资 社会保险 工会等联合国教科文组织 教育 科学 文化 技术等联合国棉农组织 卫生组织 国际货币基金会 世界银行等 中国最庞大的资料库下载 一 基本内容 调查目的调查对象调查内容调查方法调查结果满足调查目的 中国最庞大的资料库下载 二 调查方法 中国最庞大的资料库下载 三 调查对象 一 全面调查不重复 不遗漏二 非全面调查代表性 选择偏性引例 1936年罗斯福与兰登的总统竞选 文学摘要 罗斯福 43 兰登 57 1千万实际结果 罗斯福 62 兰登 38 盖洛普 罗斯福 56 5万人泛法航空 中国最庞大的资料库下载 四 调查内容 问卷设计 一 问卷结构 说明词 填写要求 问卷正文及结尾说明词 主办单位及调查员身份 调查的目的和意义 承诺及感谢问卷正文 需要调查的问题及答案 被调查者的背景资料结尾 说明 中国最庞大的资料库下载 二 问卷的措辞 清楚定义内容 5w 您使用什么品牌的化妆品 用词通俗 词义明确 您经常收看电视节目吗 1 从来不看 2 偶尔看 3 有时看 4 经常看 5 天天看 避免隐含的选择 乘车 牛仔裤 避免否定形式的提问避免诱导性或倾向性的词汇 避免重叠 答案详尽 中国最庞大的资料库下载 三 问题的顺序 1 先易后难2 封闭型问题置前 敏感性 开放性问题置后3 注意对后继问题的影响 1 您在选择购物时 哪些因素是重要的 2 您在选择购物时 售后服务这个因素的重要性如何 4 逻辑思路保持一致 中国最庞大的资料库下载 第二节 数据的整理 审核分组 品质数据 数量数据 计算频数与频率数据的表现 中国最庞大的资料库下载 一 数据资料的可用性 方法错误引 时间 空间 口径等逻辑错误引 产值与销售值 年龄与工作年限主观错误敏感性 政治性等引 失业率与平均每周申请失业保险人数 中国最庞大的资料库下载 二 数据的分组与频率的计算 一 品质数据的分组与计算频数 每组数据值出现的次数表2 5购买50台计算机的样本数据 中国最庞大的资料库下载 表2 6购买计算机数据的频数分布表 中国最庞大的资料库下载 二 数量数据的整理 数量数据频数分布的分组需要3个步骤 1 确定组数 2 确定组距 3 确定组限 引例 表 年终审计时间 天 中国最庞大的资料库下载 1 确定分组数目本例组数 5 3我们确定分5个组 2 确定组距近似的组距 本例组距 取整数5天 中国最庞大的资料库下载 4 计算频数与频率 中国最庞大的资料库下载 表2 10审计时间数据的相对频数和百分比频数分布 中国最庞大的资料库下载 表2 11审计时间数据的累积频数分布 中国最庞大的资料库下载 在数量数据整理中要注意的问题有 1 在一些应用中 我们需要知道各分组的中点 也就是组中值 2 开口组 即只有上限或只有下限的组 其组中值用邻组的组距计算 3 在数据较少的情况下 可用品质数据整理的方式 采取单变量值分组 4 连续变量与离散变量的组限问题上组限不在内5 等距与不等距分组 中国最庞大的资料库下载 三 数据的表现 中国最庞大的资料库下载 1 直方图是用图形说明数量数据的另一种常用方法 图2 8审计时间数据直方图 一 统计图 中国最庞大的资料库下载 2 条形图是用图的方式描述已概括成频数 相对频数或百分比频数分布的品质数据的图形 中国最庞大的资料库下载 3 饼图是用圆的各部分面积来呈现品质数据的常用方法 本例中所有各组计算机购买的百分比频数总和为100 一个圆有360 则饼图中苹果机的部分为26 360 93 6 其他组的部分以此类推算出 中国最庞大的资料库下载 4 统计折线图与曲线图 洛伦茨曲线生命曲线投机需求曲线质量曲线5 象形图 中国最庞大的资料库下载 洛伦茨曲线 中国最庞大的资料库下载 累计收入的 累计家庭的 中国最庞大的资料库下载 1975 1985 1995 100 101 Salesup SalesofChicagoCarpetWorldsince1975 中国最庞大的资料库下载 二 统计表 中国最庞大的资料库下载 中国最庞大的资料库下载 第三节 数据特征的描述 绝对数与相对数集中趋势 众数 中位数 平均数离散趋势 全距方差 标准差方差系数 标准差系数 中国最庞大的资料库下载 一 绝对数与相对数 一 绝对数反映社会现象整体规模和水平时期数时点数 二 相对数结构 比较 计划等 中国最庞大的资料库下载 三 绝对数与相对数的应用 1 指标内涵和可比性 GNP 工业增加值2 指标的结合运用引例 在美国 1985年有19893人遭谋杀 与1970年16848人遭到谋杀相比 增加了20 这些数字揭示了在1970 1985年期间美国变成一个更多暴力的社会中国的国民生产总值增长了8 美国的为1 中国最庞大的资料库下载 二 数据集中趋势的描述 一 众数Mode众数是总体数据中出现次数最多的变量值 例3 1 有10名大学生的年龄 18 18 19 19 19 19 19 20 20 21 在这里19岁的人数最多 所以19岁是众数 例3 2 有10名职工的年龄 20 21 22 23 24 25 26 27 28 29 由于各年龄的人数相同 没有明显集中趋势点的数值 所以这里没有众数 中国最庞大的资料库下载 注意 1 是位置平均数 不受极端值的影响2 假定各单位在组内是均匀分布的3 信息量小 缺乏敏感性 不适合代数运算4 用于非对称的次数数列 特别是品质标志数列5 用于数列中有较多的数值向某一数值集中6 有时会存在多个众数 中国最庞大的资料库下载 二 中位数Medium 中位数就是把计算对象的数据按大小顺序排列后 处于中间位置上的变量值 中国最庞大的资料库下载 注意 1 是位置平均数 不受极端值的影响2 假定各单位在组内是均匀分布的3 信息量小 缺乏敏感性 不适合代数运算4 用于非对称的次数数列引 个人收入 年龄 中国最庞大的资料库下载 一 定义 均值就是分布中全部数据的算术平均值 二 确定1 对未经整理的原始数据 表示均值 则 三 均值Mean 中国最庞大的资料库下载 2 对分组数据 中国最庞大的资料库下载 例 中国最庞大的资料库下载 中国最庞大的资料库下载 中国最庞大的资料库下载 对平均数的理解 1 某房间有10人平均身高1 6米 第11人走进 其身高1 9米 求11人的平均身高 若房间里20个人身高平均1 6米则第21人走进 21人的身高又会如何 2 一教师出3个问题 每题1分班级中30 得3分 50 得2分 10 得1分 10 得0分 全班有10个人 全班有20人 3 经济衰退时 工人的平均工资高 平均失业期短 经济繁荣时 平均工资低 平均失业期长 这会是真实吗 中国最庞大的资料库下载 注意 平均数的大小受变量值和权重两个因素的影响平均数收极端值的影响权重的选择要注意其经济意义正确理解各平均数指标 中国最庞大的资料库下载 二 众数 中位数和均值的特点和应用场合 中国最庞大的资料库下载 第四节数据分布离散程度的测度 中国最庞大的资料库下载 离散程度是评价数据一般水平代表性大小的依据 并可以反映数据分布的均衡程度 一 全距 Range 与四分位距 全距也称极差 是用分布数据中的最大值减去最小值的差 表示为四分位距 将所有数据分为4份 每部分之间的分界点为四分位数据 中国最庞大的资料库下载 1 简单标准差 二 标准差与方差 中国最庞大的资料库下载 例3 13 某百货公司有6家分店 经理要求掌握这6家分店的年净收入差异水平 其标准差计算如下 平均年净收入 中国最庞大的资料库下载 中国最庞大的资料库下载 2 加权的标准差 中国最庞大的资料库下载 三 对标准差的理解 1 相同的数列 用原始数据计算和用分组数据计算 标准差有和不同2 10个数的数列 若只包括1 9且标准差最大 这10个数是什么中国最庞大的资料库下载 中国最庞大的资料库下载 1 是非变量的标准差在统计研究中 经常遇到这样一种情况 即统计对象总体只有两种表现的可能 这类总体的现象表现就是是非变量 一般我们将其中一种表现的变量值表示为1 另一种表现的变量值表示为零 如果我们用P表示变量值1在总体中出现的频率 用Q表示变量值零在总体中出现的频率 则有 四 其他形式的标准差 中国最庞大的资料库下载 是非变量的均值 中国最庞大的资料库下载 是非变量的方差 中国最庞大的资料库下载 2 总体方差与组方差 例3 16某厂某班组12名工人日产量件数如下 9 11 14 15 16 19 20 21 21 22 23 28 对上述12名工人求日产量的均值及总方差得 件 中国最庞大的资料库下载 中国最庞大的资料库下载 如果对上述12名工人按工人的技术等级分为两组 第一组工人的日产量分别为9 11 14 15 16这5个变量值 则其组内均值 组方差 中国最庞大的资料库下载 第一组的方差 中国最庞大的资料库下载 同理 第二组2人日产量分组有19 20 21 21 22 23 28七个变量值 则其组内均值和组内方差为 第二组的方差 中国最庞大的资料库下载 中国最庞大的资料库下载 中国最庞大的资料库下载 组内方差的均值与组间方差之和等于总方差 在本例中各组内方差的均值为 则各类方差之间的关系为 26 92 7 17 19 75 中国最庞大的资料库下载 Coefficientofvariation 主要是标差系数或 五 离散系数 中国最庞大的资料库下载 例3 17有两个不同的生产小组 甲组是生产配件 乙组是整机装配 现在要比较这两个生产小组在一周内平均日产量的均衡程度 中国最庞大的资料库下载 中国最庞大的资料库下载 设标准化分位值为Z 则有 或 六 标准值 中国最庞大的资料库下载 例3 16 某班的统计学考试成绩平均分数为80分 标准差为6分 某同学考试成绩86分 则该同学统计学的分数相对于平均分数的标准化分位值是 如果该同学在英语考试中的成绩是120分 全班的平均分数是100分 标准差是20分 则该同学英语的分数相对于平均分数的标准化分位值是 在这里英语的120分与统计的86分是等值的 都是高于平均分一个标准差 中国最庞大的资料库下载 引例 加里福尼亚大学的研究生部就男女生入学情况做了调查研究 在研究期间 6个专业共有2691名男生和1835名女生报考研究生 录取了1197名男生 557名女生 中国最庞大的资料库下载 加大学6个专业的资
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教师招聘之《幼儿教师招聘》押题练习试卷附参考答案详解(达标题)
- 2025呼伦贝尔莫力达瓦达斡尔族自治旗尼尔基第一中学校园引才笔试备考及完整答案详解
- 2025广东广州银行人才招聘考试备考题库及答案解析
- 2025年汽车轻量化材料在汽车轻量化车身制造中的产业布局与市场前景研究报告
- 棚户区改造项目房屋产权分割及购房合同模板-@-3
- 2025年乳腺病学乳房超声影像解读练习答案及解析
- 南阳党建面试题库及答案
- 教师招聘之《小学教师招聘》综合提升试卷及参考答案详解【模拟题】
- 2025年教师招聘之《小学教师招聘》试卷含完整答案详解【夺冠系列】
- 教师招聘之《小学教师招聘》综合检测题型汇编附答案详解(a卷)
- (康德卷) 重庆市2026届高三9月开学考联考英语试卷(含答案解析)
- 2025江苏省旅游发展研究中心自主招聘4人考试参考试题及答案解析
- 小学一二三年级劳动与技术《整理书包》课件
- DB225118-2022建筑工程资料管理标准
- 小学语文口语交际教学讲座PPT
- 上海建筑装饰集团发展战略报告(doc 30)
- 《基础统计》教学案例“郑州市大瓶装纯水市场调查”统计应用案例
- DB36_T 1157-2019 瓷土、瓷石矿产地质勘查规范(高清无水印-可复制)
- 《大型企业财务数智化转型白皮书》
- 电子课件-《网络营销(第三版)》-A24-2998ppt课件
- 南瑞继保后台监控使用厂家培训版本
评论
0/150
提交评论