




已阅读5页,还剩177页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学原理 主讲人 龙飞 广东高等教育出版社 前言 统计学原理是会计专业必修课程之一 学习有一定难度 要求学习者要了解和掌握一些经济工作实践和数学功底 其原因一是用统计语言描述社会经济现象 使简单问题显得复杂化 另一点是概念多 余个 计算公式多 常用的有 余个 希望学习者不要产生畏难情绪 要掌握本门课程与其它课程不同的学习方法 教材分析 第一章 总论 主要探索和学习统计学的基本理论和范畴 包括统计的涵义 基本方法 数据的来源 计量尺度和基本概念 第二章 统计资料的搜集与整理 了解统计资料的搜集方法 调查方式方案 正确认识调查误差和数据的整理 需掌握和熟练运用统计分组 制作统计表 了解统计分布 第三章 统计数据的描述与显示 统计数据的描述要通过绝对指标 相对指标 集中趋势和离散程度来体现 最后再通过统计表和统计图来显示 第四章 抽样调查 抽样调查是很富有统计色彩的方法 通过抽样调查我们所知道的是 大概 的情况 而究竟是 大概到什么程度 就成为了我们这章要重点解决的问题 所以本章要掌握抽样误差和参数估计的应用 以保证抽样调查的科学性 第五章 相关分析与回归分析 前面几章都是对单一变量或单个事物进行数量刻画的方法 而统计方法还有一个重要目的就是要探讨事物的数量规律 事物之间存在着复杂的关系 而这些关系经常体现为数量表现上的相互影响关系 运用相关分析可以判断这种影响关系的强弱程度 而通过回归分析可以认识到是事物间是如何影响的 第六章 时间数列分析 任何现象总是处于不停歇的变化中 掌握事物随时间变化的规律性便是本章的要点 其中包括长期趋势 季节变动还有周期波动 第七章 统计指数法 通过综合指数和平均数指数两类计算原理来对指标的变动进行结构分析 还可以对一些具有数量关系的现象进行因素分析 判断每一种因素对总变动的影响程度 统计工作中两个环节 第四章抽样调查 第五章相关分析与回归分析 第二章统计资料的搜集与整理 第三章统计数据的描述与显示 第六章时间数列分析 第七章统计指数法 基本概念 统计分析的方法 总论 第一章 内容提要 统计是社会认识的有力武器之一 统计 一词有统计工作 统计资料和统计科学三种含义 本章阐述了统计研究对象的特点 数量性 总体性 具体性和社会性 统计的作用 统计学中的基本概念 总体 总体单位 标志 指标 变异 变量和变量值 统计研究的基本方法和统计工作的一般过程 统计设计 统计调查 统计整理和统计分析 统计工作的任务和组织 计数活动与统计学的产生 第一节 一 统计学的三个主要源头 英国的政治算术德国的国势学概率论与数理统计 第二节 统计的涵义和应用 一 统计的含义 统计的涵义包括三个方面的内容 即统计工作 统计资料和统计学 一 统计工作 调查研究 资料收集 整理和分析 二 统计资料 工作成果 包括统计数据和分析报告 三 统计学 研究如何搜集 整理 分析数据资料的一门方法论科学 工作与工作成果关系 统计工作统计资料统计学 实践与理论关系 统计职能 信息 咨询 监督 数量性 总体性 三 统计方法的应用 农村居民收入 一 搜集数据 对所研究对象的总体事实做出数量上的叙述说明 二 对获得的总体事实进行时间 空间和属性等的比较 三 搜索总体事实的内在数量规律性 统计的基本方法 第三节 一 统计的基本方法 一 大量观察法 普查 大量观察法就是对所要研究的事物的全部或足够多数的单位进行数量上的调查和分析 二 归纳推断法 人均粮食产量 归纳推断法包括归纳和推断两个方面 所谓 归纳 是指由个别到一般 由事实到概括的整理 描述方法 推断 指一定的逻辑标准 根据局部的 样本的数据来判断总体相应数量特征的归纳推理方法 常用指标 总量指标 平均指标 相对指标 相关分析法 因素影响分析法 动态趋势分析法 分析方法 二 统计数据的来源 一 专门组织的调查例如普查 重点调查 抽样调查等 二 政府职能机构的统计报表极少部分公开发布 三 公开的出版物和统计媒体 第四节 量度层次和计量尺度 一 定类尺度 量度层次最低 将工业企业按经济类型划分为国有经济 集体经济 股份制经济等 二 定序尺度 度量层次次低 将教育程度划分为大学 中学 小学 三 定距尺度 度量层次次高 例如考试成绩 80分与90分的差距等同于90分与100分的差距 四 定比尺度 度量层次最高 与定距尺度的区别是 确定了一个绝对的 有意义的零点 定距尺度中的 0 只代表0值 而定比尺度的 0 是绝对零点 代表没有 如产量 产值 体重 身高等 例将所研究对象按某种特征分成若干个部分 并给每一类别定名 所形成的度量尺度是 A 定类尺度B 定序尺度C 定距尺度D 定比尺度 统计学中的基本概念 第五节 分类 总体 概念 特点 统计研究所确定的客观对象 是具有共同性质的许多单位组成的整体 无限总体 含无限多个单位 有限总体 含有限个单位 同质性 总体中各个单位具有某种共同的性质 大量性 总体总是包含大量的单位 变异性 各单位属性和特征表现不尽相同 客观存在性 总体单位 简称单位 指构成统计总体的每一个体 统计总体和总体单位的关系 总体和单位的概念是相对而言的 随研究目的不同 总体范围不同而变化 同一研究对象 在一种情况下为总体 但在另一情况下又可能变成单位 例1调查某大学2000名学生学习情况 则总体单位是 A 2000名学生B 2000名学生的学习成绩C 每一名学生D 每一名学生的学习成绩 例2要了解某市国有工业企业生产设备情况 则统计总体是 该市国有的全部工业企业该市国有的每一个工业企业该市国有的某一台设备该市国有制工业企业的全部生产设备 例3 多选 当观察和研究某省国有工业企业的生产活动情况时 该省所有的国有工业企业为总体该省国有工业企业生产的全部产品为总体该省国有企业的全部资产为总体该省每一个国有工业企业为总体单位该省国有工业企业生产的每一件产品为总体单位 数量标志 表明总体单位特征的名称 如年龄 收入等 品质标志 表明总体单位属性的名称 如性别 民族等 分类 3 标志表现 标志特征在各单位的具体表现品质标志表现 只能用文字描述的标志表现 数量标志表现 具体的数值 又称为标志值 变量值 二 统计指标1 概念 统计总体综合数量特征的名称 例如我国2001年末移动电话用户数为14480万户 这就是在全国范围内统计调查的结果 我国2001年末移动电话用户数 为指标名称 14480万户 为指标 数 值 分类 2 分类 质量指标 也称平均指标 说明所研究特征的规模 水平的绝对量指标 如国内生产总值 人口总数 数量指标 也称相对指标 反映所研究总体某一方面相对水平 工作质量的相对量和平均量指标 如人口密度 平均亩产量等 例如某企业生产某种产品 9月份产品的合格率为90 废品量为135个 该企业的资金利润率为16 全年上缴税利额为10万元 该例中属于数量指标的是 废品量和上缴利税额 属于质量指标的是产品合格率 资金利润率 标志和指标的主要区别是 1 标志是说明总体单位特征的 而指标是说明总体数量特征的 2 指标都能用数值表示 而标志中的品质标志不能用数值表示 标志与指标的主要联系是 1 有些统计指标的数值是从总体单位的数量标志值汇总得到的 如一个县的粮食实际入库总产量是所属各乡村粮食实际入库量的汇总数 一个工业主管局的总产值是所属各企业总产值的总和等等 2 在一定的研究范围内指标和数量标志之间存在着变换关系 当研究目的改变 原来的总体如变为总体单位 则相应的统计指标就变为数量标志了 反之亦然 例如在研究某厂职工情况时 该厂的全部职工是总体 工资总额为指标 而在研究该厂所属的某工业局职工工资时 该厂就是总体单位 则该厂的工资总额为数量标志 具体的工资总额为标志值 三 变异 变量和变量值 一 变异 总体各单位在所研究的标志上其表现不尽相同 即差异性 或理解为 可变标志的标志表现由一种状态变到另一种状态 二 变量 统计的数量标志和指标 其取值成为变量值 统计资料的收集与整理 第二章 内容提要 占有一定的统计资料是统计研究的基础 获得高质量的统计资料的前提是统计设计 本章阐述了统计设计的中心内容 统计指标和统计指标体系的设计 统计设计一般原则 统计表及其设计 统计调查方案 统计调查方法和组织方式 各种方法的结合运用 根据统计研究任务要求 采用科学的调查方式和方法搜集资料 是保证统计质量的基本环节 目前 我国统计调查体系是以周期性普查为基础 以经常性抽样调查为主体 以必要的统计报表 重点调查 综合分析等为补充 搜集 整理基本统计资料 统计资料及其搜集方法 第一节 数量性 基本性质 总体性 客观性 二 统计资料的搜集 一 次级资料的搜集1 公开出版的资料 主要来自政府统计部门 行业协会等的统计调查 2 非公开出版的资料 由于保密原因或读者少而没有公布 如企业内部的经营管理资料 二 原始资料的搜集1 原始资料的获得不能在各种已有资料中取得 这时需要进行调查 而调查的内容分为两大类 调查内容 实验性 通过对一些具体事项的安排而获取不同条件下的统计数据 观察性 凭观测获得统计资料 访问调查 原始资料收集方法 电话调查 观测 邮寄问卷 互联网调查 调查方式与调查方案 第二节 一 统计调查的方式 一 普查1 概念 普查是专门组织的一次性全面调查 2 特点 工作量大 时间性强 需要大量人力和财力 搜集的资料全面系统 3 任务 主要是搜集重要的国情国力和资源状况的全面资料 为政府制定规划 方针政策提供依据 二 抽样调查1 概念 抽样调查也是一种非全面调查 是按照随机原则从总体中抽取部分调查单位进行观察用以推算总体数量特征的一种调查方式 显然 抽样调查虽然是非全面调查 但它的目的却在于取得反映总体情况的信息资料 因而 也可起到全面调查的作用 2 特点 遵循随机原则 由样本数据推断总体数量特征 抽样误差可以事先计算和控制 节省人力物力 三 统计报表1 含义 统计报表是我国政府统计的一种重要形式 它是按照国家规定的统一表式 统一的指标 统一的报送程序和报送时间 自下而上逐级提供基本统计资料的一种调查方式 2 特点和优点 1 统计资料的统一性和及时性有保证 2 统计资料有相对的可靠性和准确性 3 统计资料的全面性和连续性有保证 4 有利于资料的积累和资料的历史比较 5 可以满足各级政府对统计资料的需要 四 重点调查1 概念 重点调查是一种非全面调查 它是在调查对象中 选择一部分重点单位作为样本进行调查 2 什么情况下运用此种方法 重点调查主要适用于那些反映主要情况或基本趋势的调查 当调查任务只要求掌握基本情况 而调查的部分单位又能达到对基本情况的掌握 即能比较集中地反映所研究的项目和指标时 采用重点调查比较适宜 4 优特点 投入少 调查速度快 所反映的主要情况或基本趋势比较准确 对重点单位的选择不带有主观性 五 典型调查1 概念 典型调查也是一种非全面调查 它是从众多的调查研究对象中 有意识地选择若干个具有代表性的典型单位进行深入 周密 系统地调查研究 借以认识事物发展变化的规律 2 优缺点 典型调查的优点在于调查范围小 调查单位少 灵活机动 具体深入 节省人力 财力和物力等 其不足是在实际操作中选择真正有代表性的典型单位比较困难 而且还容易受人为因素的干扰 从而可能会导致调查的结论有一定的倾向性 且典型调查的结果一般情况下不易用以推算全面数字 一 调查组织方式 统计调查 二 调查方案设计 统计报表 普查 重点调查 典型调查 抽样调查 调查目的 调查对象和单位 制度化的经常性调查 专门组织调查 全面调查 非全面调查 调查内容和调查表 统计调查误差 第三节 一 统计调查误差的种类 一 登记性误差由于调查过程中的测量 记录 填报 计算等活动中产生的误差 二 代表性误差在非全面调查中 由于选取的那部分单位对全部单位的代表性不足而产生的误差 二 产生误差的客观原因 一 客观随机性 二 操作不当 三 计算中的舍入误差 四 故意制造的误差 三 怎样看待误差 一 误差降低了统计数据的质量 二 误差是难以避免的 三 人们对准确性的要求是相对的 四 追求过高的准确性往往是得不偿失的 统计数据的整理 第四节 一 统计数据整理的意义和步骤 一 统计数据整理的目的 原始数据杂乱无章 很难从中看出事物的内在规律性 进行数据整理的基本目的是使数据简单化 系统化 二 统计数据整理的基本方法 分组例如对班里成绩进行统计整理 分组前 分组后 33 42 25 三 统计数据整理的步骤 二 统计分组 一 统计分组的意义统计分组是基本的统计方法之一 通过分组把总体中具有不同性质的单位分开 把性质相同的单位合在一起 保持组内资料的同质性和组间资料的差异性 正确地反映出统计总体的本质特征 以便进一步运用各种统计方法 研究现象的数量表现和数量特征 分组的关键在于选择恰当的分组标准和准确地划分组的界限 二 统计分组的种类统计分组可以按照不同的标准进行分类 一般有以下几种分类 1 按分组标志的性质划分 统计分组分为品质分组和数量分组 品质分组是按品质标志进行的分组 变量分组是按数量标志的分组 2 按分组标志的多少划分 统计分组分为简单分组和复合分组 简单分组是对研究的总体仅按一个标志进行的分组 复合分组是对研究的同一总体选择两个或两个以上标志层叠起来进行的分组 简单分组 复合分组 三 次数分布及次数的概念 1 次数分布是在统计分组的基础上 将总体的所有单位 按组归并排列 从而形成总体中的各个单位在各组间的分布 又称为分配数列 2 分布在各组的个体单位数叫次数 次数可以用绝对数表示 即频数 也可以用结构相对数表示 即频率或比率或比重 四 次数分布的种类由于统计分组是按照统计标志进行的 因此 分配数列相应的也有品质分配数列和变量分配数列两种 一 品质分配数列的含义和编制 品质分配数列是按照品质标志进行分组所编制的分配数列 简称品质数列 它由各组名称和次数组成 各组名称 频数 比率或频率 某班学生的民族构成情况 例子2 二 变量分配数列 1 概念 变量分配数列是按照数量标志进行分组所编制的分配数列 简称变量数列 它也是由各组名称和次数组成 2 变量数列的种类 单项式数列和组距式数列 单项式数列是按单项式分组而形成的数列 见例1 组距式数列是按组距式分组形成的分配数列 见例2 例1 某班学生年龄情况表 例2 某班学生身高情况表 五 变量数列的编制 一 单项式数列的编制 单项式数列是对于总体单位数不多的离散型变量而言的 先按每一个变量值分组 列于数列的左方 再将各变量值出现的次数列于数列的右方 即构成单项式数列 在此种数列中 一个变量值就是一组 不存在组距问题 组数即等于变量值的数目 参前面的例子1 二 组距式数列的编制 组距式数列是对于连续型变量和变量值较多的离散型变量而言 其基本做法是先将整个变量值依次划分为几个区间 也就是分成几个组 把其列于数列的左方 再将出现在每个区间内的变量值的次数列于数列的右方 即构成组组距式数列 编制这种数列牵涉的问题相对较多 主要有组距 全距 组数 组限 组中值 等距数列和异距数列等问题 参前例2 关于编制此种数列的若干问题 1 组距 指的是组距数列中各组变量值从小到大的距离 也即是区间的距离和长度 2 全距 也称极差 指的是全部变量值中 最大值和最小值的差 4 等距数列和不等距数列 前者是指按照相等的组距划分的组距数列 后者是指按照不相等的组距划分的组距数列 5 组数 指的是根据一定的组距划分的区间的数目 组数的多少与组距的大小呈反方向变化的关系 在等距数列中有以下关系式 6 组限 1 含义 指的是组距数列中 每个组的两端的变量值 其中每组的最小值叫下限 每组的最大值叫上限 2 组限的表示 若变量是离散型 相邻两组的上下限用两个连续自然数表示 若变量是连续型 相邻两组的上下限应用同一变量值表示 即相邻两组的上下限必须重叠 若出现此情况 一般应把此值归入下限的那以组 这也叫做 上组限不在组内的原则 3 开口组和闭口组 若某组变量值同时具有上限和下限称为闭口组 若某组变量值仅具有上限或下限则称为开口组 一般为最高组或最低组 7 组中值 1 含义 下限与上限之间的中点数值叫组中值 2 组中值的计算 计算公式 8 等距数列的编制步骤 1 将原始资料排序 并计算全距 2 确定组数和组距 3 确定组限 4 计算各组的次数 整理编制次数分布表 9 异距数列的情况 第一种办法是将不等组距的次数换算为标准组距次数 标准组距可以选用数列中的最小组组距 第二种办法是计算次数密度 公式如下 例 某工厂工人年龄分布情况 六 累计次数分布 1 向上累计 是将各组次数和比率由变量值低的组向变量值高的组逐组累计 2 向下累计 是将各组次数和比率由变量值高的组向变量值低的组逐组累计 某班学生身高情况表 向下累计 向上累计 七 次数分布的类型 一 钟型分布钟型分布的特征是 两头小 中间大 即靠近中间的变量值分布的次数多 靠近两边的变量值分布的次数少 其曲线图宛如一口钟 如下图所示 二 U型分布U型分布的形状与钟型分布相反 靠近中间的变量值分布次数少 靠近两端的变量值分布次数多 形成 两头大 中间小 的U型分布 如人口死亡率分布 人口总体中 幼儿和老人死亡率高 而中青年死亡率低 如下图 c 三 J型分布J型分布有两种类型 一种是次数随着变量的增大而增多 如投资按利润率大小分布 另一种呈反U型分布 即次数随着变量增大而减少 如随着产品产量的增加 产品单位成本下降 如下图 d 统计数据的描述与显示 第三章 前言统计数据整理形成次数分布后 它也只能大致地表现数据的特征 这对于我们对现象的认识还是远远不够的 本章我们将会学习几种基本统计学方法 用来表现统计数据所代表的事物数量特征 绝对数与相对数 第一节 一 绝对数 一 概念 总量指标是反映社会经济现象总规模 总水平的总和指标 二 作用 1 反映国情 国力和企事业单位人 财 物的状况 2 是国民经济宏观管理和企业经济核算的基础性指标 是实行目标管理的工具 3 是计算相对指标和平均指标的基础 分类 按反映总体的内容分 按反映的时间状态分 1 社会总产品 2 增加值 3 国内生产总值 GDP 按计量单位分 标志总量总体单位总数 时期总量时点总量 实物量劳动量价值量 国民经济统计中几个重要的生产总量指标 二 相对数 相对指标是两个有联系的指标对比的比值 反映事物的数量特征和数量关系 作用 1 反映总体内在的结构特征 3 反映事物发展变化的过程和趋势 2 用于不同对象的比较评价 种类 计划完成相对数 结构相对数 比例相对数 比较相对数 强度相对数 动态相对数 不同时期比较 动态相对数 强度相对数 不同现象比较 不同总体比较 比较相对数 同一总体中 部分与部分比较 部分与总体比较 实际与计划比较 比例相对数 结构相对数 计划完成相对数 同一时期比较 同类现象比较 六种相对数指标的比较 一 结构相对指标 例4 1 我国2002年的农 林 牧 渔业总产值为27390 8亿元 其中农业产值14931 5亿元 林业产值1033 5亿元 牧业产值8454 6亿元 渔业产值2971 1亿元 求结构相对指标 农 林 牧 渔业的产值在总产值中所占的比重为 农业14931 5 27390 8 100 54 51 林业1033 5 27390 8 100 3 77 牧业8454 6 27390 8 100 30 87 渔业2971 1 27390 8 100 10 85 结构相对指标有两个主要作用 1 利用结构相对指标 对事物的内部结构进行分析 不仅可以说明事物的性质和特征 还能够反映事物发展的不同阶段和量变引起质变的过程 2 利用结构相对指标 可以反映事物总体的质量或工作的质量 反映人力 物力和财力的利用情况 二 比例相对指标 比例相对指标是反映总体内部各个组成部分之间的数量对比关系的相对指标 计算公式为 公式4 2 例4 2 根据第五次全国人口普查的快速汇总结果 中国大陆31个省 自治区 直辖市人口和现役军人人口中 男性为65355万人 占总人口的51 63 女性为61228万人 占总人口的48 31 性别比为106 74 100 00 65355 61288 计算结果是比例相对指标 它表明了2000年我国人口中的性别比例 三 比较相对指标 公式4 3 例4 5 1999年中国的棉花产量为383万吨 美国的棉花产量为369万吨 比较相对指标 383 369 1 04 它表明中国的棉花产量是美国的1 04倍 四 动态相对指标 动态相对指标是表明某类现象在不同时间上的指标数值对比关系的相对指标 用以说明现象发展变化的方向和程度 计算公式为 公式4 4 例4 6 我国的汽车产量 万辆 1978年为14 91 1990年为51 40 1995年为145 27 2000年为207 00 2002年为325 10 求动态相对指标 动态相对指标分别为 325 10 14 91 21 80 325 10 51 40 6 32 325 10 145 27 2 24 325 10 207 00 1 57 计算结果表明 我国的汽车产量在改革开放20多年内增长了21 80倍 近10多年增长了6 32倍 近7年来增长了2 24倍 2002年比2000年增长了57 五 强度相对指标 强度相对指标是两个性质不同 但有一定联系的总量指标数值之比 计算公式为 公式4 5 例4 7 2000年第五次全国人口普查 中国大陆31个省 自治区 直辖市 不包括福建省的金门 马祖等岛屿 人口和现役军人的人口126583万人 国土面积为960万平方公里 求强度相对指标 人口密度 126583 960 132 人 平方公里 例4 8 2004年某地区有医院 卫生院669个 医生2 04万人 医院床位数2 92万张 人口1259万人 求强度相对指标 每千人口医生数 2 04 1259 1000 1 62 人 每千人口医院床位数 2 92 1259 1000 2 32 张 平均每一医院服务人口数 1259 10000 669 18819 人 在实践中 强度相对指标主要有三个作用 1 强度相对指标能够说明社会经济现象的强弱程度 因而被广泛地用于反映一个国家或地区的经济发展水平的高低和经济实力的强弱 2 强度相对指标还可以用来反映现象的密度或普遍程度 如人口密度 商业网密度等 3 强度相对指标还可以反映社会生产活动的条件或效果 六 计划完成情况相对指标 公式4 7 1 计划数为绝对数时 计划完成情况相对指标的计算公式为 公式4 8 2 计划数为平均数时 计划完成情况相对指标的计算公式为 公式4 9 3 计划数为相对数时 计划完成情况相对指标的计算公式为 公式4 10 例4 10 某企业计划规定2004年的劳动生产率要比2000年提高4 实际执行结果是提高5 求计划完成情况相对指标 该企业劳动生产率计划完成情况为 计划完成情况相对指标 100 5 100 4 100 105 104 100 100 96 例4 11 某企业计划规定2004年的可比产品成本比2000年降低5 实际执行结果是可比产品成本降低了6 求计划完成情况相对指标 该企业可比产品成本计划完成情况为 计划完成情况相对指标 100 6 100 5 100 94 95 100 98 95 公式4 11 计划完成情况的检查 可分为长期计划检查和短期计划检查两种 依计划任务数的规定不同 检查长期计划的完成情况又有水平法和累计法两种方法 1 水平法 公式4 12 例4 12 某企业 九五 1996 2000年 期间规定甲种产品产量2000年达到200万吨 2000年实际达到210万吨 实际执行结果是到2000年8月止 就达到了200万吨的产量 求计划完成程度以及提前完成计划的时间 该企业甲产品产量的五年计划完成情况相对指标为 甲产品计划完成程度 210 200 100 105 甲产品的五年计划任务于2000年8月完成 提前了4个月 2 累计法 公式4 13 例4 13 某企业 九五 计划规定基本建设投资总额为1500万元 五年实际累计完成投资额为1540万元 求计划完成情况相对指标 该企业五年基本建设投资计划完成程度为 计划完成程度 1540 1500 100 102 7 按累计法计算提前完成计划的时间 是将计划期的全部时间减去自执行计划之日起至累计完成计划的时间 假如上例中该企业于2000年8月底实际完成的累计投资额已达1500万元 则该企业提前完成计划的时间为 60 56 4 月 即该企业提前4个月完成了五年计划 集中趋势的测定 平均数 第二节 平均指标反映同类现象的一般水平 是总体内各单位参差不齐的标志值的代表值 也是对变量分布集中趋势的测定 数据集中区 变量x 概念计算公式特点 1 算术平均数 标志总量与总体单位总数的比值 简单 加权 优点 容易理解 便于计算 灵敏度高 稳定性好 和 缺点 易受极值影响 在偏斜分布和U形分布中 不具有代表性 常用的几种平均数 优点 灵敏度高 在某种不能计算的条件下 可以代替算术平均数 缺点 不易理解 易受极值影响 有 0 值时不能计算 2 调和平均数 标志值倒数平均数的倒数 简单 加权 概念计算公式特点 常用的几种平均数 概念计算公式特点 优点 灵敏度高 受极值影响小于和 适宜于各比率之积为总比率的变量求平均 缺点 有 0 或负值时不能计算 偶数项数列只能用正根 几个变量值连乘积的几次根 是计算平均比率和平均速度时比较适用的一种方法 符合人们的认识规律 简单 加权 3 几何平均数 常用的几种平均数 概念计算公式特点 4 中位数 Me 标志值由小到大顺序排列中居中间位置的标志值位置平均数 优点 容易理解 不受极值影响 适宜于开口组资料和些不能用数字测定的事物 缺点 灵敏度和计算功能差 间断数Me 常用的几种平均数 概念计算公式特点 5 众数 Mo 分配数列中出现次数最多的标志值位置平均数 上限公式 下限公式 优点 容易理解 不受极值影响 缺点 灵敏度和计算功能差 稳定性差 具有不唯一性 调和平均数与算术平均数的区别 1 凡是掌握被平均指标的分母资料时 用算术平均法 2 凡是掌握被平均指标的分子资料时 用调和平均法 价格 元 3 3 2 5 2 0 合计 销售量 斤 3 4 5 12 求某种商品三种零售价格的平均价格 价格 元 3 3 2 5 2 0 合计 销售额 元 9 9 10 10 30 例 算术平均 调和平均 例求95 93 90 的几何平均数 例求众数 分组 500 800 1100 1400 1700 2000频数 4090110105705035 d1 20d2 5 众数组800 1100 500 800 1100 1400 1700 2000 50 100 150 f 人数 1040 d1 d2 求比例 d1 d1 d2 20 20 5 0 8 分割众数组的组距 0 8 1100 800 240 加下限 即M0 800 240 1040 下限公式 求比例 250 240 345 240 0 095 分割中位数组的组距 1400 1100 0 095 28 5 下限公式 加下限 即 Me 1100 28 5 1128 5 元 标志值由小到大 中位数位置 例计算中位数 返回 500 800 1100 1400 1700 2000 月收入 元 1128 5 累计人数 f 500 40 130 240 345 415 465 500 上页 求比例 250 240 345 240 0 095 分割中位数组的组距 1400 1100 0 095 28 5 下限公式 加下限 即 Me 1100 28 5 1128 5 元 离散程度的测定 标志变异指标 第三节 概念 标志变异指标是反映变量分布离散趋势 与平均指标相匹配的指标 作用 1 反映变量分布的离散趋势 2 是对平均数的代表性程度的量度 3 是对事物发展均衡性的量度 常用的几种标志变异指标 概念计算特点 数列中最大值与最小值之差 R 最大值 最小值 优点 容易理解 计算方便 缺点 不能反映全部数据分布状况 各标志值与均值离差绝对值的算术平均 简单 加权 1 极差 R 2 平均差 A D 优点 反映全部数据分布状况 缺点 取绝对值 数字上不尽合理 概念计算特点 各标志值与均值离差平方的平均 方差的平方根 取正根 3 方差 2 和标准差 4 标准差系数 V 标准差与均值之商 是无量纲的系数 简单 加权 方差 2 和标准差 是应用最广的标志变异指标 优点 反映全部数据分布状况 数字上合理 缺点 受计量单位和平均水平影响 不便于比较 优点 适宜不同数据集的比较 缺点 对数据结构变化反应不灵敏 抽样调查1 第四章 内容提要 抽样调查的基本问题 第一节 一 抽样推断的意义 一 什么是抽样推断它是按随机原则从全部研究对象中 抽取一部分单位 即样本 进行观察 并依据获得的数据对总体的数量特征作出估计和判断 以达到对总体的认识 二 抽样推断的特征1 非全面调查 2 遵循随机原则抽取样本单位 3 目的是以样本指标值估计总体指标值 4 产生的误差可以掌握并加以计算 二 抽样调查的应用 一 总体范围较广 不需要了解每一个别单位的情况 二 对破坏性或消耗性产品的质量进行检验 三 对全面调查的结果进行检验和修正 三 抽样推断中的基本概念 抽样涉及的基本概念有 总体与样本样本容量与样本个数 样本可能数目 总体参数与样本统计量重复抽样与不重复抽样 一 总体和样本1 总体 又称全及总体 母体 指所要研究对象的全体 由许多客观存在的具有某种共同性质的单位构成 总体单位数 即总体容量用N表示 2 样本 又称子体 来自总体 是从总体中按随机原则抽选出来的部分单位构成的总体 样本单位数即样本容量用n表示 3 总体是唯一的 确定的 而样本是不确定的 可变的 随机的 二 样本容量和样本个数样本容量 一个样本中所包含的单位数 用n表示 样本个数 又称样本可能数目 指从一个总体中所可能抽取的样本的个数 对于有限总体 样本个数可以计算出来 样本个数的多少与抽样方法有关 这个概念只是对有限总体有意义 对无限总体没有意义 三 总体参数和样本统计量总体参数 反映总体数量特征的指标 其数值是唯一的 确定的 主要包括 总体平均数及其方差 总体成数及其方差样本统计量 根据样本分布计算的指标 或称 样本估计量 样本指标 是随机变量 主要包括 样本平均数及其方差 样本成数及其方差注意 四 重复 置 抽样与不重复 置 抽样重复抽样也称回置抽样 从N个单位中 抽取n个 共有Nn个样本不重复抽样也称不回置抽样 从N个单位中 抽取n个 共有N N 1 N 2 N n 1 个 四 抽样推断的理论依据 一 大数定理 当试验次数n充分大时 可以用频率代替概率 大数定理的意义 个别现象受偶然因素影响而表现出差异性 但是 对总体的大量观察后进行平均 就能使偶然因素的影响相互抵消 从而使总体平均数稳定下来 反映出事物变化的一般规律 这就是大数定理的意义 当样本容量n充分大时 可以用样本平均数估计总体平均数 二 中心极限定理中心极限定理的意义 在一定条件下 大量相互独立的随机变量之和的概率分布是以正态分布为极限的 其主要内容是 如果总体分布未知 且存在有限的均值和方差 则当样本容量足够大时 抽样平均数近似服从正态分布 抽样误差 第二节 一 抽样误差的概念 一 1 含义 指样本指标和总体指标之间数量上的差别 如抽样平均数与总体平均数之差 抽样成数与总体成数之差等 2 系统性偏差 没有遵循随机原则 而是选择了有偏向性的样本 所形成的样本平均数就会偏离总体平均数 二 影响抽样误差的因素抽样平均误差受以下几方面的因素影响 1 总体各单位的变异性 2 样本容量 3 抽样方法 4 抽样调查的组织形式 三 抽样平均误差含义 是抽样平均数 或抽样成数 的标准差 它反映抽样平均数 或抽样成数 与总体平均数 或总体成数 的平均差异程度 抽样平均数的平均数等于总体平均数 抽样成数的平均数等于总体总数 因而抽样平均数 或抽样成数 的标准差实际上反映了抽样平均数 或抽样成数 与总体平均数 或总体成数 的平均差异程度 四 抽样平均误差的计算 抽样平均数的平均误差重置抽样 不重置抽样 抽样成数的平均误差重置抽样 不重置抽样 抽样平均数的平均误差例题 某工厂有1500个工人 用简单随机重复抽样的方法抽出50个工人作为样本 调查其工资水平资料如下 计算样本平均数和抽样平均误差 解 先列表 计算平均数即平均工资 抽样成数的平均误差例题 某钢铁厂生产某种钢管 现从该厂某月生产的500根产品中抽取一个容量为100根的样本 已知一级品率为60 试求样本一级品率的抽样平均误差 解 已知p 60 n 100 N 500 四 抽样极限误差含义 抽样估计时 应根据研究对象的差异程度和分析任务的需要来确定样本指标与总体指标之差的可允许的误差范围 这种允许的误差范围称为抽样极限误差 总体平均数落在抽样平均数的范围内 总体成数P落在抽样成数p p的范围内 五 抽样估计的可靠程度引子班里女生的身高抽样极限误差的大小相当于几个抽样平均误差 所以 用抽样极限误差除以抽样平均误差 得到的相对数t 表示抽样极限误差是抽样平均误差的t倍 t称为抽样误差的概率度 参数估计 第三节 一 点估计 一 含义直接以样本统计量作为相应总体参数的估计量 二 成为优良估计的标准无偏性 即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身 抽样平均数的平均数等于总体平均数 抽样成数的平均数等于总体成数 一致性 要求当样本的单位数充分大时 抽样指标也充分地靠近总体指标 有效性 以抽样指标估计总体指标要求作为优良估计量的方差比其他估计量的方差小 二 区间估计总体参数区间估计是根据给定的概率保证程度的需求 利用实际抽样资料 指出总体被估计值的上限和下限 即指出总体参数可能存在的区间范围 而不是直接给出总体参数的估计值 对某型号的电子元件进行耐用性能检查 抽查资料分组如下表 要求估计该批电子元件的平均耐用时数的置信区间 置信度95 例1 总体均值的区间估计 结果表明 如果多次反复抽样 每次都可以由样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年外观检验考试试题及答案
- 2025年中专会计专业试卷答案及答案
- 2025年护理外科题库及答案解析
- 2025年滨医成考护理题库及答案
- 2025年网络广告合作协议规范文本
- 电信网络故障诊断策略
- 高校计算机应用基础期末试题全解
- 2025-2030中国燃气行业职业资格认证体系改革与人才培养报告
- 2025-2030中国燃气行业市场细分与差异化竞争策略
- 2025-2030中国燃气行业信用体系建设与用户管理研究报告
- 企业内部控制流程培训资料
- 2026届湖南省天一大联考高三上学期阶段性检测(一)数学试题
- 中职生就业指导课件
- 2025年大队委笔试题目及答案
- 2025湖北宜昌市不动产交易和登记中心招聘编外聘用人员17人考试参考题库及答案解析
- 新版《煤矿安全规程》考试题库及答案
- 中药煎煮法课件
- WST524-2025医院感染暴发控制标准解读培训
- 人工智能项目落地实施方案
- 2025年sca感官考试题库
- 静电安全培训课件
评论
0/150
提交评论