




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章 数据的描述性整理教学内容与要求:通过本章教学,使学生了解怎样根据事先做好的统计分组设计方案用手工或计算机对调查数据进行汇总整理,了解怎样针对一批数据的特点为反映数据的次数分布特征对其进行整理。掌握有关数据的次数分布以及次数分布的位置特征数和离散特征数的基本概念,掌握平均数、中位数、众数等位置特征数以及平均数、方差、标准差、离散系数等离散特征数的计算方法和应用。从而使学生学会从数据中提取有用信息的描述性手段。重点内容与难点:1 数据分布状态的描述2 数据分布的位置特征数:平均数的计算 3 数据分布的离散特征数:方差、标准差、离散系数的计算和应用4.1 数据的汇总汇总的操作方法可分为手工汇总和电子计算机汇总。一 、手工汇总1. 划记法2过录法3折叠法二、 电子计算机汇总利用电子计算机技术进行统计汇总的过程主要有以下五步:1编程序2编码3数据录入4逻辑检查5制表打印三、数据汇总的质量控制 (一)汇总前对资料的审核(二) 计算机汇总程序的审核(三) 编码的质量控制(四) 数据录入的质量控制(五)分组及汇总操作的质量控制4.2 数据分布状态的描述一、 社会经济有限总体分布的概念次数分布:把统计总体按照某个标准(标志)分组后,形成总体单位在在各个组的分配。次数又叫频数。用各组次数除以总次数计算的结构相对数叫频率。频数分布列:用频数来描述数据的分布状态的分布列。频率分布列:用频率来描述数据的分布状态的分布列。分布列:统计分组的各组名称与相应的频数或频率结合在一起所形成的数列。在频数分布列中有 (4.1)在频率分布列中有: (4.2)二、 品质型数据分布列和数量型数据分布列(一)品质型数据分布列 品质型数据分布列:对品质型数据资料整理所得到的分布列。或者说是对统计总体按品质标志分组所得到得分布列。(二)数量型数据的分布列数量型数据分布列:对数量型数据资料整理所得到的分布列。或说是对统计总体按数量标志分组所得到的分布列。数量型数据分布列又由于拟组形式不同分为单项式数列和组距式数列。单项式数列,各组名称应成等差。组距式数列,各组组距应当相等。有时,我们得到的是一个组距不相等的分组资料,应当把资料中各组的频数(频率)一一换算成统一组距下的频数(频率)。换算方法是: (4.3)频数密度:组距式分布列中,各组频数与该组组距的比值叫做;频率密度:各组频率与该组组距的比值叫做。频数(频率)密度表明在该组中平均一个单位组距所拥有的频数(频率)。三、分布图分布列描述了数据的分布状态,但它不够直观。分布图则能更加直观地描述数据的分布状态。数据的分布图有:分布棒图、分布直方图、分布折线图、分布曲线图。 四、根据事先作好的分组设计描述分布状态五、 探索式地整理数据来描述分布状态 1. 单项式整理单项式数列的应用场合是:(1)离散型变量;(2)数量型数据的全部结果集中在为数不多的几个数值上重复出现。2. 组距式整理 组距式整理的步骤。 (1)将数据按大小作排序整理。 (2)指定初始分组数和组距组数和组距的关系是组距=全距/组数;全距是数据中最大的数值与最小的数值之差。 常见用作组距的是形如1,5,10,15,20,25,30,等等这样一些“整5”、“整10”的数字。 (3)确定组限的位置 (4)把数据分入各组,计算各组的频数和频率,绘制分布直方图。 (5)审查直方图是否反映出数据的分布规律对数据作组距式分组整理时确定组数的原则是:在能够反映出数据分布规律的前提下,分组数尽可能多些。 4.3 数据分布的位置特征数一、次数分布特征及与之相对应的特征数次数分布的特征数:集中地、概括地说明次数分布(分布直方图)的某种特征的数字1位置特征 平均数、众数、中位数2离散特征 全距、平均差、标准差(方差)、离散系数3偏斜特征 偏态系数4峰度特征 峰度系数二、几种常见的位置特征数(一) 平均数平均数:由我们所研究的全体数据参加计算得到的代表值。平均数的一般形式叫做幂平均数。常见的有:算术平均数、几何平均数、调和平均数。 1.算术平均数.()算术平均数的基本公式 (4.6) 实际工作中,因掌握的资料不同,可分为:简单算术平均数和加权算术平均数。(1)简单算术平均数:资料中变量值的作用大小都相同,其计算公式为: (2)加权算术平均数:资料中变量值的作用大小不相同,其计算公式为:绝对数权数: 或比重权数:影响加权算术平均数的因素:变量值和权数。权数的形式:绝对数形式和比重形式。其中,比重权数反映了权数的实质。当加权算术平均数中的各权数相等时,简单算术平均数是加权算术平均数的一个特例,即二者相等。2. 调和平均数() (1)概念:变量值倒数的算术平均数的倒数。(2)分为:简单调和平均数=加权调和平均数= 3. 几何平均数() (1)概念:变量值连乘积的n次方根。 (2)分为:简单几何平均数和加权几何平均数。4. 算术平均数、调和平均数、几何平均数的一般形式 算术平均数、调和平均数、几何平均数的一般形式是幂平均数()。幂平均数定义为 式中,0,0,为零以外的实数。算术平均数、调和平均数、几何平均数分别是幂平均数当 = 1,= 1, 0时的特例。对同一批观察值,用同一套权数计算的这三种平均数之间的关系是 只有当各个观察值全相等时,上面的等式关系成立。 5. 平均数的应用场合 (1)作为统计指标的一种表现形式 (2)作为统计总体分布的位置特征数 (3)反映一个统计变量所有观察值的一般水平 (4)抵消掉随机试验中的偶然因素影响,显示出试验的规律性水平 (二) 中位数 1概念:把变量值按大小顺序排列起来,居中间位置的数值。当为奇数时取正中央位置的数值作为中位数,当为偶数时取正中央位置两侧二数值和的一半作为中位数。单项式分组,总频数和的一半表明中位数的位置。如果恰好等于至某组为止的累计频数,说明中位数位置恰好在本组与再向前的一组之间,中位数等于相邻这两组变量值和的一半;如果不是这种情况,那么累计频数首次超过的组即为中位数所在组,中位数数值是该组的变量值。组距式分组,应先按与单项式情形相同的方法确定中位数所在组。当中位数位置恰好在两组之间时,中位数数值为相邻这两组之间的组界;当中位数位置落在某组内部时,中位数数值要用公式来推算 (三) 众数1 概念:如果次数分布为单峰型,那么次数最多的那个数。2 在单项式分组情形下,频数最大的那一组的变量值即为众数。3组距式分组情形下,频数最大的那一组为众数所在组,在该组内,用下面的公式求众数的近似值 式中,1是众数所在组频数减该组以下(小的变量值的组为下,大的变量值的组为上)一组频数之差,2是众数所在组频数减该组以上一组频数之差。4众数是一种局部极值,有时,根据分组资料绘制次数分布图,会呈现两个峰形。这提示我们,数据中有两个众数。 (四) 算术平均数、中位数、众数的关系在单峰对称分布中,算术平均数、中位数、众数三者相等。在单峰偏斜分布中,只要偏斜适度,有下列经验关系:中位数处在算术平均数和众数之间;上偏时,众数最小,算术平均数最大;下偏时,众数最大,算术平均数最小;中位数与众数之间的距离大约是中位数与算术平均数之间距离的2倍(见下图)。 众=中=算 众 中算 算中 众 算术平均数、中位数、众数的关系由于算术平均数、中位数、众数的上述关系,一般认为,在较明显的偏斜分布情形下,用中位数来说明次数分布的位置特征较为适中。因为,众数忽略了偏斜一侧的大量数值,而算术平均数又过分强调了这些数值。 算术平均数对特异值的反应十分灵敏,而中位数对特异值反应不灵敏。因此,常常把中位数作为探索发现特异值的标准。我们把数据中的每一个数值和中位数相减。可以很容易发现特异值;反之,把每个数值和算术平均数相减却不容易发现特异值。(五) 算术平均数、中位数的数学性质算术平均数有如下数学性质: (1)变量的各个数值与其算术平均数的离差之和等于0。 (2)变量的各个数值与其算术平均数离差平方和较之与其他数值的离差平方之和都小。即,对关于的下列函数中位数有如下数学性质: 变量的各个数值与其中位数离差绝对值之和较之与其他数值离差绝对值之和都小。即,对关于的函数,当等于的中位数时其值最小。一、 绝对数统计变量的平均数 (一)对绝对数统计变量平均数的要求 求绝对数统计变量的平均数,一般要求所求的平均数是将各个观察值“截长补短”以后的结果。依这个要求,用平均数代替了各个观察值后,观察值的总和不变。 (二)未分组原始资料的平均数 (三)单项式分组资料的平均数 用各组变量值以各组的频数或频率为权数的加权算术平均数。(公式如前述) (四)组距式分组资料的平均数用各组组中值以各组的频数或频率为权数的加权算术平均数。(公式如前述)由于各组的组平均数往往并不恰好等于该组组中值,所以,用上法计算出来的平均数同根据原始数据计算的平均数通常并不相等。前者只是后者的近似数值。 三、比(率)类型统计变量的平均数 (一)什么是比(率)类型统计变量 1概念比(率)类型统计变量:平均指标和相对指标的总称。 2基本比式的含义:要弄清比(率)类型统计变量的基本比式,即这个比(率)类型变量的计算公式。指求得这个比值时所依据的分子统计数据和分母统计数据的比式。 (二)对于比率类型统计变量平均数的要求 对于比率类型统计变量平均数的要求是:所求的平均数是各个个体比率的总比率。 (三)比(率)类型统计变量的平均数 1若已知资料为基本比式的比值和分母资料,则权数为分母资料,用f表示,采用加权算术平均数。2若已知资料为基本比式的比值和分子资料,则权数为分自资料,用M表示,采用加权调和平均数。3当采用同一资料时,加权算术平均数等于加权调和平均数。四、算术平均数与调和平均数中的加权问题 1. 权数的确定 确定权数的方式有两种:客观方式和主观方式。 2. 权数的作用 权数的作用是权衡变量的各个被平均数值在平均数中所起作用的轻重。 认识到权数的这种作用,在实践中,有时可以通过调整权数的结构来改变算术平均数或调和平均数水平。在分析算术平均数或调和平均数水平变动的原因时也要注意到这种情况:算术平均数及调和平均数水平的高低,除了受到统计变量观察值水平高低的影响之外,还受到权数结构变化的影响。 3. 权数的形式 算术平均数或调和平均数的权数可以有绝对数和结构相对数两种形式。 4. 权数的实质内容权数的实质内容在于它的结构,即权值总和中,各项权值之间的比例。4.4 数据分布的离散特征数一、 离散特征数的作用1离散特征数的概念:反映总体中各单位标志值离散程度或变动范围的指标。2离散特征数在统计分析中的作用是:(1)反映统计变量次数分布的离散特征。(2)说明社会经济现象发展变化的均衡性或稳定性。(3)说明平均数代表性的强弱。二、 几种重要的离散特征数 (一)全距 1概念:全距又称极差,记作R=观察之中的最大值观察中的最小值对于组距式分组资料,全距近似为R=最高组上限最低组下限2优点:计算方便,意义明了。3缺点:不能全面反映观察值的变异状况,易受极端值的影响。4应用:在实际工作中,常用于工业产平质量的检查和控制。 (二)平均差 1概念:变量值与平均数的离差绝对值的算术平均数。2类型:若平均数为简单算术平均数,则它们的平均差定义为 若平均数为加权算术平均数,则它们的平均差定义为 平均差选用简单平均的公式还是选用加权平均的公式,取决于其中的算术平均数是简单平均还是加权平均,当选用加权公式时,其权数要和算术平均数的权数一致。平均差是根据全体观察值计算的,它全面的反映了观察值的变异状况,不过,平均差要涉及到绝对值的运算,这在数学处理上很不方便。所以平均差的应用场合较少。(三)方差和标准差 1. 方差的定义:变量值与平均数离差平方和的算术平均数。3 类型:若平均数为简单算术平均数,则它们的方差定义为 若平均数为加权算术平均数,则它们的方差定义为 4用捷公式计算方差 以及 简捷公式的优点是:用观察值的和(或加权和)以及平方和(或加权平方和)可以很方便地得出结果。3标准差简单式 加权式 4方差、标准差的意义与应用方差和标准差是描述数据或是随机变量各种可能的取值离散特征的最重要的特征数。 (四)离散系数全距,平均差,方差,标准差是对观察值变异的绝对状况的测度,是按观察值的计量单位来表示的。当两个观察值集团的计量单位不同时,以及两个观察值集团计量单位虽相同,属于同种变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药士资格考试试卷真题及答案
- 2025年江苏语文中考试卷及答案
- 2025开封高一历史期末考试真题及答案
- 呼吸科进修考试题及答案
- 衡水摩托考试题目及答案
- 难点解析-人教版八年级上册物理声现象《声音的产生与传播》定向练习试题(含答案及解析)
- 2025-2026学年度四川省成都市九年级上册9月考数学试题 参考答案
- 微生物期中考试题及答案
- 南京网约车考试题库及答案
- 2025年消防员招聘考试(面试)历年参考题库含答案详解
- 2025年河北省公需课《双碳目标下绿色能源转型趋势》答案
- 联通运营合作协议合同
- 8.1 走进人工智能 课件 2024-2025学年浙教版(2023)初中信息技术八年级下册
- 鄂尔多斯盆地地质特征与沉积模式分析
- 数字化赋能设计企业转型升级
- 鼻部解剖结构及其临床表现
- 生鲜农产品配送商业计划书模板
- 2025年股东退股权益申请协议书范例
- 小学生乘坐飞机安全
- 《主动脉夹层动脉瘤》课件
- 配电房岗位职责
评论
0/150
提交评论