




免费预览已结束,剩余6页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 数据分布特征的描述一、填空题3.1.1 集中趋势 是指一组数据向其中心值靠拢的倾向。3.1.2 加权算术平均数受两个重要因素的影响,一个是 各组变量值 ;另一个是各组变量值出现的 频数或频率 。3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法 。3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权调和平均法 。3.1.5 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。3.1.6 众数 是指一组数据中出现次数最多的变量值。3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为四等分的三个变量值。3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。3.1.9 在数据分布呈 完全对称的正态分布 时,算术平均数、众数和中位数三者相等。3.1.10 异众比率是指 非众数组 的频数占总频数的比率。3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以表示。3.1.14 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布 偏斜程度 的一种方法。3.1.15 中心矩法 是指用标准差的三次方除三阶中心矩计算偏态系数的一种方法。 二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( B )A数值平均数 B位置平均数 C离散系数3.2.2 算术平均数反映的是数据分布的什么特征 ( A )A集中趋势 B离散趋势 C偏态趋势 3.2.3 根据算术平均数的性质,下列表达式正确的是 ( A )A B C3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( B )A算术平均法 B几何平均法 C调和平均法3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( A )A各组数据在组内是均匀分布的 B各组次数相等 C各组数据之间没有差异3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( A )A B C3.2.7 离散程度测度指标中,受极端值影响最大的是 ( C )A平均差 B标准差 C全距3.2.8 平均差与标准差的主要区别在于 ( B )A说明问题的角度不同 B对离差的数学处理方法不同 C计算对象不同3.2.9 标准差系数消除了 ( B )A总体单位数多少的影响 B平均数大小和计量单位的影响 C离散程度的影响3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( B )A两个总体的标准差应该相等B两个总体的平均数应该相等C两个总体的离差平方和应该相等3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是 ( B )A平均差 B标准差 C离散系数3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的 ( A )A偏斜程度 B离散程度 C集中程度三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)3.3. 1 描述数据分布集中趋势的指标有 ( ABCD )A算术平均数 B调和平均数 C众数 D中位数3.3.2 描述数据分布离散趋势的指标有 ( ABCD )A全距 B平均差 C标准差 D离散系数3.3.3 算术平均数所具有的数学性质有 ( AC )A各个变量值与其平均数离差之和等于零B各个变量值与其平均数离差的绝对值之和等于零C各个变量值与其平均数离差的平方和为最小值D各个变量值与其平均数离差的平方和为最大值3.3.4 下列不适于计算算术平均数的数据类型有 ( AB )A分类数据 B顺序数据 C数值型数据 D截面数据3.3.5 加权算术平均数中,各个变量值的权数要起作用必须具备两个条件 ( AD )A各个变量值之间有差异 B各个变量值的权数相等C各个变量值相等 D各个变量值的权数有差异3.3.6 下列对众数的解释说明中,正确的有 ( ABCD )A众数是指一组数据中出现次数最多的变量值B一组数据中可能有多个众数,也可能没有众数C众数不受极端值的影响D众数缺乏灵敏性3.3.7 下列对中位数的解释说明中,正确的有 ( ACD )A中位数不受分布数列的极大或极小值影响B中位数是指一组数据中出现次数最多的变量值C中位数缺乏灵敏性D当次数分布偏态时,中位数的代表性会受到影响3.3.8 以表示根据皮尔逊测度法计算的偏态系数,下列陈述中正确的是 ( ABCD ) A经验证明,在适度偏态的情况下,B当时,数据分布呈对称分布C当时,数据分布呈右(正)偏分布D当时,数据分布呈左(负)偏分布3.3.9 下列关于四分位差的解释说明中,正确的有 ( ABCD )A四分位差就是上四分位数与下四分位数之差的简单算术平均数B四分位差越小,表明中位数的代表性越好C四分位差越大,表明中位数的代表性越差D四分位差可以避免受极端值的影响3.3.10 比较不同总体平均数的代表性时,应该使用离散系数,因为 ( AB )A离散系数可以消除平均数大小的影响 B离散系数可以消除计量单位的影响C离散系数可以消除总体单位数多少的影响D离散系数可以消除变量值之间差异程度的影响四、判断改错题(在你认为正确的题后括号内打“ ”。在你认为错误的地方和题后括号内打“ ”,并在其正下方写出正确的答案来)3.4.1 算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。( ,不适用于分类数据和顺序数据 )3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。 ( )3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。 ( )3.4.4 各变量值与其算术平均数的离差平方和为最小值。 ( )3.4.5 众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。( ,集中趋势 )3.4.6 对于一组数据,可能存在一个或多个众数,也可能不存在众数。 ( )3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。 (,四等分的三个变量值)3.4.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。( ,9个变量值 )3.4.9 在左偏分布中,众数最小,中位数适中,算术平均数最大,即。( ,右偏分布 )3.4.10 数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。 ( )3.4.11 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。 ( )3.4.12 偏态和峰态是对分布集中程度的测度。 ( ,分布形状 )3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为平缓,则为低峰度。 ( )3.4.14 如果以表示峰度系数,当时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。 ( , ) 五、简答题3.5.1 什么是集中趋势?测度集中趋势的主要指标有哪些?答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。3.5.2 什么是调和平均数?调和平均数与算术平均数有何关系?答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数。从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。3.5.3 什么是几何平均数?其应用场合是什么?答:几何平均数也称几何均值,它是n个变量值乘积的n次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。3.5.4 什么是离散趋势?测度离散趋势的主要指标有哪些?答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。3.5.5 什么是偏度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态?答:偏度是描述数据分布对称性的特征值。峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。根据皮尔逊测度法测算的偏态系数,经验证明,在适度偏态的情况下,。当时,数据分布呈对称分布;当时,数据分布呈右(正)偏分布;当时,数据分布呈左(负)偏分布。根据中心矩法计算的偏态系数,当时,数据分布呈对称分布形态;,数据分布呈负(左)偏态;,数据分布呈正(右)偏态;值越接近于0,数据分布越趋于对称,的绝对值越大,数据分布越偏斜。根据峰度系数,当时,分布曲线为正态曲线;当时,分布曲线为高峰曲线,表明变量值的差异程度小,平均数代表性好;当时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。六、计算题3.6.1 2007年某企业精加工车间20名工人加工A零件的产量资料如下:按日产量分组(件)工人人数(人)282294307315322合 计20要求:试计算20名工人日产量的算术平均数、众数和中位数。解:(1)20名工人日产量的算数平均数:(件/人)。(2)从该企业的产量资料表可以看出,20名工人日产量的众数为30件;(3)20名工人日产量的中位数:工人总数的二分之一是10人,从小到大累计人数首次超过10的组所对应的日产量为30件,则中位数为30件。3.6.2 2007年某管理局所属22个企业的工人工资及工人比重资料如下:按月工资分组(元/人)企业数各组工人占工人总数的比重(%)1000以下31510002000735200030008323000以上418合 计22100要求:试计算该管理局工人的月平均工资。解: 根据已知资料,列表计算如下:某管理局工人的月平均工资计算表按月工资分组(元/人)组中值各组工人占工人总数的比重(%)1000以下500157500100020001500355250020003000250032800003000以上35001863000合 计100203000该管理局工人的月平均工资为:(元/人)。3.6.3 某工业局所属生产同一产品企业19个,2007年按工人劳动生产率高低分组如下:按劳动生产率分组(吨/人)企业数各组工人数(人)5060824006070516007080312008090212009010011100合 计197500要求:试计算该工业局工人平均劳动生产率。解: 根据已知资料,列表计算如下:该工业局工人平均劳动生产率计算表按劳动生产率分组(吨/人)组中值x各组工人数(人)fxf50605524001320006070651600104000708075120090000809085120010200090100951100104500合 计7500532500该工业局工人平均劳动生产率为:(吨/人)。3.6.4 某企业生产A种产品需要经过三个连续作业的车间才能完成。2008年1月第一车间粗加工产品的合格率为98%,第二车间精加工产品的合格率为95%,第三车间最后装配的合格率为92%。要求:试计算该产品的企业平均合格率。解:该产品的企业平均合格率为: 。3.6.5 根据抽样调查结果,2008年2月某市居民通讯支出额的众数为120元,算术平均数为150元。要求:试根据算术平均数、中位数及众数之间的关系,计算中位数的近似值,并说明该市居民通讯支出额分布的态势。解:(1)该市居民通讯支出额的中位数近似值为:(元)。(2)由120140150显然有,即该市居民通讯支出额呈尾巴拖在右边的正偏态分布,也即右偏分布。3.6.6 某投资银行的年利率按复利计算,19962007年的年利率分组资料如下:按年利率分组(%)年数(年)628493122151合 计12要求:试计算19962007年的平均年利率。解:19962007年的平均年利率为: 3.6.7 根据500户抽样调查结果,2007年某市城市居民家庭按月人均可支配收入分组的资料如下:按月人均可支配收入分组(元/人)各组家庭户数占总户数的比重(%)1000以下151000200028200030003230004000184000以上7合 计100要求:根据上述资料计算2007年该市居民家庭月人均可支配收入及其平均差和标准差。解:(1)2007年该市居民家庭月人均可支配收入为:。(2)相关计算过程如下:2007年该市居民家庭月人均可支配收入计算表按月人均可支配收入分组(元/人)组中值x各组家庭户数占总户数的比重(%)1000以下5001517402610045414000100020001500287402072015332800200030002500322608320216320030004000350018126022680285768004000以上4500722601582035753200合 计100626093640127240000人均可支配收入的平均差为:=936.40(元)(3)标准差为:(元)3.6.8 2006年某校学生会为了解在校大学生的消费支出情况,从全校本科学生中按性别随机各抽取100名,其月消费支出额分组资料如下:月消费支出额(元)男 生(人)女 生(人)200以下652003009123004001625400500242450060023186007001410700以上86合 计100100要求:根据表中资料(1)分别计算男女学生的平均月消费支出;(2)分别计算男女学生月消费支出的中位数和众数;(3)分别计算男女学生月消费支出的下四分位数和上四分位数;(4) 分别计算男女学生月消费支出的平均差、标准差、离散系数,并比较其平均月消费支出的代表性;(5)分别计算男女学生月消费支出分布的偏态系数和峰度系数,判断其分布形态。解:(1)男学生的平均月消费支出为:(元);同理得到女学生的平均月消费支出为442元。(2)男学生月消费支出的中位数为:对男学生而言,=50,首次超过50的累计次数为55,其所对应的组为400500元,故该组为中位数所在的组;该组=400,=24,=31,=100,代入公式求得: ;同理可得到女学生月消费支出的中位数为433元;男学生月消费支出的众数为:(元);同理得到女学生月消费支出的众数为393元。(3)男学生月消费支出的下四分位数为: 对男生而言,的位置=25,由小到大累计次数首次超过25的组是300400,该组即为下四分位数所在的组,=15,=16,=100,代入公式求得: ;同理得到女学生月消费支出的下四分位数为332元。男学生月消费支出的上四分位数为: 同理得到女学生月消费支出的上四分位数为550元(4)男学生月消费支出的平均差为:(元)同理可求得女生月消费支出的平均差为121元;男生月消费支出的标准差为:(元)同理求得女生月消费支出的标准差为152.21元;男生月消费支出的离散系数为:同理可求得女生月消费支出的离散系数为0.3444,前者小于后者,所以男学生的平均消费支出代表性更强。(5) ; ;根据公式计算得男生月消费支出的偏度为-0.1879,呈轻度左偏分布;峰度为-0.5550,呈轻度低峰分布;对女生而言,月消费支出偏度为0.1727,呈轻度右偏分布;峰度为-0.5015,呈轻度低峰
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业选择测试题库及答案
- 中职建筑专业试题及答案
- 医药工程专业试题及答案
- 黑龙江省大庆市2025-2026学年高三第一次教学质量检测历史试题(含答案)
- 河北省唐山市2025-2026学年高三上学期开学语文试题(含答案)
- 特种专业试题及答案
- 贵州省毕节市梁才学校2024-2025学年七年级上学期期末定时训练数学试卷(含答案)
- 广东省2025-2026年高三上9月月考地理试卷(部分解析)
- 女神节女装活动策划方案
- 安徽省六安市独山中学2024-2025学年高二上学期11月期中地理试卷(含答案)
- 全国宪法演讲比赛一等奖演讲稿
- 《湖心亭看雪》理解性默写(学生版+教师版)
- 拔尖人才培训班学习心得体会
- 精选工法桩安全技术交底记录表
- (7.2.2)-7.2啦啦操音乐创编的流程与方法
- GB/T 212-2008煤的工业分析方法
- 冀教版8年级上英语各单元语法课件
- 大班科学《玩转扑克牌》课件
- DB1750-2019水电站(厂)防雷与接地性能测试技术规范
- 牛常见病防治课件
- 装饰工程保修单
评论
0/150
提交评论