版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第1章 绪论1什么是统计学?怎样理解统计学与统计数据的关系?2试举出日常生活或工作中统计数据及其规律性的例子。3一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本;(4)描述推断。答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.
2、53650226.8 kg。4“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体;(2)描述研究变量;(3)描述样本; (4)一描述推断。答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。第2章
3、统计数据的描述练习题1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC(1) 指出上面的数据属于什么类型;(2) 用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数
4、据。(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C3232D1818E1515合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导条形图选择子图表类型完成(见Excel练习题2.1)。即得到如下的条形图:2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):15212412911610010392951271041051191141158710311814213512511710810511010713712013611710897881231151191381
5、12146113126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万125万元为良好企业,105万115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为15287=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组
6、之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。整理得到频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100110110120120130130140140以
7、上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40100.0 3.某百货公司连续40天的商品销售额如下(单位:万元):41252947383430384340463645373736454333443528463430374
8、426384442363737493942323635 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:全部数据中,最大的为49,最小的为25,知数据全距为4925=24; 为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数40,得到各组频率,填
9、入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)2530303535404045455046159610.015.037.522.515.0合计40100.0 直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.3).为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700716728719685709691684705718706715712722691708690692707701708729694681695
10、685706661735665668710693697674658698666696698706692691747699682698700710722694690736689696651673749708727688689683685702741698713676702701671718707683717733712683692693697664681721720677679695691713699725726704729703696717688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。解:(1)排
11、序:将全部数据复制到Excel中,并移动到同一列,点击:数据排序确定,即完成数据排序的工作。(见Excel练习题2.4)(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2.4) 100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合计100100 制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导柱
12、形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.4)(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,得到茎叶图如下:651866145686713467968112333455588996900111122233445566677888899700011223456667788897100223356778897201225678997335674147将直方图与茎叶图对比,可见两图十分相似。.下面是北方某城市12月份各天气温的记录数据:-32-4-7-11-1789-6-7-14-18-15-9-
13、6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5(1) 指出上面的数据属于什么类型;(2) 对上面的数据进行适当的分组;(3) 绘制直方图,说明该城市气温分布的特点。解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。(2)分组如下: 由于全部数据中,最大的为9,最小的为25,知数据全距为9(25)=34; 为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的
14、倍数划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数天数,并填入表内,得到频数分布表如下表;北方某城市12月份各天气温分组天数(天)-25-208-20-158-15-1010-10-514-50140545107合计65(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.5).下面是某考
15、试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据:年龄18192121222425293034353940444559%1.934.734.117.26.42.71.81.2(1) 对这个年龄分布作直方图;(2) 从直方图分析成人自学考试人员年龄分布的特点。解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导柱形图选择子图表类型完成。即得到如下的直方图:(见Excel练习题2.6)(2)年龄分布的特点:自学考试人员年龄的分布为右偏。.下面是A、B两个班学生的数学考试成绩数据:A班:4457596061616263636566666769707071727373
16、737474747575757575767677777778787980808285858686909292929396B班:3539404444485152525455565657575758596061616263646668687070717173747479818283838485909191949596100100100(1) 将两个班的考试成绩用一个公共的茎制成茎叶图;(2) 比较两个班考试成绩分布的特点。解:(1)将树茎放置中间,A班树叶向左生长,B班树叶向右生长,得茎叶图如下:A班树茎B班数据个数树 叶树叶数据个数03592144044842975122456677789121
17、197665332110601123468892398877766555554443332100700113449876655200812334566632220901145660100003(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各城市平均相对湿度的分布特征。月份北京长春南京郑州武汉广州成都昆明兰州西安14970765777727965516724168715775808365416734750776881808158497445039726
18、7758479614670555566863718375584158657547357748782724342769708274818684845862874798271738478745755968667167718175775565104759755372807876456511665982777872787153731256578265827582715272资料来源:中国统计年鉴1998,中国统计出版社1998,第10页。解:箱线图如下:(特征请读者自己分析)9.某百货公司6月份各天的销售额数据如下(单位:万元):257276297252238310240236265278271292
19、261281301274267280291258272284268303273263322249269295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223, 于是得该百货公司日销售额的均值:(见Excel练习题2.9) =274.1(万元)或点选单元格后,点击“自动求和”“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数2
20、72和273的平均数:Me=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:QL=261+=261.25(万元) 同理,后四分位数位于第16第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:QU=291=290.75(万元)。(2)未分组数据的标准差计算公式为: s=利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再
21、代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“”符号右边的小三角“”,选择“其它函数”选择函数“STDEV” “确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:(万元)。(见Excel练习题2.9)10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:产品名称单位成本(元)总成本(元)甲企业乙企业ABC152030210030001500325515001500比较
22、哪个企业的总平均成本高?并分析其原因。解:设产品单位成本为 x,产量为f,则总成本为xf,由于:平均成本=,而已知数据中缺产量f 的数据,又因个别产品产量f =从而 =,于是得:甲企业平均成本19.41(元),乙企业平均成本18.29(元),对比可见,甲企业的总平均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。11.在某地区抽取的120家企业按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计120 计算120家企业利润额的均值和标准差
23、。解:设各组平均利润为 x,企业数为f,则组总利润为xf, 由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)组中值企业数(个)总利润xfxf20030025019475030040035030105004005004504218900500600550189900600以上650117150合计12051200于是,120家企业平均利润为: = 426.67(万元);分组数据的标准差计算公式为: s= 手动计算须列表计算各组数据离差平方和(x426.67)2f,并求和,再代入计算公式:列表计算如下组中值企业数(个)(x426.67)2fxf250195930
24、33.489135030176348.6674504222860.133855018273785.200265011548639.1779合计1201614666.668表格中(x426.67)2f的计算方法:方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3426.67)* (a3426.67)*b3,回车,得到该行的计算结果;点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x426.67)2f计算完毕;于是得标准差:(见Excel练习题2.11)s =116.
25、48(万元)。点击第三列的合计单元格后,点击菜单栏中的“”号,回车,即获得第三列数据的和。方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“”符号右边的小三角“”,选择“其它函数”选择函数“STDEV” “确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)于是得标准差:s =116.4845(万元)。12.为研究少年儿童的成长发育状况,某研究所的一位调查
26、人员在某城市抽取100名717岁的少年儿童作为样本,另一位调查人员则抽取了1000名717岁的少年儿童作为样本。请回答下面的问题,并解释其原因。 (1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同? (2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。(3)具有较大
27、样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1公斤2.2磅),求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间? (4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间? 解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:因为女生的离散系数为V=0.1男
28、生体重的离散系数为V=0.08对比可知女生的体重差异较大。 (2) 男生:=27.27(磅),s =2.27(磅); 女生:=22.73(磅),s =2.27(磅); (3)68%;(4)95%。 14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:成年组166169172177180170172174168173幼儿组68696870717372737475 (1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?(2)比较分析哪一组的身高差异大?解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。(2)利用Excel进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:成年组身高的离散系数:;又得幼儿组身高的平均数为71.3,标准差为2.497,从而得: 幼儿组身高的离散系数:; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 与零点、极值点有关的证明课件-2026届高三数学二轮复习
- 特教自闭症考试试题及答案
- 抗真菌药试题及答案
- 企业安全生产制度
- 万达物业奖惩制度规定
- 报考事业编没写奖惩制度
- 项目部精测室奖惩制度
- 临时人员用工制度
- 学校教练员奖惩制度
- 高三管理奖惩制度细则
- 小学语文六年级下册第一单元大单元作业设计
- T/CHES 59-2021组合式金属防洪挡板安装、验收及维护规范
- 宁夏砖瓦用粘土矿产地质勘查技术规程 DB64-T 1754-2020
- 青光眼的观察与护理
- 《跨境电子商务法律法规 》全套教学课件
- 电工实训项目二常用电工工具、仪表使用模块二 认识和使用常用电工仪表
- 残疾人证管理实施细则
- 第一部分 素养1 专题2 区域尺度【教研派资料社】
- 《空调制冷原理》课件
- 2025年上海市浦东新区高三语文一模作文题目解析及范文:一个人履行责任是否意味着放弃自由
- 瓷砖美缝施工合同协议书
评论
0/150
提交评论