统计学离线作业_第1页
统计学离线作业_第2页
统计学离线作业_第3页
统计学离线作业_第4页
统计学离线作业_第5页
已阅读5页,还剩34页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一次作业二、主观题 (共 4 道小题)6. ? 指出下面的数据类型:( 1)?年龄数值型数据( 2)?性别分类型数据( 3)?汽车产量 数值型数据( 4)?员工对企业某项改革措施的态度(赞成、中立、反对)顺序数据( 5)?购买商品时的支付方式(现金、信用卡、支票)分类数据7. ? 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1)描述总体和样本。总体是“该城市所以的职工家庭”样本是“抽取的 2000 个职工家庭”(2)指出参数和统计量。参数是“城市所有职工家庭的年人均收入”统计量是“抽取的 2000 个职工家庭”计算出的年人均收入8. ? 一家研究机构从

2、 IT 从业者中随机抽取 1 000 人作为样本进行调查, 其中 60回答他们的 月收入在 5 000 元以上, 50的人回答他们的消费支付方式是用信用卡。要求:(1) 这一研究的总体是什么 ?总体是所有的 IT 从业者(2) 月收入是分类变量、顺序变量还是数值型变量 ?顺序变量(3) 消费支付方式是分类变量、顺序变量还是数值型变量 ?分类变量(4) 这一研究涉及截面数据还是时间序列数据 ?截面数据9. ? 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主 要原因是“价格便宜”。要求:(1) 这一研究的总体是什么 ?总体是所有网上购物者(2) “消费者在网上购

3、物的原因”是分类变量、顺序变量还是数值型变量分类变量(3) 研究者所关心的参数是什么 ?所有网上购物者的月平均花费(4) “消费者每月在网上购物的平均花费是 200 元”是参数还是统计量 ?统计量(5) 研究者所使用的主要是描述统计方法还是推断统计方法 ?推断统计法第二次作业二、主观题 (共 1 道小题)31. ? 自填式、面访式、电话式各有什么长处和弱点?自填式;优点:1 调查组织者管理容易, 2 成本低,可进行大规模调查, 3 对被调查者,可选择方便时间答卷,减少回答敏感问题压力。缺点: 1 返回率低, 2 不适合结构复杂的问卷,调查 内容有限, 3 调查周期长, 4 在数据搜集过程中遇见

4、问题不能及时调整。面访式;优点: 1回答率高, 2数据质量高, 3 在调查过程中遇见问题可以及时调整。缺点:1成本比较高,2搜集数据的方式对调查过程的质量控制有一定难度,3对于敏感问题,被访者会有压力。电话式;优点:1速度快,2对调查员比较安全,3对访问过程的控制比较容易。缺点:1实施地区有限,2调查时间不能过长,3使用的问卷要简单,4被访者不愿回答时,不易劝服。第三次作业二、主观题(共5道小题)16. ?为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下:BECCADCBAEDACBCDEC

5、EEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1) 指出上面的数据属于什么类型。顺序类型(2) 用Excel制作一张频数分布表接收频数E15D18C32B21A14(3) 绘制一张条形图,反映评价等级的分布。(4) 绘制评价等级的帕累托图。17. ?某行业管理局所属40个企业2002年的产品销售收入数据如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361

6、171089788123115119138112146113126要求:(1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率按销售收入频向下累计向下累计向上累计频向上累计频分组数频数频率数率8595337.50%0100.00%95 1056922.50%3792.50%10511591845.00%3177.50%115125112972.50%2255.00%12513543382.50%1127.5000%717.50%145155240100.00%25.00%105115落后企(2) 按规定,销售收入在125万元以上为先进企业,1

7、15125万元为良好企业, 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、 业进行分组。按销售收入企业数频率分组(万元)(个)(%先进企业1127.50%良好企业1127.50%一般企业922.50%落后企业922.50%18. ?种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:单位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545

8、248464952595350435346574949445752424943474648515945454652554749505447484457475358524855535749565657534148要求:(1) 构建这些数据的频数分布表。重量(g)频率比率(%向上累计40-4588845-5037374550-5534347955-6018189760-6533100合计100100100(2) 绘制频数分布的直方图。(3) 说明数据分布的特征。答:由图表可知食品重量主要是分布在45-55之间,它的分布呈现两头小中间大的钟形分布中的偏态分布,符合正常的分布规律。19. ?甲乙两个班

9、各有40名学生,期末统计学考试成绩的分布如下:考试成绩人数甲班乙班优良中及格3618961598不及格42要求:(1) 根据上面的数据,画出两个班考试成绩的对比条形图和环形图。(2) 比较两个班考试成绩分布的特点。从上面的图形可以看出,甲班同学的成绩主要分布在中,乙班同学的成绩主要分布在良;甲 班的不及格人数比乙班不及格人数多。(3) 画出雷达图,比较两个班考试成绩的分布是否相似。从上图可知,甲乙班的考试成绩是不相似的。20. ?已知19952004年我国的国内生产总值数据如下 (按当年价格计算):单位:亿元年份国内生产总值第一产业第二产业第三产业199558478.1119932853817

10、947199667884. 613844.23361320428199774462. 614211. 23722323029199878345. 214552. 43861925174199982067. 514471. 964055827038200089468. 114628. 24493529905200197314. 815411. 848750331532002105172.316117. 352980360752003117390. 216928. 161274391882004136875. 920768. 077238743721要求:(1) 用Excel绘制国内生产总值的线图

11、。 绘制第一、二、三产业国内生产总值的线图 根据2004年的国内生产总值及其构成数据绘制饼图第四次作业 二、主观题(共7道小题)18. ?随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19152925242321382218302019191623272234244120311723要求;(1) 计算众数、中位数:M0=19和 23; Me=23(2) 根据定义公式计算四分位数。QL=19, QU=26.5 ?(3) 计算平均数和标准差;(4) 计算偏态系数和峰态系数:(5) 对网民年龄的分布特征进行综合分析:样本数据的均值是24岁,单标准差较大,说明网民年龄之间差异较大;从偏值和

12、峰度系 数来看,网民年龄呈现右偏尖峰分布。19. ?某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另一种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取 9名顾客。得到第一种排队方式的平均等待 时间为7. 2分钟,标准差为1. 97分钟。第二种排队方式的等待时间(单位:分钟)如下:5. 56. 66. 76. 87. 17. 37. 4 7 . 87. 8要求:(1) 画出第二种排队方式等待时间的茎叶图。树茎树叶频数551667837134885(2) 计算第二种排队时间的平均数和标准

13、差。(3) 比较两种排队方式等待时间的离散程度。因为两种排队方式的平均数不同,所以用离散系数进行比较,利用离散系数的计算公式,片=兰=0.274, v2 =4 = 0 W2xx得第一种排队方式的离散系数为 0.274 ;第二种排队方式的离散系数为 0.102,所以第一种排队方式等待的离散程度大于第二种排队方式。(4) 如果让你选择一种排队方式,你会选择哪一种?试说明理由。选择第二种,因为平均等待时间短,而且离散程度小。20. ?在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)20030019300400304005004250060018600以上11合计

14、120要求:(1) 计算120家企业利润额的平均数和标准差。平均数是426.67,标准差是116.48。(2) 计算分布的偏态系数和峰态系数。21. ?项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大?为什么?女生的体重差异大,因为女生体重的离散系数为0.1,男生体重的离散系数为0.08. 以磅为单位(Iks = 2. 21b),求体重的平均数和标准差(3) 粗略地估计一下,男生中有百分之几的人体重在55kg 65kg之间?男生中有68%的人体重在55kg 一 65

15、kg之间(4) 粗略地估计一下,女生中有百分之几的人体重在40kg60kg之间?女生中有95%的人体重在40kg 一 60kg之间22. ?一条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士 2个标准差的范围之外,就认为该生产线“失去控制”。下面是一周各天 的产量,该生产线哪几天失去了控制 ?时间周一周二周三周四周五周六周日产量(件)3 8503 6703 6903 7203 6103 5903 700用标准分数判断:时间周一周二周三周四周五周六周日标准化值3-0.6-0.20.4-1.8-2.20周一和周六失去控制23. ? 种产品需要人

16、工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:单位:个方法A方法B方法C16416716816517016516416812913012913013130129127125126126127126128127126164128127162128127163127125166128126167128116166125126165132125要求:(1) 你准备采用什么方法来评价组装方法的优劣?方法A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具有代 表性。(2)

17、 如果让你选择一种方法,你会作出怎样的选择?试说明理由。我选第一种,单位时间的产量是后面第二种的 130%最小值也比后面的最大值高出很多, 很明显生产效率很高,作为老板必须选这个的,前提是产品质量必须一样。24. ?在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益 率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图, 分别反映了 200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往 往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计量来反映投资的风险?方差或标准差(

18、3) 如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?商业类股票(4) 如果进行股票投资,你会选择商业类股票还是高科技类股票?高科技类股票第五次作业二、主观题(共3道小题)12. ?调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 匚=门盎司的正态分布。随机抽取由这台机器灌装的 9个瓶子形成一个样本, 并测定每个瓶子的灌装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。13. ?: 1,丁一表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得14. ?在习题6.1中,假定装瓶机对瓶子的灌装量服从方差的标准

19、正态分布。假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差.,确定一个合适的范围使得有较大的概率保证 S2落入其w-lti中是有用的,试求b1,b2,使得第六次作业二、主观题(共13道小题)24. ?某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。(1) 假定总体标准差为15元,求样本均值的抽样标准误差。(2) 在95%的置信水平下,求边际误差。(3) 如果样本均值为120元,求总体均值?的95%的置信区间。25. ?某大学为了解学生每天上网的时间,在全校7 500名学生中采

20、取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.33.16.25.82.34.15.44.53.24.42.05.42.66.41.83.55.72.32.11.91.25.14.34.23.60.81.54.71.41.22.93.52.40.53.62.5求该校大学生平均上网时间的置信区间,置信水平分别为90%, 95%和99%16个人组成的一个随机样本,95%的置信区间26. ?某居民小区为研究职工上班从家里到单位的距离,抽取了由 他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假

21、定总体服从正态分布,求职工上班从家里到单位平均距离的27. ? 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了 18个员工。得到他们每周加班的时间数据如下 (单位:小时):62117207081629381211921251516假定员工每周加班的时间服从正态分布。估计网络公司员工平均每周加班时间的90%勺置信区间。28. ?在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%29. ?顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素

22、有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务 窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式16.56.66.76.87.17.37.47.77.77.7方式24.25.45.86.26.77.77.78.59.310要求:(1) 构建第一种排队方式等待时间标准差的95%的置信区间。(2) 构建第二种排队方式等待时间标准差的95 %的置信区间。 根据 和 的结果,你认为

23、哪种排队方式更好?第一种排队方式好,标准差小。30. ?从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:来自总体1的样本来自总体2的样本=25f =16码=23瘁=20差如下表所示:(1) 设上=屯=100,求七-d的95%的置信区间。(2) 设10,(?二;,求二-宀的95%的置信区间。(3) 设=7= 10,,求二-厲的95%的置信区间。(4) 设n1 = 10, n2= 20。二'匚,求迪-叫的95%的置信区间。(5) 设n1 = 10, n2= 20。/,求宀的95%的置信区间。31. ?下表是由4对观察值组成的随机样本。配对号来自总体A的样本来自总体

24、B的样本1225073410865(1) 计算A与B各对观察值之差,再利用得出的差值计算F和孑(2) 设分别为总体A和总体B的均值,构造泊=.工-宀的95%的置信区间。32. ?生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是两部机器生产的袋茶重量 (单位:g)的数据:机器1机器23.453.223.93.223.283.353.22.983.73.383.193.33.223.753.283.33.23.053.53.383.353.33.293.332.953.453.23.343.353.273.163.483.123.283.163.283.23

25、.183.253.33.343.25要求:构造两个总体方差比:/ ;的95%的置信区间。33. ?根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求边际误差不超过4%,应抽取多大的样本?34. ?某超市想要估计每个顾客平均每次购物花费的金额。 根据过去的经验,标准差大约为120元, 现要求以95%的置信水平估计每个顾客平均购物金额的置信区间, 并要求边际误差不超过 20元, 应抽取多少个顾客作为样本?35. ?假定两个总体的标准差分别为:-L, T,若要求误差范围不超过 5,相应的置信水平为95%,假定v =小,估计两个总体均值之差 匸时所需的样本量为多大?36. ?

26、假定,边际误差E= 0. 05,相应的置信水平为95%,估计两个总体比例之差 -时 所需的样本量为多大?第七次作业二、主观题(共8道小题)42. ?糖厂用自动打包机打包, 每包标准重量是 100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得 9包重量 (单位:千克 )如下:99 3 98 7 100 5 101 2 98 3 99 7 99 5 102 1 100 5已知包重服从正态分布,试检验该日打包机工作是否正常(a = 0. 05)?43. ?某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取 50 袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0. 05)?44. ?某种电子元件的寿命 x( 单位:小时 ) 服从正态分布。现测得 16 只元件的寿命如下:159 280 101 212 224 379 179 2642

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论