版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一次作业、主观题 (共 4 道小题 )6. 指出下面的数据类型: 1 年龄 数值型数据 2 性别 分类型数据 3 汽车产量 数值型数据 4 职工对企业某项改革措施的态度赞成、中立、反对 顺序数据 5 购置商品时的支付方式现金、信用卡、支票分类数据7. 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1) 描述总体和样本。 总体是“该城市所以的职工家庭 样本是“抽取的 2000 个职工家庭(2) 指出参数和统计量。 参数是“城市所有职工家庭的年人均收入 统计量是“抽取的 2000 个职工家庭计算出的年人均收入8. 一家研究机构从 IT 从业者中随机抽取 1
2、000 人作为样本进行调查, 其中 60答复他们的月收入在 5 000 元以上, 50 的人答复他们的消费支付方式是用信用卡。要求:(1) 这一研究的总体是什么 ? 总体是所有的 IT 从业者(2) 月收入是分类变量、顺序变量还是数值型变量 ? 顺序变量(3) 消费支付方式是分类变量、顺序变量还是数值型变量 ? 分类变量(4) 这一研究涉及截面数据还是时间序列数据 ? 截面数据9. 一项调查说明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是 “价格廉价 。要求:(1) 这一研究的总体是什么 ?总体是所有网上购物者(2) “消费者在网上购物的原因是分类变量、顺序变
3、量还是数值型变量 ? 分类变量(3) 研究者所关心的参数是什么 ? 所有网上购物者的月平均花费(4) “消费者每月在网上购物的平均花费是 200 元是参数还是统计量 ? 统计量(5) 研究者所使用的主要是描述统计方法还是推断统计方法 ? 推断统计法第二次作业二、主观题 (共 1 道小题 )31. 自填式、面访式、 式各有什么长处和弱点 ?自填式;优点: 1调查组织者管理容易, 2 本钱低,可进行大规模调查, 3对被调查者, 可选择方便时间答卷,减少答复敏感问题压力。缺点: 1返回率低, 2不适合结构复杂的问卷,调查内容有限,3调查周期长,4在数据搜集过程中遇见问题不能及时调整。面访式;优点:1
4、答复率高,2数据质量高,3在调查过程中遇见问题可以及时调整。缺 点:1本钱比拟高,2搜集数据的方式对调查过程的质量控制有一定难度,3对于敏感问题,被访者会有压力。式;优点:1速度快,2对调查员比拟平安,3对访问过程的控制比拟容易。缺点:1 实施地区有限,2调查时间不能过长,3使用的问卷要简单,4被访者不愿答复时,不易劝服。第三次作业二、主观题(共5道小题)16.为评价家电行业售后效劳的质量,随机抽取了由100个家庭构成的一个样本。效劳质量的等级分别表示为:A 好;B .较好;C 一般;D .较差;巳差。调查结果如下:B 1ECCADCBAEDACBCDECEEADBCCAEDCBBACDEAB
5、DDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:(1)指出上面的数据属于什么类型顺序类型(2) 用Excel制作一张频数分布表。接收频数E15D18C32B21A14绘制一张条形图,反映评价等级的分布。条形图(4)绘制评价等级的帕累托图1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数
6、分布表,并计算出累积频数和累积频率按销售收入分组频数向下累计频 数向下累计频 率向上累计频 数向上累计频率85 95337.50%0100.00%95 1056922.50%3792.50%10511591845.00%3177.50%115125112972.50%2255.00%12513543382.50%1127.5000%717.50%145155240100.00%25.00%17.某行业管理局所属40个企业2002年的产品销售收入数据如下:(2) 按规定,销售收入在125万元以上为先进企业,115125万元为良好企业,10511 5万元为一般企业,105
7、万元以下为落后企业,按先进企业、良好企业、一般企业、 落后企业进行分组。按销售收入分组 万元企业数个频率%先讲企业1127.50%良好企业1127.50%般企业922.50%落后企业922.50%18. 一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:单位:g57464954555849615149516052545155605647475351485350524045575352514648475347534447505253474548545248464952595350435346574949
8、445752424943474648 15159454546525547495054474844574753585248 55535749565657534148要求:(1)构建这些数据的频数分布表。重量g)频率比率%向上累 计40-4588845-5037374550-5534347955-6018189760-6533100合计100100100(2)绘制频数分布的直方图(3) 说明数据分布的特征。答:由图表可知食品重量主要是分布在 45-55之间,它的分布呈现两头小中间大的钟形分 布中的偏态分布,符合正常的分布规律。19.甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:考试成绩人
9、数甲班乙班优36良615中189及格98不及格42要求:(1)根据上面的数据,画出两个班考试成绩的比照条形图和环形图(2) 比拟两个班考试成绩分布的特点。从上面的图形可以看出,甲班同学的成绩主要分布在中,乙班同学的成绩主要分布在良; 甲班的不及格人数比乙班不及格人数多。 画出雷达图,比拟两个班考试成绩的分布是否相似。甲斑乙班从上图可知,甲乙班的考试成绩是不相似的。20. 19952004年我国的国内生产总值数据如下(按当年价格计算):单位:亿元年份国内生产总值第一产业第二产业第三产业1995119932853817947199667884.63361320428199774462.614211
10、. 23722323029199878345.214552. 43861925174199982067.514471. 964055827038200089468.114628. 24493529905200197314.815411. 84875033153200216117. 352980360752003117390.216928. 161274391882004136875.920768. 077238743721要求:(1)用Excel绘制国内生产总值的线图年份国內生产詡值绘制第一、二、三产业国内生产总值的线图M 鑛三产业 第二产业 一-笑一严业(3)根据2004年的国内生产总值及其
11、构成数据绘制饼图第四次作业、主观题(共7道小题) 18.随机抽取25个网络用户,得到他们的年龄数据如下: 单位:周岁19152925242321382218 1302019191623272234244120311723要求;(1)计算众数、中位数:M0=19 和 23; Me=23(2) 根据定义公式计算四分位数。QL=19, QU=26.5(3) 计算平均数和标准差;元=24,$ =尹山严=6.65,V n -1(4) 计算偏态系数和峰态系数:SK =(nlXw 2)s3= L08= 077丄匸讪+ 1)工匕-丘)4 一3工(兀-丘)2心一1)_(n-l)(n-2)(n-3)/(5) 对网
12、民年龄的分布特征进行综合分析:样本数据的均值是24岁,单标准差较大,说明网民年龄之间差异较大;从偏值和峰 度系数来看,网民年龄呈现右偏尖峰分布。19.某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队 列:另一种是顾客在三千业务窗口处列队 3排等待。为比拟哪种排队方式使顾客等待的时间更短两种排队方式各随机抽 取9名顾客。得到第一种排队方式的平均等待时间为7.2分钟,标准差为1 97分钟。第二种排队方式的等待时间(单位:分钟)如下:5. 56. 66. 76. 87. 17. 37. 4 7 . 87. 8要求:(1)画出第二种排队方式等待时间
13、的茎叶图。树茎树叶频数551667837134885(2)计算第二种排队时间的平均数和标准差(3) 比拟两种排队方式等待时间的离散程度。因为两种排队方式的平均数不同,所以用离散系数进行比拟,禾U用离散系数的计算V1 = 1 = 0,274, v2 =4 = 0,102公式,得第一种排队方式的离散系数为0.274 ;第二种排队方式的离散系数为0.102,所以第一种排队方式等待的离散程度大于第二种排队方式。(4) 如果让你选择一种排队方式,你会选择哪一种?试说明理由 选择第二种,因为平均等待时间短,而且离散程度小。20.在某地区抽取120家企业,按利润额进行分组,结果如下:按利润额分组(万元)企业
14、数(个)20030019300400304005004250060018600以上11合计120要求:(1)计算120家企业利润额的平均数和标准差平均数是,标准差是116.48(2)计算分布的偏态系数和峰态系数。SK = 0.203, =-0.68821. 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为 50kg,标准差为5kg。请答复下面的问题:(1) 是男生的体重差异大还是女生的体重差异大 ?为什么? 女生的体重差异大,因为,男生体重的离散系数为 0.08.(2) 以磅为单位(1ks = 2. 21b),求体重的平均数和标准差。男生:i = 1
15、32.6(), $ = 11.05(磅)女生:无=110.5(磅),j = 11.05(磅)(3) 粗略地估计一下,男生中有百分之几的人体重在 55kg 65kg之间?男生中有68%勺人体重在55kg 65kg之间(4) 粗略地估计一下,女生中有百分之几的人体重在 40kg60kg之间?女生中有95%勺人体重在40kg 60kg之间22. 条产品生产线平均每天的产量为3 700件,标准差为50件。如果某一天的产量低于或高于平均产量,并落人士标准差的范围之外,就认为该生产线失去控制下面是一周各天的产量,该生产线哪几天失去了控制?时间周一周二周三周四周五周六周日产量(件)3 8503 6703 6
16、903 7203 6103 5903 700用标准分数判断:时间周一周二周三周四周五周六周日标准化值30周一和周六失去控制23. 一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量:单位:个方法A方法B方法C16412912516713012616812912616513012717013112616530128164129127168127126164128127162128127163127125166128126167128116166125126165132125
17、要求:(1)你准备采用什么方法来评价组装方法的优劣 ?方法A组装优先理由是平均数较大,离散数较小,分布较为紧密,分析较方便,具 有代表性。(2)如果让你选择一种方法,你会作出怎样的选择 ?试说明理由。我选第一种,单位时间的产量是后面第二种的 130%最小值也比后面的最大值高出 很多,很明显生产效率很高,作为老板必须选这个的,前提是产品质量必须一样。24. 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高
18、收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。(1)你认为该用什么样的统计量来反映投资的风险?方差或标准差(3) 如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?商业类股票(4) 如果进行股票投资,你会选择商业类股票还是高科技类股票?高科技类股票第五次作业二、主观题共3道小题12.调节一个装瓶机使其对每个瓶子的灌装量均值为八 盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。随机抽取由这台机器灌装的 9个瓶子形成一个样本,并测定每个瓶子的灌装量。试确定样本均值偏离总体 均值不超过0.3盎司的概率。总你方菱知道的情况下均值的抽抒丽服从
19、卅仏力的正态分布,由正态分布*标准化得到标准正态分布丄戸方手WM,丙此卩样木均值不超过息休均值的概率P= P(-0.9 z 0.9=亦(L9) -1,査标准正态分布表得 (0.9)=0.8159禺此.-10.3)=0.6318ZZ13. ,r 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数 b,使得解:由p R方分布是由标准正态分布的平方和构成的:设空l s令是來总林的样礼 那么绣计呈才二哥*君*乙从h由度为討的/分布,记沟A=空护 A =仝尸査慨率爲Z9=332S总?刃=19丹那么优=竝样刃3&莎 屯=血昭刃=1&9-9第六次作业二、主观题共13道小题24.某快餐店想要估计
20、每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。1假定总体标准差为15元,求样本均值的抽样标准误差。CF 157- = =2J434n V492在95%的置信水平下,求边际误差。a- =t a-, rti r-ktP本抽样,因此样本肉伯服从山态分恫 内此槪率思仟右八因此,A_ = / CF-=知歼6 =仇咗 9亍=1.96X2*143=4.2(x - As,x + =020 4.2,120 + 4.2j = (115.8, 124.2)25.某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下
21、面的数据单位:小时:o二3,76)1 ct -0,9. t z = z0JQt=r645, Jf 土z f. * -1.645 -皿审叭石361 ct =0.95.r屮二斗m平=l氛 丘土込胆3.32 1.9G= (2.79 3.85)s| 611 -a =0.99* t= %程=可血=2.576* Ji 土 2学26.某居民小区为研究职工上班从家里到单位的距离,抽取了由 分别是:16个人组成的一个随机样本,他们到单位的距离单位:km = 33212.76 -= 2.63 401) 币73610 3 14 8 6 9 12 11 7 5 10 15 9 16 13 295%的置信区间。假定总体
22、服从正态分布,求职工上班从家里到单位平均距离的辭!小样本总体方羞未知.用统计怯,二与巴 #月一1iijtfi=9,375+ 祥本标笊羞 $=ll, 1a =0.95 n=lf 严一1=仏誣15=23心十17:三一祖珀一寓茂+ 口工5一卜审9375-2更+2.13C7JU* IL57)27. 一家研究机设想估计在网络公司工作的职工每周加班的平均时间,为此随机抽取了18个职工。得到他们每周加班的时间数据如下单位:小时:62117207081629381211921251516假定职工每周加班的时间服从正态分布。估计网络公司职工平均每周加班时间的90%勺置信区间。解卡小样本.总休方差未知,用t统计量
23、:心艺孑 /fl-l%bjfjT-13.56,样車加准盂沪了 如】,】n-18* F叨】*讪17 置侑区间;-1036, 16.75)7 RA113.56 -1.736X J 3.56 + 1 7369xV1828.在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。人杆卜总侔力篦用如,N2ft il豊:样木比率1-E=O舸-工申=0.23-10.231-0 ?3)=C6.1811. 00紳丿-QH-I 脱 X更壬igw恥“匣虽T2(H)- nrlO, (-1)(9)-19.0
24、2, X(n9JTw()2J-0.1075, 0.7574)0x0,2272 9x0.2272i 19.02* 2J 丿因北,标准差的置佶区间为(0.3279, 0.8703)计CT经计第得样本标准遨彳=41.2272 迓忙区间rm / 玄 -=心 TZL;2M-1乙-1护打_1炉、9x331S 9其3313以丄】S乙门91匕 r=10,爲也吨血石1卜心9如(1.57r 1L46)因血标准差的置佶区间为CL25, 333 根据和的结果,你认为哪种排队方式更好? 第一种排队方式好,标准差小。30.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表所示:来自总体1的样本来自总体2
25、的样本盂=25爲=23f =16s; =20差如下表所示:设.宀=100,求“弋的95%的置信区间。耳一為土工 J- = 21.96xO.6 = 2LJ76 设- _ ?1 = 10,1二;,求1的95%的置信区间。护二佃-1* + 心7;_出戸-的_+阿一1_-=2 2.1009x757 = 2 3.9X62riy -1-1| 2 卩耳-鬲土* “W匸-=22.10982xVT6 =24-0030Y仰吗 设n1 = 10, n2 = 20。i-1:,求一宀 的95%的置信区间。心区乂哪二豆十旳畑F 宓-他77fyi臣耳一召土辽口幻一 L - =22.0484x72071 =23.4320 V
26、珂碍 设n1 = 10, n2 = 20。3,求二一的95%的置信区间。31.下表是由4对观察值组成的随机样本。配对号来自总体A的样本来自总体B的样本1202573106485(1)计算A与B各对观察值之差,再利用得出的差值计算?和.rf=L75,旺=2.62996解:小杆水配对样术总休方差未知.用L统汁呈均tfl=E75,杆不标nt差尸2 2 99岳 置怕区间-加叶I立刁卫-】立J】cr =0占乩 n=4,曲 一 1 匚血巧=M1W:2重量单位:g的数据:机器1机器232.生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小方差。下面是两部机器生产的袋茶要求:构造两个
27、总体方差比 / ;的95%的置信区间。=0.058* st =0,006 n I =n2=21 * I a =0.95打沿可一1、忙一1 =厲斶2420=2464久 凡呻 5 -h -1 = rr-j一gx匕芦他7叫-1凡举5 7叫-1胡听200=尸_二绚=0 405K 4.05, 24.6尹 卫/2F硏山一1厲一1耳_唧S一133. 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,假设要求边际误差不超过4%,应抽取多大的样本?0.04取n-4K或者50.l-a=0.95, rfi/j=z0(l2i = L9634. 某超市想要估计每个顾客平均每次购物花费的金额。根据过去
28、的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本 ?% T仃解:丹= .1 理-O.SZap-毛巧-1.96,备卅 L963x1202“册卡* 北斗打一 一=13S.3.収沪139或肯或布】刃A 二2L35. 假定两个总体的标准差分别为:_,,1-,假设要求误差范围不超过5,相应的置信水平为95%,假定_,估计两个总体均值之差,.上时所需的样本量为多大?堆,111=112二利二鱼一字巴丄I-nr =05,心卄讪严L竺空堕也工収或青纵36. 假定 坷=坷,边际误差E = 0. 05,相应的置信水平为 9
29、5%,估计两个总体比例之差 羽一叭 时所需的样本量为多大?rd =tl2= ti =Ifo.+o2)=760,取 ir=769ppl =p2=0.5 .IP -J3!一宀 螞乂戸(I -卩1)4必1-介 I 9宀 nl=n2= n 二;:= 第七次作业二、主观题共8道小题42.糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量单位:千克如下:99. 3 98 . 7 100 . 5 101 . 2 98 . 3 99 . 7 99 . 5 102 . 1 100 . 5包重服从正态分布,试检验该日打包机工作是否正常a = 0 . 0
30、5?戈_氏 的9778-】00# 亦L21221/79-0.055提出假设:僦越一100: H、; #100构锂统计绘I止态,Iff4.方羞末知h求临界此 当a=0-05 门山度nl=9时.査表得=9=22&2.决策:因为|/|0.05构建统计輩;2= /川-兀/PF -心_皿m=2勿心0疔咒1一0.05V 50求临yfffii肖d=O曲 査我得-a = I -645,决讹 因为zza样本统计量落在拒绝区域.故拒絶原假设.接貶备择假设 姑论:说明该批A品不能岀厂.44. 某种电子元件的寿命 x单位:小时服从正态分布。现测得16只元件的寿命如下:159 280 101 212 224 379 1
31、79 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著地大于225小时(a = 0. 05)?丘一弘 241.5-225帖 98.726/716提出假设;耳;jw225: ffji 225 构建铳计量5志.小样本,方差:求临界世i:当=0.05.门由度H 1 = 1忖竇衣冯/ =1决策:因为样本统计戢落在接受R域 故接受原假设,拒绝备择假设 皓论:说删兀杵寿命没竹魏假设人于225小时45. 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从 不同的装配方法中各抽取 12件产品,记录各自
32、的装配时间单位:分钟如下:甲方法:31 34 29 32 35 38 34 30 29 32 31 26乙方法:26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同a = 0. 05?提出假跖Hu: 口一堆=0: Hi:曲一衍HO构建统计量总休正态.小样本抽样*方差未知,方差相導h梅惦样本数拐计算,得旳一12蚀12* J, -31.75. 5, -3X46a3 -2K.6667旳一2.4白用儿(J2-lxO.9226?+(12-1)x0 71067K.1 52t12 + 12-2求Mi界11: a=W$时临界点为滋
33、:仏+尽j 一2=仏百22= 2.074 决噩 此懸中|4心“故拒绝压假设站%:认为两种方法的装配I卜:间有显苦差异46. 调查了 339名50岁以上的人,其中 205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持吸烟者容易患慢性气管炎这种观点a= 0. 05?七上出假没:Hg咼二忑:加:朮|盹t = 43/205=02097 n 1=20513/134-0.097 n2=134覘建统计最:z =P-Pj-d祐I-J 61 一卩JY场叫求临界flb当a=05. jyz 决策:因Azz拒绝廉假设 給论:说明吸烟A容易退慢性管炎(0,2098-0,097)-00209S(1-0,209S)0.097(1-0.097)05*60万元。随着经济的开展,贷款规模有增大60万元,故一个n=144的随机样本被抽出,测47. 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能运维系统实施方案
- 钢结构安装团队协调管理方案
- 虚拟化平台部署与管理方案
- 生产线自动化改造与提升方案
- 铺面预定协议合同范本
- xx市文化中心建设项目风险评估报告
- 城区道路破损修复与养护项目实施
- 藤椅加工定做合同范本
- 全国推广项目协议书
- 产品代加工合同范本
- 大学生职业生涯规划
- JGJ142-2012 辐射供暖供冷技术规程
- 毛绒玩具验货报告 格式
- SB/T 10744-2012螺旋卷边式散装水泥钢板筒仓
- GB/T 7251.3-2017低压成套开关设备和控制设备第3部分:由一般人员操作的配电板(DBO)
- GB/T 24923-2010普通型阀门电动装置技术条件
- FZ/T 64056-2015洁净室用擦拭布
- 一年级整本书阅读指导策略
- 员工考勤记录表
- APQP-培训教材-新课件
- 高考语文复习-统编版选择性必修文言文知识点汇总
评论
0/150
提交评论