统计学期末大作业题目及答案_第1页
统计学期末大作业题目及答案_第2页
统计学期末大作业题目及答案_第3页
统计学期末大作业题目及答案_第4页
统计学期末大作业题目及答案_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学实践作业参数估计练习题1. 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据见book3.1表。求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119.4观测数36最大(1)6.4最小(1)0.5置信度(90.0%)0.453184918置信区间2.86348174

2、83.769851585平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119.4观测数36最大(1)6.4最小(1)0.5置信度(95.0%)0.544524915置信区间2.7721417513.861191582平均3.316666667标准误差0.268224616中位数3.25众数5.4标准差1.609347694方差2.59峰度-0.887704917偏度0.211008874区域5.9最小值0.5最大值6.4求和119

3、.4观测数36最大(1)6.4最小(1)0.5置信度(99.0%)0.730591706置信区间2.586074964.0472583732. 某机器生产的袋茶重量(g)的数据见book3.2。构造其平均重量的置信水平为90%、95%和99%的置信区间。 平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(90.0%)0.090932905置信区间3.238590

4、9053.420456714平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(95.0%)0.109978959置信区间3.219544853.439502769平均3.32952381标准误差0.05272334中位数3.25众数3.2标准差0.241608696方差0.058374762峰度0.413855703偏度0.776971476区域0.95最小值2

5、.95最大值3.9求和69.92观测数21最大(1)3.9最小(1)2.95置信度(99.0%)0.150015812置信区间3.1795079973.4795396223. 某机器生产的袋茶重量(g)的数据见book3.3。构造其平均重量的置信水平为90%、95%和99%的置信区间。 平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(90.0%)0.0250229

6、13置信区间3.2649770873.315022913平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(95.0%)0.030073895置信区间3.2599261053.320073895平均3.29标准误差0.014798365中位数3.29众数3.3标准差0.087548306方差0.007664706峰度1.781851265偏度0.003904912区域

7、0.47最小值3.05最大值3.52求和115.15观测数35最大(1)3.52最小(1)3.05置信度(99.0%)0.040375775置信区间3.2496242253.330375775资料整理练习题1. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:a.好;b.较好;c.一般;d.差;e.较差。调查结果见表book1.1。要求:(1)制作一张频数分布表;(2)绘制统计图,反映评价等级的分布。 计数项:xtxt汇总a14b21c32d18e15(空白)总计1002. 某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见bo

8、ok1.2。要求:(1)根据销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算出累积频数和累积频率;累计频数累计频率-104922.50%105-114945.00%115-1241172.50%125+11100.00%(2) 绘制统计图,反映分布情况。3. 北方某城市1月2月份各天气温的记录数据见book1.3。(1)对上面的数据进行适当的分组。(2)绘制统计图,说明该城市气温分布的特点.接收频率累积 %-102640.00%-51563.08%015

9、86.15%5593.85%104100.00%其他0100.00%说明:该城市气温在逐步回暖,整体偏冷。多变量资料整理练习题下面是有关“北京地区大学生掌上阅读状况调查”的部分题目,(1)性别:1男 2女(2)学级:1 大专 2 大一 3大二 4大三 5大四 6研一 7研二 8 博士生(3)月生活费:1 600元以下 2 6001000元 3 10001500元 4 15002000元 5 2000元以上(4)手机类型:1 低端机 2 中端机 3高端机 4智能机 5 其他(5)运营商:1 中国移动 2 中国联通 3中国电信 4中国网通被调查者对这5个题目的回答如数据表book1.8。1.分析不

10、同性别学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。2.分析不同学级的学生选择手机类型的情况,要求结合交叉分析表和相应统计图进行分析。3. 分析不同性别学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。4.分析不同学级的学生选择运营商的情况,要求结合交叉分析表和相应统计图进行分析。求和项:手机类型q4手机类型q4性别q112345总计12266156240104942119221323615567总计331583694762510611由题可知,男生选择智能机的比较多,而女生选择高端机的比较多。求和项:手机类型q4手机类型q4学级12345总计1310344565

11、23165480153310521028852574640638852025314114681020966182160105718124869811总计331583694762510612专的孩子偏爱智能机大一孩子偏爱智能机大二孩子偏爱高端机大三孩子偏爱智能机大四孩子偏爱高端机研一孩子偏爱智能机研二孩子偏爱智能机博士生只有一人使用低端机求和项:运营商q5运营商q5性别q11234总计11356642052150766232总计285142644373男生偏爱中国移动 女生偏爱中国移动求和项:运营商q5运营商q5学级1234总计1161026235286337632311145432865483

12、43489635439720222811总计285142644374专到博都是选择中国移动的人最多,其次是中国联通,选择电信和网通的用户较少多元线性回归练习题1. 一家电气销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。近8个月的销售额与广告费用数据见book7.1表。(1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。(2)用电视广告费用和报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。检验回归方程的线性关系是否显著(a =0.05);检验各回归系数是否显著(a =0.05) 。summary output回归统计mult

13、iple r0.958663444r square0.9190356adjusted r square0.88664984标准误差0.642587303观测值8方差分析dfssmsfsignificance f回归分析223.4354077911.717703928.377768390.001865242残差52.0645922080.412918442总计725.5coefficients标准误差t statp-valuelower 95%upper 95%intercept83.230091691.57386895252.882478944.57175e-0879.1843327587.2

14、7585063电视广告费用 /万元2.2901836210.3040645567.5318993130.0006532321.5085607973.071806445报纸广告费用 /万元1.3009890980.3207015974.0566966620.0097607980.4765993992.125378798summary output回归统计multiple r0.807807408r square0.652552809adjusted r square0.594644943标准误差1.215175116观测值8方差分析dfssmsfsignificance f回归分析116.640

15、0966216.6400966211.268811340.015288079残差68.8599033821.476650564总计725.5coefficients标准误差t statp-valuelower 95%upper 95%intercept88.637681161.58236713156.015876092.174e-0984.7657682892.50959404电视广告费用 /万元1.6038647340.477780793.3569050240.0152880790.4347772592.7729522091回归方程为:y=1.60x+88.642回归方程:y=2.29x1+

16、1.30x2+83.23f值0.001865小于0.05,回归方程的线性关系显著对于x1的系数:p值0.00065小于0.05,显著对于x2的系数:p值0.009761小于0.05,显著2. 一家房地产评估公司想对某城市的房地产销售价格y1与地产的评估价值x1、房产的评估价值x2和使用面积x3建立一个模型,以便对销售价格作出合理预测。为此,收集了20栋住宅的房地产评估数据见book7.2表。(1)写出估计的多元回归方程。(2)检验回归方程的线性关系是否显著(a =0.05)。(3)检验各回归系数是否显著(a =0.05) 。summary output回归统计multiple r0.94736

17、2461r square0.897495632adjusted r square0.878276063标准误差791.6823283观测值20方差分析dfssmsfsignificance f回归分析387803505.4629267835.1546.696969663.87913e-08残差1610028174.54626760.909总计1997831680coefficients标准误差t statp-valuelower 95%intercept148.700454574.4213240.258870010.799036421-1069.0183470.8147381830.51198

18、85071.5913212360.13109905-0.2706289580.8209795420.2111765023.8876462720.0013073610.3733053580.1350410120.0658633122.0503222040.057088036-0.004582972回归方程:y=0.81x1+0.82x2+0.135x3+148.7对于回归方程:f值远远小于0.05,所以回归方程式显著对于x1:0.13大于0.05,不显著对于x2:0.001小于0.05,显著对于x3:0.057大于0.05,不显著所以回归方程为:y+=0.82x2+148.73. 某农场通过试验

19、取得早稻收获量与春季降雨量和春季温度的数据见book7.3表。(1)试确定早稻收获量对春季降雨量和春季温度的二元线性回归方程。解释回归系数的实际意义。(2)检验回归方程的线性关系是否显著(a =0.05)。(3)检验各回归系数是否显著(a =0.05) 。summary output回归统计multiple r0.995651103r square0.991321119adjusted r square0.986981679标准误差261.4310342观测值7方差分析dfssmsfsignificance f回归分析231226615.2615613307.63228.44446237.53

20、23e-05残差4273384.742568346.18563总计631500000coefficients标准误差t statp-valuelower 95%上限 95.0%intercept-0.590996232505.0042289-0.001170280.99912229-1402.7075161401.525523x122.386461299.6005435312.3317910310.080094808-4.26892079949.04184339x2 327.671712898.797924623.316584980.02947241353.36469864601.978727

21、回归方程为:y=22.39x1+327.67x2-0.59对于回归方程:f值远远小于0.05,所以回归方程显著对于回归系数x1:0.08大于0.05,不显著对于回归系数x2:0.029小于0.05,显著方差分析练习题1.从3个总体中各抽取容量不同的样本数据,得到的数据见book5.1表。检验3个总体的均值之间是否有显著差异?(a =0.01)方差分析:单因素方差分析summary组观测数求和平均方差列 1579015861.5列 2460015036.66666667列 33507169121方差分析差异源ssdfmsfp-valuef crit组间618.91666672309.458333

22、34.6573996660.0408772394.256494729组内598966.44444444总计1216.916667114.657399665551844.256494729142560.0408772387618210.01,不能拒绝原假设2. 某家电制造公司准备购进一批5#电池,现有a、b、c三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见book5.2表。试分析三个企业生产的电池的平均寿命之间有无显著差异? (a =0.05)方差分析:单因素方差分析summary组观测数求和平均方差列 151532.5列 2522

23、244.428.3列 351503010列 4521342.615.8方差分析差异源ssdfmsfp-valuef crit组间5475.631825.2128.98939932.02553e-113.238871522组内226.41614.15总计570219128.9893992932863.238871522361092.02552624576458e-113.466800111594280.0007973045991419313.238871522361090.001644272361008310.05拒绝原假设,不同方式推销商品的效果差异显著方式一的方差最小,应选方式一5. 五个地

24、区每天发生交通事故的次数如表book5.5,由于是随机抽样,有一些地区的样本容量较多(如南部和西部),而有些地区样本容量较少(如东部)。试以0.01的显著性水平检验各地区平均每天交通事故的次数是否相等?方差分析:单因素方差分析summary组观测数求和平均方差列 145714.256.25列 256613.26.7列 356412.83.7列 46559.1666666676.966666667列 566711.166666674.566666667方差分析差异源ssdfmsfp-valuef crit组间82.63717949420.659294873.6761349440.02022880

25、44.368815174组内118.0166667215.61984127总计200.6538462253.676134943999650.01不能拒绝原假设,没有足够证据证明验各地区平均每天交通事故的次数相等分布特征分析第一部分1. 某百货公司6月份各天的销售额数据(单位:万元) 见book2.1。(1)计算该百货公司日销售额的均值、中位数、众数;(2)计算日销售额的标准差。 某百货公司平均274.1标准误差3.86595812中位数272.5众数#n/a标准差21.17472469方差448.3689655峰度-0.211917734偏度0.195086998区域86最小值236最大值32

26、2求和8223观测数30最大(1)322最小(1)236置信度(95.0%)7.9067720222. 将某地区120家企业按利润额进行分组,结果如表book2.2,计算120家企业利润额的均值、标准差和离散系数。平均426.6666667标准误差10.63352695中位数450众数450标准差116.4844515方差13568.62745峰度-0.624699913偏度0.208442033区域400最小值250最大值650求和51200观测数120最大(1)650最小(1)250置信度(95.0%)21.05544515离散系数0.2730104333. 25个网络用户的年龄(单位:周

27、岁)数据如表book2.3,计算网民年龄的众数、中位数、均值和标准差。平均24标准误差1.33041347中位数23众数19标准差6.652067348方差44.25峰度0.772705131偏度1.080110357区域26最小值15最大值41求和600观测数25最大(1)41最小(1)15置信度(95.0%)2.745838427第二部分1. 某地区粮食生产情况如表book2.4所示,计算该地区粮食平均亩产量、亩产量的标准差。平均286标准误差8.027100562中位数325众数325标准差80.27100562方差6443.434343峰度-0.393495826偏度-0.128212

28、443区域300最小值125最大值425求和28600观测数100最大(1)425最小(1)125置信度(95.0%)15.92750862. 某公司下属的三个企业计划完成情况如表book2.5,计算该公司的平均计划完成程度。实际产量/件计划产值1.24503751.053153000.9536138011261055平均计划完成程度1.0672985783. 某工业企业某车间工人加工零件情况如表book2.6,要求确定该车间工人加工零件数的众数、中位数、均值和标准差。 平均44.3标准误差1.208179196中位数45众数45标准差12.08179196方差145.969697峰度1.04

29、9323481偏度0.452252788区域60最小值15最大值75求和4430观测数100最大(1)75最小(1)15置信度(95.0%)2.3972895794.两个生产车间工人按某产品日产量(件)分组资料如表book2.7,分析两个车间日产量的平均水平,并说明其代表性的优劣。车间总产量340356车间日产量平均值8.511.86666667第二车间的产量平均值高,因此第二车间生产好于第一车间。假设检验练习题1.经验表明,一个矩形的宽与长之比等于0.618的时候会给人们比较良好的感觉。某工艺品工厂生产的矩形工艺品框架的宽与长要求也按这一比例设计,假定其总体服从正态分布,现随机抽取了20个框

30、架测得比值数据见book4.1表。 在显著性水平a=0.05时能否认为该厂生产的工艺品框架宽与长的平均比例为0.618? 列1平均0.6583标准误差0.020855783中位数0.6215众数0.606标准差0.093269897方差0.008699274峰度3.362449574偏度1.777452646区域0.38最小值0.553最大值0.933求和13.166观测数20最大(1)0.933最小(1)0.553置信度(95.0%)0.043651655h0:u=0.618,h1:u0.6180.04030.0208557831.9323177662.0930240542.09302404

31、9854861.932317766不能拒绝原假设2.为比较新旧两种肥料对产量的影响,以便决定是否采用新肥料。研究者在面积相等、土壤等条件相同的20块田地,分别施用新旧两种肥料,得到新肥料所生产的产量数据见book4.2。通过计算得出对应旧肥料所生产的平均产量为100公斤,检验新肥料的产量是否显著高于旧肥料。(显著性水平a=0.05)平均100.7标准误差1.098084457中位数101众数98标准差4.91078298方差24.11578947峰度1.126259505偏度-0.610870917区域21最小值88最大值109求和2014观测数20最大(1)109最小(1)88置信度(95.

32、0%)2.298317176h0:u100,h11000.71.0980844571.7291328121.7291330.637474不能拒绝原假设3.某种电子元件的寿命服从正态分布,现测得16只元件的寿命见book4.3,问是否有理由认为元件的平均寿命显著地低于240小时?(显著性水平为0.05)平均235.4736842标准误差21.02273462中位数222众数#n/a标准差91.63597572方差8397.152047峰度1.974300177偏度1.300917624区域384最小值101最大值485求和4474观测数19最大(1)485最小(1)101置信度(95.0%)44

33、.16712644h0:u240,h1:u2404.52631578921.022734620.2153057571.7340636070.21530575690509475159.0068200281.665404655zza不能拒绝原假设时间序列分析练习题1. 1981年2000年我国财政用于文教、科技、卫生事业费支出额数据见book8.1表。(1)用绘制时间序列图描述其趋势。(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2001年的支出额。 (3)用5期移动平均法预测2001年用于该项的支出额.年份与费用支出额呈正相关234.35276.06317.22369.73427.7610

34、4.1116523487.88113.2792545553.49124.2932618631.54138.5540035725.87165.0585911870.84239.32415071040.79300.44500331240.04358.59478711462.17402.92555521701.49438.87924211927.47453.45732782181.43480.61159342001年的预测值为2181.43summary output回归统计multiple r0.942823394r square0.888915952adjusted r square0.8827

35、44616标准误差276.2009589观测值20方差分析dfssmsfsignificance f回归分析110988334.4710988334.47144.03946715.03539e-10残差181373165.45576286.96972总计1912361499.92coefficients标准误差t statp-valuelower 95%upper 95%intercept-363.6092632128.3040336-2.8339659550.011004682-633.1660348-94.0524915年份t128.544977410.7106137912.0016443

36、55.03539e-10106.0428129151.047142回归方程:y=128.54t-363.61当t=21时,y=2335.732. 1981年2000年我国油菜籽单位面积产量数据(单位:kg/hm)见book8.2表。(1)根据绘制时间序列图描述其形态。(2)用5期移动平均法预测2001年的单位面积产量。(3)建立一个趋势方程预测各年的单位面积产量年份增长,单位面积产量基本保持持平1293.61243.412211191.4116489.33698003116796.11713687117096.264178181174.2106.0369747123280.9570750512

37、72.275.59851851303.480.75325381333.879.602361771373.479.2815237136682.867122551400.687.689132741421.284.063071562001年估计值时1421.2summary output回归统计multiple r0.45173525r square0.204064736adjusted r square0.15984611标准误差119.2106022观测值20方差分析dfssmsfsignificance f回归分析165583.1819565583.181954.6149045230.045555718残差18255801.01814211.16767总计19321384.2coefficients标准误差t statp-valuelower 95%upper 95%intercept1192.02631655.377074621.525628152.6977e-141075.6833991308.369232年份9.9308270684.6227888712.1482328840.0455

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论