《统计学A》主观题作业_第1页
《统计学A》主观题作业_第2页
《统计学A》主观题作业_第3页
《统计学A》主观题作业_第4页
《统计学A》主观题作业_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价统计学A第一次作业二、主观题(共4道小题)指出下面的数据类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)参考答案:(1)年龄:离散数值数据(2)性别:分类数据(3)汽车产量:离散数值数据(4)员工对企业某项改革措施的态度(赞成、中立、反对):顺序数据(5)购买商品时的支付方式(现金、信用卡、支票):分类数据某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。要求:(1)描述总体和样本。(2

2、)指出参数和统计量。参考答案:(1)总体:全市所有职工家庭;样本:2000个职工家庭(2)参数:全市所有职工家庭的人均收入;统计量:2000个职工家庭的人均收入。&一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50的人回答他们的消费支付方式是用信用卡。要求:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?参考答案:所有IT从业者。(2)月收入十数值型变量(3)消费支付方式是分类变量(4)涉及截面数据格便宜”。要

3、求:(1)这一研究的总体是什么?(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量?研究者所关心的参数是什么?“消费者每月在网上购物的平均花费是200元”是参数还是统计量?研究者所使用的主要是描述统计方法还是推断统计方法?参考答案:(1)网上购物的所有消费者(2)分类变量所有消费者网上购物的平均花费、所有消费者选择网上购物的主要原因统计量描述统计9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价统计学A第二次作业二、主观题(共1道小题)31.自填式、面访式、电话式各有什么长处和弱点?参考答案:自填式优点:调查成本最低;适合于大范围的调

4、查;适合于敏感性问题的调查。自填式缺点:较低的回收率;不适用于较复杂的问题的调查;调查中回答问题的情况不受控制(比如多人采用相同的回答);调查周期长。面访式优点:较高的回答率;调查员可以对回答进行解释、确认、澄清,避免含混不清的回答。面访式缺点:调查成本高;不适用于敏感性问题;调查员的素质会影响调查质量。电话式优点:速度快;便于调查控制;适合于大范围的调查。电话式缺点:受电话安装情况的限制;在涉及复杂问题,或问题较多时,容易被拒绝回答。9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价统计学A第三次作业(注意:若有主观题目,请按照题目,离线完成,完成

5、后纸质上交学习中心,记录成绩。在线只需提交客观题答案。)二、主观题(共5道小题)16.为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好:B.较好;C一般:D.较差:E差。调杳结果如下:BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC要求:指出上面的数据属于什么类型。用Excel制作一张频数分布表。绘制一张条形图,反映评价等级的分布。绘制评价等级的帕累托图。参考答案:顺序数据用数据分析一一直方

6、图制作:接收频率E16(3)用数据分析一一直方图制作:TOC o 1-5 h zD17C32B21A14直方圏接收频数(4)逆序排序后,制作累计频数分布表:接收频数频率()累计频率)C323232B212153D171770E161686A14141009.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价17.某行业管理局所属40个企业2002年的产品销售收入数据如下:152124129116100103929512710410511911411587103118142135125117108105110107137120136117108978812

7、3115119138112146113126要求:根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。按规定,销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。参考答案:1、确定组数:1或2)lg20.30W3,取k=62、确定组距:组距=(最大值-最小值)F组数=(114-42)6=10.83,取103、分组频数表销售收入频数频率累计频数累计频率80.00-89.0025.025.090.00-99.0037.5512.5100.00-109.00922

8、.51435.0110.00-119.001230.02665.0120.00-129.00717.53382.5130.00-139.00410.03792.5140.00-149.0025.03997.5150.00+12.540100.0总和40100.0频数频率累计频数累计频率先进企业1025.01025.0良好企业1230.02255.0一般企业922.53177.5落后企业922.540100.0总和40100.018.一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是

9、“价量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:单位:57464954555849516052545155605351485350524052514648475347505253474548544952595350435349445752424943515945454652555447484457475355535749565657要求:g构建这些数据的频数分布表。绘制频数分布的直方图。说明数据分布的特征。参考答案:并计算出累积频数解:(1)根据上面的数据进行适当的分组,编制频数分布表,和累积频率。1、确定组数:4=1+空巴1或2)=6.64,取k=6或72、确定组距

10、:组距=(最大值者4、5组距=(最大值3、分组频数表最小值)F组数=最小值)F组数=有效(6140)(6140)F6=3.5,取3或F7=3,频数百分比累计频数累积百分比40.00-42.0033.033.043.00-45.0099.01212.046.00-48.002424.03636.049.00-51.001919.05555.052.00-54.002424.07979.055.00-57.001414.09393.058.00+77.0100100.0合计100100.0组距3,上限为小于18.一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重9.一项调查

11、表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价18.一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价直方图:9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价组距乱小于9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价Mean=5.22St!Dev.=1.508

12、N=100组距各小于组距4,上限为小于等于累计频数累积百分比频数百分比有效=40.0011.011.041.00-44.0077.088.045.00-48.002828.03636.049.00-52.002828.06464.053.00-56.002222.08686.057.00-60.001313.09999.061.00+11.0100100.0合计100100.0直方图:9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价组距4.小于等于Mean=4.06St!Dev.=1.221N=100有效频数百分比累计频数累积百分比=45.0012

13、12.012.012.046.00-50.003737.049.049.051.00-55.003434.083.083.056.00-60.001616.099.099.061.00+11.0100.0100.0合计100100.0组距5,上限为小于等于直方图:9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价组距反小于等于9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价分布特征:左偏钟型。甲乙两个班各有40名

14、学生,期末统计学考试成绩的分布如下:Mean=2.57St!Dev.=0.935N=100考试成绩人数甲班优3良6中18及格9不及格419.要求:根据上面的数据,画出两个班考试成绩的对比条形图和环形图。比较两个班考试成绩分布的特点。画出雷达图,比较两个班考试成绩的分布是否相似。参考答案:(3)9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价罚18IS14=12108&420(1)1815rnQQn566|亠L4亠tL亠IL优良中及格不及格人数甲班人数乙班(2)甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。

15、(2)9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价分布不相似。20.已知19952004年我国的国内生产总值数据如下(按当年价格计算):单位:亿元年份国内生产总值第一产业第二199558478.111993285199667884.613844.2336199774462.614211.2372199878345.214552.4386199982067.514471.96405200089468.114628.2449200197314.815411.84872002105172.316117.35292003117390.216928.16

16、122004136875.920768.07723要求:用Excel绘制国内生产总值的线图。绘制第一、二、三产业国内生产总值的线图。根据2004年的国内生产总值及其构成数据绘制饼图。参考答案:(1)国內生产总值国内生产总值1S0000UOOOO120000100000800006000040000200000余g辭於衬护护材材9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价第一产业一第二产业第三产业统计学A第四次作业二、主观题(共7道小题)18.随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19152925242321382218302

17、019191623272234244120311723要求;计算众数、中位数(2)根据定义公式计算四分位数。(3)计算平均数和标准差;计算偏态系数和峰态系数:对网民年龄的分布特征进行综合分析:参考答案:(1)1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄频数频率累计频数累计频率Valid1514.011614.021714.031814.0419312.072028.092114.0102228.01223312.0152428.0172514.0182714.0192914.0203014.0213114.0223414.0233814.0244114.025Total251

18、00.0从频数看出,众数Mo有两个:19、23;从累计频数看,中位数Me=23。(2)Q1位置=25/4=6.25,因此Ql=19,Q3位置=3X25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75X2=26.5。(3)均值=24.00;标准差=6.652(4)偏度系数SK=1.080;峰度系数K=0.773(5)分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:vm=uIE16IT1G归ZO2122232125272594SIMEl隅用户的年静为分组情况下的概率密度曲线:分组:1、确定组数

19、:髓斗鹘十册取k=62、确定组距:组距=(最大值-最小值)F组数=(41-15)6=4.3,取53、分组频数表网络用户的年龄(Binned)频数频率=1514.016-20832.021-25936.026-30312.0Valid31-352&036-4014.041+14.0Total25100.0分组后的均值与方差:均值标准差方差偏度系数Skewness峰度系数Kurtosis累计频数累计频率14.0936.01872.02184.02392.02496.025100.023.30007.0237749.3331.1631.3029.一项调查表明,消费者每月在网上购物的平均花费是200元

20、,他们选择在网上购物的主要原因是“价分组后的直方图:9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价19.某银行为缩短顾客到银行办理业务等待的时间。准备采用两种排队方式进行试验:一种是所有颐客都进入一个等待队列:另种是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短两种排队方式各随机抽取9名顾客。得到第一种排队方式的平均等待时间为72分钟,标准差为197分钟。第二种排队方式的等待时间(单位:分钟)如下:556667687173747878要求:画出第二种排队方式等待时间的茎叶图。计算第二种排队时间的平均数和标准差。比较两种排

21、队方式等待时间的离散程度。如果让你选择一种排队方式,你会选择哪种?试说明理由。参考答案:(1)第二种排队方式的等待时间(单位:分钟)Stem-and-LeafPlot频数茎叶图1.00(=,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设,说明该批食品不能出厂。某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下:159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命显著地大于225小时(a=0.05)?参考答案:解:H:UW225;H:H22501经计算知:=241.5s=98.726检验统计量:

22、=0.669当a=0.05,自由度n1=15时,查表得=1.753。因为tV,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明元件寿命没有显著大于225小时。装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:甲方法:313429323538343029323126乙方法:262428293029322631293228两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(a=0.05)?参考答案:解:建立假设H:pp=0H:ppH0012112根据样

23、本数据计算,得=12,=12,=31.75,=3.19446,=28.总体正态,小样本抽样,方差未知,方差相等,检验统计量9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价6667,=2.46183。=8.1326=2.648=2.074,此题中a=0.05时,临界点为,故拒绝原假设,认为两种方法的装配时间有显著差异。46.调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中9.一项调查表明,消费者每月在网上购物的平均

24、花费是200元,他们选择在网上购物的主要原因是“价有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点(a=0.05)?参考答案:解:建立假设H:nn;H:nnp=13/134=0.097n2=1342012112p=43/205=0.2097n1=2051检验统计量=3当a=0.05,查表得=1.645。因为,拒绝原假设,说明吸烟者容易患慢性气管炎。47.为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得=68.1万元,s=45。用a=0.01的显著性水平,采用p值进行检验。参考答案:解:H:*60;H:卩6001已知:=68.1s=45由于n=14430,大样本,因此检验统计量:=2.16由于口,因此P值二P(z2.16)=1-,查表的=0.9846,P值=0.0154由于Pa=0.01,故不能拒绝原假设,说明贷款的平均规模没有明显地超过60万元。48有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论