统计学第五版课后题答案_第1页
统计学第五版课后题答案_第2页
统计学第五版课后题答案_第3页
统计学第五版课后题答案_第4页
免费预览已结束,剩余55页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习必备欢迎下载第一章导论1.1(1)数值型变量。(2)分类变量。(3)离散型变量。(4)顺序变量。(5)分类变量。1.2( 1)总体是该市所有职工家庭的集合;样本是抽中的2000 个职工家庭的集合。( 2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000 个职工家庭的年人均收入。1.3( 1)总体是所有IT从业者的集合。( 2)数值型变量。( 3)分类变量。( 4)截面数据。1.4( 1)总体是所有在网上购物的消费者的集合。( 2)分类变量。( 3)参数是所有在网上购物者的月平均花费。( 4)参数( 5)推断统计方法。第二章数据的搜集1. 什么是二手资料?使用二手资料需要注意些什么

2、?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料” 。 使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。2. 比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算, 当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在

3、于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。学习必备欢迎下载非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。3. 调查中搜集数据的方法主要有自填式、面方式、 电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。4. 自填式、面方式、电话式调查个有什么利弊?自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查

4、,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。面谈式优点: 回答率高, 数据质量高, 在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。5. 请举出(或设计)几个实验数据的例子。不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。6. 你认为应当如何控制调查中的回答

5、误差?对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。7. 怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作, 尽量把无回答率降到最低程度。 无回答出现后, 分析武回答产生的原因,采取补救措施。 比如要收回一百份, 就要做好一百二十份或一百三十份问卷的准备, 当被调查者不愿意回答时, 可以通过一定的方法劝服被访者, 还

6、可以通过馈赠小礼品等的方式提高回收率。第三章数据的图表搜集一、思考题3.1 数据的预处理包括哪些内容?答:审核、筛选、排序等。3.2 分类数据和顺序数据的整理和显示方法各有哪些?答:分类数据在整理时候先列出所分的类别,计算各组的频数、 频率,得到频数分布表,学习必备欢迎下载如果是两个或两个以上变量可以制作交叉表。对于分类数据可以绘制条形图、帕累托图、 饼图、环形图等。根据不同的资料或者目的选择不同的图。对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。可根据需要绘制条形图、饼图、环形图等。3.3 数值型数据的分组方法有哪些?简述组距分组的步骤。答:单变量值分组和组距分组。其中组距

7、分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般515 组;第二步,确定各组组距,宜取5 或 10 的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。3.4 直方图和条形图有何区别?答: 1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2 直方图各矩形连续排列,条形图分开排列;3 条形图主要展示分类数据,直方图主要展示数值型数据。3.5 绘制线图应注意问题?答:时间在横轴,观测值绘在纵轴。一般是长宽比例10:7 的长方形,纵轴下端一般从0 开

8、始,数据与0 距离过大的话用折断符号折断。3.6 饼图和环形图的不同?答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。3.7 茎叶图比直方图的优势,他们各自的应用场合?答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。3.8 鉴别图标优劣的准则?答: P65 明确有答案,我就不写了。3.9 制作统计表应注意的问题?答:1,合理安排统计表结构;2 表头一般包括表号,总标题和表中数据的单位等内容;3 表中

9、的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格; 4 在使用统计表时,必要时可在下方加注释,注明数据来源。二、练习题3.1 答:( 1)表中数据属于顺序数据。(2) 用 Excel 制作一张频数分布表。服务等级家庭数目(个)好14较好21学习必备欢迎下载一般32较差18差15(3) 绘制一张条形图,反映评价等级的分布。) 35个30(目 25数20庭家 151050好较好一般较差差服务等级服务等级的条形图(4) 绘制评价等级的帕累托图。35120.00%30100.00%率2580.00%2060.00%频1540.00%1020.00%500.00%一般较好较

10、差差好其他售后服务等级的帕累托图3 2某行业管理局所属40 个企业 20XX 年的产品销售收入数据如下:1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1) 根据上面的数据进行适当的分组, 编制频数分布表, 并计算出累积频数和累积频率。1、确定组数: K1lg( n)1lg 401.602066.32 ,取 k=61lg(2)lg 20.301032、确定组距:组距 ( 最大值 -最小值 ) ÷

11、组数 =( 152-87 )÷ 6=10.83 ,取 10学习必备欢迎下载3、分组频数表销售收入频数频率 %向上累计频数向上累计频率 %8090252590 10037.5512.5100- 110922.5143511012012302665120130717.53382.51301404103792.514015025.03997.5150 以上12.540100合计40100.0(2) 按规定,销售收入在 125 万元以上为先进企业, 115125 万元为良好企业, 105115 万元为一般企业,105 万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。频数

12、频率 %向上累计频数向上累计频率 %先进企业10251025良好企业12302255一般企业922.53177.5落后企业922.540100合计401003 3某百货公司连续40 天的商品销售额如下:单位:万元41252947383430384340463645373736454333443528463430374426384442363737493942323635要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。答 : 1、确定组数:K 1lg( n )lg 401.602066.32 ,取 k=6lg(2)11lg 20.301032、确定组距:组距 (最大值 -最小值

13、 ) ÷ 组数 =( 49-25 )÷ 6=4,取 53、分组频数表(根据实际资料,调整成分5 个组)学习必备欢迎下载销售收入(万元)频数频率 %向上累计频数向上累计频率 %30 以下41041030-35615102535-401537.52562.540-45922.5348545 以上61540100合计40100.04、直方图频率(天)频率16120.00%14累积 %12100.00%1080.00%860.00%640.00%420.00%200.00%30以下30-3535-4040-4545以上销售额 (万元)商店 40天销售额的直方图3 4 利用下面的数据

14、构建茎叶图和箱线图。572929363123472328283551391846182650293321464152282143194220答:茎叶图FrequencyStem & Leaf3.001 .8895.002 .011337.002 .68889992.003 .133.003 .5693.004 .1233.004 .6673.005 .0121.005 .7箱线图学习必备欢迎下载605040302010data3.5 答 :频数分布表灯泡寿命频率向上累积频率(660 以下22%660-67057%670-680613%680-6901427%690-7002653%70

15、0-7101871%710-7201384%720-7301094%730-740397%740 以上3100%合计100直方图频率( 个)120.00%3025100.00%2080.00%1560.00%1040.00%520.00%00.00%灯泡寿命 ( 小时 )灯泡寿命的直方图%)频率累积 %从直方图看,数据的分布呈左偏分布。3.6 答 :频数分布表K 1lg( n )lg 1002116.64 ,取 k=7lg(2)lg 20.301032、确定组距:学习必备欢迎下载组距 (最大值 -最小值 ) ÷ 组数 =( 61-40 )÷ 7=3,取 33、分组频数表(根

16、据实际资料,调整成分5 个组)食品重量( g)频数频率 %向上累计频数向上累计频率 %43 以下334343-4699121246-492424363649-521919555552 -552424797955-581414939358以上77100100合计100100.030120.00%25100.00%率2080.00%频1560.00%1040.00%520.00%00.00%43以下 43-46 46-4949-52 52-55 55-5858以上食品重量的直方图从直方图看,数据的分布呈双峰分布。3.7 频数分布表重量误差( g)频数频率 %向上累计频数向上累计频率 %19-295

17、1051029-39714122439-49816204049-591326336659-69918428469-79612489679-892450100合计50100学习必备欢迎下载15120.00%100.00%1080.00%率60.00%频40.00%520.00%00.00%19-2929-39 39-49 49-59 59-69 69-79 79-89误差的直方图从直方图看,数据的分布呈左偏分布3.8( 1)数值型数据( 2)频数分布表Klg( n )lg601.77815,取 k=71116.91lg(2)lg 20.301032、确定组距:组距 ( 最大值 -最小值 ) &#

18、247; 组数 =( 9+25)÷ 7=4.86 ,取 5气温()频数频率 %向上累计频数向上累计频率 %(-25, -20 )610.00610.00(-20, -15 )813.331423.33(-15, -10 )1016.672440.00(-10.-5)1321.673761.67(-5.0)1220.004981.67( 0,5)46.675388.33(5,10)711.6760100.00合计6010015率10频50)-15)-10),-5), 0),5),10)下20,15,(-500以(-(-(-10(5-2(气温的直方图从直方图看,数据的分布呈左偏分布。学习

19、必备欢迎下载3.9年龄分布直方图403530252015105018192021222425293034353940444559自学考试人员年龄分布集中在20-24 之间,分布图呈右偏。3.103.11散点图3530252015105001234567893.12( 1)复式条形图2018161412人数 甲班10人数 乙班86420优良中及格不及格乙班, 8环形图乙班, 2乙班, 6甲班, 4甲班, 3甲班, 6优甲班,9良中及格不及格乙班, 15乙班, 9甲班, 18( 2)甲班成绩分布图近似正态分布,分布较均衡;乙班成绩分布图右偏。学习必备欢迎下载( 3)根据雷达图,两班成绩分布不相似。

20、优201510不及格良5甲班0乙班及格中3.13国产车销售排行前 10名6005565415004003703002982772002001901811451171000福美来夏利捷达松花江富康哈飞路宝高尔夫东方之子长安奥拓爱丽舍进口车销售排行前 10名160 149140120102100806860403030231716201060丰田现代日产奔驰宝马大众汽车克莱斯勒本田雷克萨斯奥迪国产车销售排行前 10名5%4%19%福美来6%夏利7%捷达松花江7%富康哈飞路宝19%高尔夫10%东方之子长安奥拓爱丽舍10%13%学习必备欢迎下载进口车销售排行前 10名4%2% 1%4%丰田5%现代32

21、%7%日产奔驰7%宝马大众汽车克莱斯勒本田15%雷克萨斯奥迪23%3.14国内生产总值1600001400001200001000008000060000400002000001995199619971998199920002001200220032004第一、二、三产业国内生产总值80000700006000050000第一产业4000030000第二产业2000010000第三0产业1995199619971998199920002001200220032004第四章习题答案4.1 数据排列: 2,4,7,10,10,10,12,12,14,15( 1)众数: 10;中位数: 10 平均数

22、: 9.6(2)四分位数: Q位置 =10=2.5. 所以 Q= 4 7=5.5L4L2Q位置=30=7.5 ,所以 Q = 1214=13U4U2( 3)标准差: 4.17学习必备欢迎下载( 4)峰度 0.25 ,偏度 0.694.2( 1)众数: 19; 23中位数: 23平均数: 24( 2)四分位数: QL 位置 = 254 =6.25. 所以 QL=19+0.250=19 QU 位置 = 754 =18.75 ,所以 QU =25+20.75=26.5( 3)标准差: 6.65( 4)峰度 0.77 ,偏度 1.084.3(1)茎叶图略(2) 平均数: 7,标准差 0.71(3)第一

23、种方式的离散系数vss=1.97 =0.28x7.2第二种方式的离散系数vss=0.71 =0.10x7所以,第二种排队方式等待时间更集中。(4)选择第二种,因为平均等待的时间短,而且等待时间的集中程度高4.4( 1)平均数: 274.1 ,中位数: 272.5(2) Q位置= 30=7.5.所以 Q =258+0.253=258.75L4LQU 位置 = 904 =22.5 ,所以 QU =284+70.75=289.25( 3)日销售额的标准差: 21.174.5 产品名称单位成本总成本/元产量(元)甲企业乙企业甲企业乙企业A1521003255140217B203000150015075

24、C30150015005050合计66006255340342kM i f i= 6600 =19.41 (元)甲企业总平均成本 xi 1n340学习必备欢迎下载kM i f i= 6255乙企业总平均成本 xi 118.29(元)n342所以甲企业的总平均成本比乙企业的高, 原因是甲企业高成本的产品 B 生产的产量比乙企业多,所以把总平均成本提高了。4.6 计算数据如表:按利润额分组组中值企业数(个)利润额x ) 2f( x _(万元)200 300250194750593033300 4003503010500176349400 500450421890022860500 60055018

25、9900273785600 以上650117150548639合计-120512001614666kM i f i51200利润总额的平均数xi1=426.67(万元)n120x2* f1614666利润总额标准差x115.99(万元)n=120kx) 4i 1( M ifi5108744164 8峰态系数 K3ns43(115.99) 41202.3523 0.6479kx )35426.67)3 fi(M ifi(M i偏态系数 SKi1ns3= i 1(115.99) 30.20571204.7 ( 1)不同。 1000 名的平均身高较高;( 2)不同。 100 名的样本容量的标准差更大

26、;( 3)不同,调查 1000 名的样本容量得到最高和最低者的机会较大。4.8 对于不同的总体的差异程度的比较采用标准差系数,计算如下:vs男s5; vs女s510%x8.3%x5060(1)女生的体重差异大,因为离散系数大;学习必备欢迎下载(2)以磅为单位, 男生的平均体重为132.6 磅,标准差为11.05 磅;女生的平均体重为 110.5磅,标准差为11.05 磅vs男s11.05女s11.0510%x8.33% vsx110.5132.6(3) zixix65601,所以大约有68%的人体重在 55kg65kg 之间;s5(4) zixix40502 ,所以大约有95%的女生体重在 4

27、0kg60kg 之间。s54.9 zixi x1151001;s15xi x425400;zis500.5由此可以判断第二项测试更理想。4.10时间周一周二周三周四周五周六周日产量3850367036903720361035903700z 值30.60.20.41.82.20可以看出,周一和周六两天生产线失去了控制。4.11 ( 1)采用离散系数,因为如果比较身高差异,儿童和成年人属于不同的总体;s4.202.44%s2.503.5%(2) vs成年172.1, vs儿童71.3xx所以,儿童的身高差异更大。4.12 ( 1)对集中程度和离散程度分别评价,选择集中趋势数值大的,而且离散程度数值

28、小的方式(2)选择方法A,因为 A 方法下,工人的平均组装数量为165.6 ,而且该方法下,工人组装数量的离散系数只有0.012 ,所以选择A 方法。4.13 ( 1)用离散系数(2)商业类(3)高科技第六章统计量与抽样分布学习必备欢迎下载、设, ,X n是从总体X中抽取的容量为的一个样本,如果由此1X 1X 2n样本构造一个函数TX 1, X 2, , X n ,不依赖于任何未知参数,则称函数 T X 1, X 2, , X n是一个统计量。由样本构建具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统

29、计量。构造统计量的主要目的就是对总体的未知参数进行推断,如果统计量中含有总体的未知参数就没办法再对参数进行统计推断。2、 T1和T 2 是统计量,T3和 T 4 在和未知的情况下不是统计量。3、设 X 1,X 2, , X n是从总体 X 中抽取的一个样本, X(i) 称为第 i个次序统计量,它是样本 X1,X 2, , X n 满足如下条件的函数: 每当样本得到一组观测 值x1 , x2 , xn时,其由小到大的排序 x 1x 2x ix n 中第 i个值 x i 就作为次序统计量 X(i)的观测值,而 X 1 ,X 2 , ,X n 称为次序统计量。4 、假若一个统计量能把含在样本中有关总

30、体的信息一点都不损失地提取出来,这样的统计量称充分统计量。5、统计学上的自由度指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的资料的个数。6 、2 分布和正态分布关系:n时,2分布的极限分布是正态分布。t分布和正态分布的关系: t分布的密度函数曲线与标准正态分布的密度函数曲线非常相似,但 t n分布的密度函数在两侧 的尾部都要比标准正态的两侧尾部粗一些,方差也比标准正态分布的方差大。随着自由度 n的增加, t分布的密度函数越来越接近标准正态分布的密度函数。分布和正态分布关系:若X t n,则X2,。并且随着自由度 的增加,X也越F F 1 nn来越接近于标准正态分布,若把 X看成

31、近似服从标准正态 分布的一个随机变量,则。X 2 F 1,n 。7、在重复选取容量为n 的样本时,由样本统计量的所有取值形成的相对频数分布为统计量的抽样分布。、中心极限定理:设从均值为,方差为2的任意一个总体中抽取样本量为n82的样本,当 n 充分大时,样本均值X 的抽样分布近似服从均值为,方差为的n正态分布。中心极限定理解决了在总体为非正态的情况下,样本平均数的抽样分布问题,为总体参数的推断提供了理论基础。二、练习1、易知由这台机器灌装的9 个瓶子形成的样本, 其平均灌装量服从正态分布,均值为,学习必备欢迎下载标准差为xP X1n,故30.3P X0.9 P z 0.9 0.63191 32、若PX0.30.95,则 PX0.30.950.31.96 ,n,即nn1.962又知1, n42.68, 故 n43。0.36Zi2 服从自由度为 6 的卡方分布,得 b212.59 (左侧分位数)3、易知0 .95 (6)i 14、因为n1 S2服从2(n1) 分布,我们已知n 10,1,故 9S2服从2( 9)2分布,P b1S2b299S29b20.9,我们若取P b1P 9S29b20.05, P 9S29b10.05,则可以得到9b202.95 (9)16.92,9b102.05 (9)3.33 ,故 b10.37,b21.88 。(题中均为左侧分位数)第七章参数估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论