




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章统计表与统计图1 .根据有关汽车信息数据集 ex3_1 , (1)按“产地”计算平均每加仑油可行走的英里数(不考虑权数),回答问题。(2)按“汽缸数”计算平均每加仑油可行走的英里数(不考虑权数),回答问题。(3)按“产地”和“汽缸数”交叉分类计算平均每加仑油可行走的英里数(保留 两位小数),作出标准的统计表。问:(1)哪个产地平均每加仑油可行走的英里数最多 日本;哪个产地平均每加仑油可行走的英里数最少美国。(2)汽缸数为4的车平均每加仑油可行走的英里数为 29.29汽缸数为8的车平均每加仑油可行走的英里数为15.02。表:按“产地”和“汽缸数”交叉分类的平均每加仑油可行走的英里数汽缸数A
2、mericanEuropeanJapanese总计3 Cylinders20.5520.554 Cylinders27.8428.4131.6029.295 Cylinders27.3727.376 Cylinders19.6620.1023.8819.998 Cylinders15.0215.02总计20.1327.8930.4523.552 .根据有关1995年各国信息数据集 ex3_2, (1)将所有国家按“地区类型”进行分类,回答问题;(2)将各国人口分为 5组,生成新变量“人口类型” :500万人(不包括500万) 以下为特小国;500-1000万人(不包括1000万)为小国;100
3、0-5000万人为中等国家;5000-1 亿人为大国;1亿人以上为特大国,回答问题;(提示:用Excel帮助功能学习IF函数的用法)(3)按“人口类型”和“地区类型”交叉分类计算平均人均GDP (不考虑人口权数,保留到整数),作出标准的统计表。问:(1)拉丁美洲有 21个 个国家:OECD有 一21个一 个国家。(2)特大国有 9个个国家,占所有国家个数的百分比为8.26%地区类型人口类型大国特大国特小国小国中等国家总计Africa2021,635789922999East Europe2,3406,6805,7394,1665,2385160Latn America3,6042,3542,9
4、919591,9101998Middle East1,9906,2777,3253,0984957OECD17,48923,47415,38718,36714,57416611Pacific/Asia9663,63414,99014,6413,0244263总计608460346382665848785860特小国有27个个国家,占所有国家个数的百分比为_24.77%_。表: 按“人口类型”和“地区类型”交叉分类的平均人均GDP3 .四位同学组成社会实践小组,用一周的时间销售各类报纸与杂志。根据四人的销售记录ex3_3_1ex3_3_4 ,汇总出各类报纸与杂志的销售量。问:(1) “扬子晚报”
5、在一周中销售总量是 , (3444份)“扬子晚报”周一的销售量是 , (512份)其原始资料是:A: 159份;B: 210 份,3份;C: 130 份;D: 10 份(3) “读者”在一周中的销售总量是 , (396本)(4) “读者”周一的销售量是 , (36本)其原始资料是:A: 4本;B: 4本;C: 21本,3本;D: 4份(5)四位同学在一周内共销售了多少报纸与杂志? (11380份)(6)哪天销售的报纸与杂志的总量最多? (周五),销售了多少? (2515 份)4.根据数据集ex3_2,用Excel绘图功能分别绘制条形图和饼图以反映1995年人口类型数据。手绘出统计图的大概形状。
6、1995年人口类蛮状况明1995年人口类型结构 图特大国邓5、根据数据集ex3_4提供的1952-2009年江苏地区生产总值指标,绘制趋势图。根据 Excel作出的图形,手绘出该趋势图的大概形状。(请大家用折线图和散点图分别作图,考虑一下对于我们给出的资料,应该用哪个作图功能是正确的。)19527009年江苏地区生产总值月势图用折线图显示不出年份间隔的不同,散点图则可以,因此对我们提供的数据应该采用散点图来绘制趋势图,而不能用折线图。折线图可以用以绘制年份间隔相同的趋势图。第四章数据的描述性分析1、计算过程:按利润分组(万元)企业数f300以下19300 40030400 50042500 6
7、0018600以上11合计120工 xf 51200=426.67m v 1 ') x 工 f 120组中值xxf(x-x)2f2504750593033.535010500176348.74501890022860.135509900273785.26507150548639.2512001614667s存与上!=7 '、f -1. 120 -1= 116.48 Vs =5 = 11648 =0.273x 426.67% mann +12、(1) J里”划兀成白分比:x H 一I00150250=500- 93 95 %- m一 100150250532 .20E +x1.2
8、1.10.8(2)实际优质品率:一 “ xf 1000.951500.962500.98x ='、:f100150250484500=96.8%3、通过计算标准化值来判断:7 Xa-Xa 115-100 dZ a 1 ,sA15xXb - XbZB 二425 - 4000.550该测试者在A项测试中比平均分数高出1个标准差,而在 B项测试中只高出0.5个标准差,因为A项测试的标准分数高于 B项测试,所以A项测试比较理想。4、3种方法各自的主要描述统计量如下:方法A方法B方法C平均165.6平均128.7333平均125.5333标准误差:0.550325标准误差0.452155标准误差
9、0.716251中位数165中位数129中位数126众数164众数128众数126标准差2.131398标准差1.75119标准差2.774029力差4.542857力差3.066667力差7.695238峰度-0.1345峰度0.454621峰度11.66308偏度0.351371偏度-0.17448偏度-3.23793区域8区域7区域12最小值162最小值125最小值116取大值170取大值132取大值128求和2484求和1931求和1883观测数15观测数15观测数15从集中度、离散程度和分布形状三个角度的统计量来评价。从集中度看,方法A的平均水平最高,方法C最低;从离散程度看,方法A
10、的离散系数最小,方法C最大;从分布的形状看, 方法A和方法B的偏斜程度都不大,方法C则较大。 综合来看,应该选择方法A,因为平均水平较高且离散程度较小。-x xn _ 5、(1) x=55.85 ; Xh= -= 38.86 ; Xg = Sx=47.99 (2)Xh< Xg < xn、1x、(4)原数列原数列+10原数列-10原数列X 10原数列/10平均数55.8565.8545.85558.55.585标准差26.83326.83326.833268.3332.683标准差系数48.05%40.75%58.52%48.05%48.05%6、(1)、(2)最高分最低分平均数标准
11、差专业984572.7310.92一班915672.658.98二班984572.8212.70(3)、 (4)一班成绩f比重(%)向上累计次数向上累计频率向下累计次数向下累计频率60分以下711.29711.2962100.0060-701219.351930.655588.7170-802743.554674.194369.3580-901524.196198.391625.8190以上11.6162100.0011.61合计62100.00-二班成绩f比重(%)向上累计次数向上累计频率向下累计次数向下累计频率60分以下813.33813.3360100.0060-701626.67244
12、0.005286.6770-801525.003965.003660.0080-901525.005490.002135.0090以上610.0060100.00610.00合计60100.00-7、(1) A(2) E (3) C (4) D(5) D (6) B (7) C (8) B (9) D (10)C第五章参数估计s- s1.苹果平均甜度N的置信区间:t统计量:x 土tw2、; z统计量:x士2/2提 n-. n均值14.75量售度置店席954置售度95.4HT舌信隙9强置售度99.91标程差康计里2.晦馈计量2.89埃计里康计里下限14.32下限14.23下限14.22下限14.
13、05下上限区1915.27上限15.29上限15.46遂计里1,64点计里1.952.W僚计里2,58E豌计量TIH14.33下限14.25下限14.24下眼10下隙15.17上限15.25上爆15.26上L15.41上限差值393. 3143Sp170.4304校正系就0.4928下眼214.2959上限572.3326平均教标准差2. 一天:差值493.1375Sp172.4881校正系翻工 2420下曜409.8129匚上限576.4622周:第二种情况:3.第一种情况:13B3.48204.69总人数1Q00抽样平均误差6.469655189概率度1.644863627下限上眼1372
14、- 831394.124.全部选民中支持该候选人的选民所占比重的95%勺近似置信区间p =191/351 =54.42%P -Z:./2p(1 - p) ”54.42%(1 - 54.42%)54.42% -1.945.11351= (49.25%, 59.59%)5.因 93%(1 93%) =6.51%, 95%(1 -95%) =4.75%, 96%(1 96%) =3.84% ,所以根据随大原则,取p(1 - p)的最大值进行计算。重复抽样:n二软 p(1-p)32 父0.931 -0.930032651不重复抽样:n二2z:2 P(1-P)N32 0.93(1 -0.93 50002
15、pN z2/2 p(1 - p) - 0.032 5000 32 0.93 (1-0.935776.答案:选项三;选项二;选项二;选项四;选项一7.答案:选项四;选项一;选项一第六章假设检验1 .从2011年的新生婴儿中随机抽取100名,测得其平均体重为 3180g,样本标准差为250g。在过去的十年,统计资料显示新生婴儿的平均体重为3140g。(1)问现在的新生婴儿的体重是否有显著变化( a =0.05) ?请用t统计量。【解】建立假设 H0: N=3140 H1: N#3140检验统计量:3180二3140250/ .100= 1.6t 的临界值 t005/2 (100-1) =1.984
16、2因为t <t也2;所以 不能拒绝原假设 H0 ,我们没有理由认为新生婴儿的体重发生了改变。或:计算统计量t对应的概率p=0.1128,因为p ;所以不能拒绝原假设H0 ,我们没有理由认为新生婴儿的体重发生了改变。(2)如果将样本量增加到 200名,测得的指标不变,再问现在的新生婴儿的体重是否有显 著变化(a =0.05) ?请分别用t统计量和z统计量,并观察两者的差别。【解】建立假设H0 : N=3140 H1 : N03140检验统计量:1X-口。3180 - 3140t =尸=t = 2.2627 t 的临界值s、n 250/x 200t0.05/2(2 010 =1.9 7 2因
17、为t At 02;所以 拒绝原假设Ho,即认为新生婴儿的体重发生了改变。或:计算统计量t对应的概率p=0.0247,因为p <a ;所以拒绝原假设Ho,即认为新生婴儿的体重发生了改变。检验统计量:x - 3180 -3140z -1= -/ 2.2627 z 的临界值 z005/2 = 1.96s n 250/ ,2000 5/2因为Z Z /2;所以拒绝原假设Ho,即认为新生婴儿的体重发生了改变。或:计算统计量z对应的概率p=0.0237,因为p ;所以拒绝原假设Ho,即认为新生婴儿的体重发生了改变。比较:t和z的临界值相差不大;t和z所对应的概率也相差不大。(3)如果将显著性水平提高
18、到0 =0.01, (2)的结论又如何?【解】t 的临界值 t0.01/2 (200-1) = 2.6008 ; z 的临界值 z0.05/2 = 2.5758因为tct旌、zmz&2所以不能拒绝原假设Ho ,我们没有理由认为新生婴儿的体重发生了改变。或:因为p >口;所以不能拒绝原假设 H0,我们没有理由认为新生婴儿的体重发生了改变。2 .根据以往的经验我们可以假定英语四级考试的成绩是服从正态分布的,已知所在市参考学生的四级考试成绩平均为450分。随机抽查了我们学校25名参考学生的成绩,数据在ex6_1中。问:(1)我们学校四级考试的成绩是否和所在市的成绩显著不同;(2)我们能
19、否认为我校学生四级水平显著高于所在市的水平;(3)我们能否认为我校学生的四级水平显著低于所在市的水平。(口 =0.05)(1)【解】建立假设H0:=450 H1 : ¥450, x - %475.24 -450 八 检验统计量:t =l = 2.2 4 6 8t 的临界值:s、n 56.17/ .25t0.05/2(24) =2.0639因为t Ata/2;所以 拒绝原假设H0,即认为我们学校四级考试的成绩和所在市的成绩显著不同。也可以:计算t对应的概率p值,p=0.0341。因为p <a ;所以 拒绝原假设H0(2)【解】建立假设H 0:<450 H1:450检验统计量
20、:t二475.24 - 45056.17/= 2.2468 t 的临界值:t0.05 (24)=1.711此检验为右侧检验,因此拒绝区在临界值的右边因为t >ta;所以实际值落在拒绝区,即拒绝原假设H。,认为我们学校四级水平显著高于所在市的成绩。也可以:计算t对应的概率p值,p=0.0171。因为p <a ;所以 拒绝原假设H0(3)【解】建立假设 H0:>450 H1:<450475.24 -450检验统计量:t =-=2.2468 t 的临界值:t005 (24) = 1.71156.17/、, 25此检验为左侧检验,因此拒绝区在临界值的左边因为t >ta,所
21、以实际值落在接受区,即不能拒绝原假设Ho ,也就是我们没有理由认为我们学校四级水平低于所在市的成绩。也可以:计算t对应的概率p值,p=0.9829。因为p ;所以 不能拒绝原假设 H0(其实本题不需要进行检验,因为从一个均值大于450的总体中抽到一个均值为475.24的样本-一个大概率事件。)3.检查一批保险丝,假设熔化时间服从正态分布,甲、乙两学生分别抽取16根保险丝,记录下在通过强电流后熔化所需时间(秒),数据在ex6_3中。(1)分别用甲、乙两学生的测量数据进行检验, 能否认为这批保险丝的平均熔化时间不小于63秒(口 = 0.05 ) ? (2)把两个学生的数据合在一起作为一个大样本进行
22、检验,能否认为这批保险丝的平均熔化时间小于 63 秒(a =0.05) ?(1)【解】对于甲:建立假设H0: N之63 H1: Re 63根据样本资料计算得:X = 60.375 s = 8.43X-L检验统1t量t =一上=2.8187t的临界值t0.05(15) = 1.753s x n此检验为左侧检验,因此拒绝区在临界值的左边因为t 3,所以实际值落在拒绝区,即拒绝原假设H。,我们不认为保险丝的平均熔化时间小于63秒。(2)【解】对于乙:建立假设H 0 : >63 H1 :<63根据样本资料计算得:x =63.625 s = 5.40X 一检验统1t量t = 一普=0.462
23、8t的临界值t0.05(15) = 1.753s n此检验为左侧检验,因此拒绝区在临界值的左边因为t >ta,所以实际值落在接受区,即不能拒绝原假设H。,我们没有理由不认为保险丝的平均熔化时间不小于 63秒。(3)【解】对于甲乙合并后的数据:建立假设 H 0 : N之63 H1 :<63根据样本资料计算得:x= 60.34 S = 7.72x 一检验统工t重z =- = -1.9466z的临界值z005 = -1.6449s n此检验为左侧检验,因此拒绝区在临界值的左边因为t <ta,所以实际值落在拒绝区,即拒绝原假设H。,我们不认为保险丝的平均熔化时间不小于63秒。4.假设:H0: H <50% H1: n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预制箱梁制作、运输与施工劳务分包合同范本
- 老宅基地使用权买卖合同书:乡村振兴示范村建设
- 进口航空设备维修与安全保障合同范本
- 面向顶尖人才的高校事业编制教师引进与科研合作合同
- 顺德汽车客运站客运站场租赁及客运车辆租赁服务合同
- 装修施工预算管理办法
- 综合办考核管理办法
- 上海教委退费管理办法
- 中国钻井平台管理办法
- 首发管理办法锁定期
- 提高员工执行力培训课件
- 痰标本采集技术
- 2025年小水电行业当前竞争格局与未来发展趋势分析报告
- 《电机学》课件(共十章)
- 重庆渝湘复线高速公路有限公司招聘笔试真题2024
- 2025年50套普通话测试题及答案
- 2025年广西中考道法真题卷含答案解析
- 婚介专业红娘培训课件
- 物业员工冬装采购方案(3篇)
- 网店客服教案网店客服岗前准备ITMC网店客户服务实训系统介绍
- 全球臭氧变化趋势-第1篇-洞察及研究
评论
0/150
提交评论