




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年统计学专业期末考试:数据分析计算题库与数据管理算法试题考试时间:______分钟总分:______分姓名:______一、数据描述与展示要求:运用所学的描述性统计方法,对以下数据集进行描述,并绘制相应的图表。1.计算以下数据集的平均数、中位数、众数、标准差、极差和方差。数据集:[10,20,30,40,50,60,70,80,90,100]2.以下数据集的分布情况,请分别计算以下指标:数据集:[5,7,8,9,10,10,11,12,13,14,15,16,17,18,19,20](1)计算均值、中位数、众数、标准差、极差和方差。(2)判断该数据集是正态分布、偏态分布还是均匀分布。3.请对以下数据集进行分组,并计算每组的频率和频率密度。数据集:[2,3,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]分组:[2,4],[5,7],[8,10],[11,13],[14,16],[17,19]4.根据以下数据集,绘制直方图和频率多边形。数据集:[1,2,3,4,5,6,7,8,9,10]5.请根据以下数据集,绘制茎叶图。数据集:[23,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60]6.请根据以下数据集,绘制散点图和散点图的相关系数。数据集:[1,2,3,4,5,6,7,8,9,10],[2,3,4,5,6,7,8,9,10,11]7.请根据以下数据集,绘制饼图和扇形图。数据集:[1,2,3,4,5,6,7,8,9,10]8.请根据以下数据集,绘制箱线图。数据集:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]9.请根据以下数据集,绘制直方图和频率多边形。数据集:[2,3,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]10.请根据以下数据集,绘制茎叶图。数据集:[23,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60]二、数据管理算法要求:运用所学的数据管理算法,对以下数据集进行操作。1.请对以下数据集进行排序,并输出排序后的结果。数据集:[3,5,1,4,2,6,7,8,9,10]2.请从以下数据集中删除重复的元素,并输出结果。数据集:[1,2,2,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10]3.请对以下数据集进行去重,并输出结果。数据集:[2,3,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60]4.请从以下数据集中删除缺失值,并输出结果。数据集:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100]5.请对以下数据集进行筛选,保留满足条件的元素,并输出结果。数据集:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100]条件:元素大于10且小于206.请对以下数据集进行分组,并计算每组的平均值和标准差。数据集:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100]分组:[1,5],[6,10],[11,15],[16,20],[21,25],[26,30],[31,35],[36,40],[41,45],[46,50],[51,55],[56,60],[61,65],[66,70],[71,75],[76,80],[81,85],[86,90],[91,95],[96,100]7.请对以下数据集进行排序,并输出排序后的结果。数据集:[3,5,1,4,2,6,7,8,9,10]8.请从以下数据集中删除重复的元素,并输出结果。数据集:[1,2,2,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10]9.请对以下数据集进行去重,并输出结果。数据集:[2,3,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60]10.请从以下数据集中删除缺失值,并输出结果。数据集:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100]四、假设检验要求:运用所学的假设检验方法,对以下数据集进行检验。1.已知某产品的重量服从正态分布,假设其均值为50克,标准差为5克。现从生产线上抽取了10个样本,其重量分别为[49,51,52,53,54,55,56,57,58,59]克。请进行t检验,判断该产品的重量均值是否显著不同于50克。2.某批次的零件长度服从正态分布,假设其均值为10厘米,标准差为1厘米。现从该批次中抽取了15个样本,其长度分别为[9.8,10.2,10.3,10.5,10.7,10.9,11.0,11.2,11.3,11.5,11.6,11.8,11.9,12.0,12.1]厘米。请进行z检验,判断该批次零件的长度均值是否显著不同于10厘米。3.某工厂生产的电池寿命服从正态分布,假设其均值为500小时,标准差为50小时。现从该工厂生产的电池中抽取了20个样本,其寿命分别为[475,525,530,540,550,560,570,580,590,600,610,620,630,640,650,660,670,680,690,700]小时。请进行卡方检验,判断该工厂生产的电池寿命的方差是否显著不同于2500小时^2。4.某公司招聘员工,对面试官进行评分,评分标准为1-5分。现从面试官中抽取了10位面试官,对20位应聘者的评分分别为[4,3,5,2,4,5,3,4,5,2,4,5,3,4,5,2,4,5,3,4]分。请进行卡方检验,判断评分的分布是否服从均匀分布。5.某城市居民的平均收入为5000元,标准差为1000元。现从该城市中抽取了30户居民,其收入分别为[4500,5200,4700,5500,4800,5300,4600,5400,4900,5100,4700,5300,4800,5400,4600,5400,4900,5100,4700,5300,4800,5400,4600,5400,4900,5100,4700,5300,4800,5400]元。请进行t检验,判断该城市居民的平均收入是否显著不同于5000元。6.某药品的疗效数据如下:有效率为[0.60,0.70,0.65,0.75,0.80,0.85,0.90,0.95,0.70,0.75,0.80,0.85,0.90,0.95,0.60,0.70,0.65,0.75,0.80,0.85,0.90,0.95,0.60,0.70,0.65,0.75,0.80,0.85,0.90,0.95]%。请进行卡方检验,判断该药品的疗效是否显著。五、回归分析要求:运用所学的回归分析方法,对以下数据集进行回归分析。1.某地区房价(单位:万元)与面积(单位:平方米)的数据如下:面积:[50,60,70,80,90,100,110,120,130,140]房价:[30,35,40,45,50,55,60,65,70,75]请进行线性回归分析,建立房价与面积之间的回归模型。2.某商品的销售量(单位:件)与广告费用(单位:万元)的数据如下:广告费用:[2,3,4,5,6,7,8,9,10,11]销售量:[50,60,70,80,90,100,110,120,130,140]请进行线性回归分析,建立销售量与广告费用之间的回归模型。3.某地区的GDP(单位:亿元)与人口(单位:万人)的数据如下:人口:[100,150,200,250,300,350,400,450,500,550]GDP:[500,600,700,800,900,1000,1100,1200,1300,1400]请进行线性回归分析,建立GDP与人口之间的回归模型。4.某地区的水资源消耗量(单位:万立方米)与降水量(单位:毫米)的数据如下:降水量:[100,150,200,250,300,350,400,450,500,550]水资源消耗量:[50,60,70,80,90,100,110,120,130,140]请进行线性回归分析,建立水资源消耗量与降水量之间的回归模型。5.某地区的居民收入(单位:元)与消费水平(单位:元)的数据如下:居民收入:[5000,6000,7000,8000,9000,10000,11000,12000,13000,14000]消费水平:[4000,5000,6000,7000,8000,9000,10000,11000,12000,13000]请进行线性回归分析,建立居民收入与消费水平之间的回归模型。6.某地区的旅游收入(单位:亿元)与游客数量(单位:万人次)的数据如下:游客数量:[100,150,200,250,300,350,400,450,500,550]旅游收入:[5,6,7,8,9,10,11,12,13,14]请进行线性回归分析,建立旅游收入与游客数量之间的回归模型。六、时间序列分析要求:运用所学的时序分析方法,对以下数据集进行时序分析。1.某地区近5年的GDP(单位:亿元)数据如下:年份:[2016,2017,2018,2019,2020]GDP:[500,510,520,530,540]请进行时序分析,建立GDP的时间序列模型。2.某公司近5年的销售额(单位:万元)数据如下:年份:[2016,2017,2018,2019,2020]销售额:[100,110,120,130,140]请进行时序分析,建立销售额的时间序列模型。3.某地区近5年的降水量(单位:毫米)数据如下:年份:[2016,2017,2018,2019,2020]降水量:[100,150,200,250,300]请进行时序分析,建立降水量的时间序列模型。4.某公司近5年的员工数量(单位:人)数据如下:年份:[2016,2017,2018,2019,2020]员工数量:[100,150,200,250,300]请进行时序分析,建立员工数量的时间序列模型。5.某地区近5年的房价(单位:万元/平方米)数据如下:年份:[2016,2017,2018,2019,2020]房价:[5000,5100,5200,5300,5400]请进行时序分析,建立房价的时间序列模型。6.某公司近5年的利润(单位:万元)数据如下:年份:[2016,2017,2018,2019,2020]利润:[100,110,120,130,140]请进行时序分析,建立利润的时间序列模型。本次试卷答案如下:一、数据描述与展示1.平均数:(10+20+30+40+50+60+70+80+90+100)/10=55中位数:第5个数和第6个数的平均值,即(50+60)/2=55众数:每个数都是众数标准差:sqrt(((10-55)^2+(20-55)^2+(30-55)^2+(40-55)^2+(50-55)^2+(60-55)^2+(70-55)^2+(80-55)^2+(90-55)^2+(100-55)^2)/10)≈20.48极差:100-10=90方差:(10-55)^2+(20-55)^2+(30-55)^2+(40-55)^2+(50-55)^2+(60-55)^2+(70-55)^2+(80-55)^2+(90-55)^2+(100-55)^2)/10≈802.42.均值:(5+7+8+9+10+10+11+12+13+14+15+16+17+18+19+20)/16=11.5中位数:第8个数,即12众数:10标准差:sqrt(((5-11.5)^2+(7-11.5)^2+(8-11.5)^2+(9-11.5)^2+(10-11.5)^2+(10-11.5)^2+(11-11.5)^2+(12-11.5)^2+(13-11.5)^2+(14-11.5)^2+(15-11.5)^2+(16-11.5)^2+(17-11.5)^2+(18-11.5)^2+(19-11.5)^2+(20-11.5)^2)/16)≈3.19极差:20-5=15方差:(5-11.5)^2+(7-11.5)^2+(8-11.5)^2+(9-11.5)^2+(10-11.5)^2+(10-11.5)^2+(11-11.5)^2+(12-11.5)^2+(13-11.5)^2+(14-11.5)^2+(15-11.5)^2+(16-11.5)^2+(17-11.5)^2+(18-11.5)^2+(19-11.5)^2+(20-11.5)^2)/16≈9.93数据集为正态分布。3.分组频率和频率密度:分组:[2,4],[5,7],[8,10],[11,13],[14,16],[17,19]频率和频率密度计算需要具体数据,无法在此给出。4.直方图和频率多边形:需要根据具体数据绘制。5.茎叶图:需要根据具体数据绘制。6.散点图和相关系数:需要根据具体数据绘制。二、数据管理算法1.排序后的结果:[1,2,3,4,5,6,7,8,9,10]2.删除重复元素后的结果:[1,2,3,4,5,6,7,8,9,10]3.去重后的结果:[2,3,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60]4.删除缺失值后的结果:[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国普通型服装剪市场调查研究报告
- 2025至2031年中国纯中药祛屑洗发露行业投资前景及策略咨询研究报告
- 2025年中国方形室外空调机数据监测研究报告
- 2025年中国数控机床配套用回转油缸市场调查研究报告
- 肇庆市实验中学高中生物三:生态系统的物质循环导学案
- 肇庆市实验中学高中历史一:第课爱琴文明与古希腊城邦制度教案
- 2025-2030年中国PC钢棒行业发展态势及投资战略研究报告
- 新疆农业大学科学技术学院《婴幼儿早期教育指导岁》2023-2024学年第二学期期末试卷
- 新疆维吾尔喀什地区塔什库尔干塔吉克自治县2024-2025学年数学三下期末检测试题含解析
- 2025-2030年中国SMZ磺胺甲恶唑原料药行业运行态势及投资价值研究报告
- 9.2严格执法 课件-高中政治统编版必修三政治与法治
- 药用植物学智慧树知到答案2024年浙江中医药大学
- 元模型与元体系结构
- 评职称业绩合同协议书
- 09BJ13-4 钢制防火门窗、防火卷帘
- DL∕T 553-2013 电力系统动态记录装置通 用技术条件
- 2024年广东省初中学业水平考试中考英语试卷(真题+答案解析)
- 《配电自动化概述》课件
- 原电池教学设计
- 观赏鱼饲养智慧树知到期末考试答案章节答案2024年华南农业大学
- FZT 93048.2-2021 针刺机用针 第2部分:叉形针
评论
0/150
提交评论