2026年《云计算与大数据》期末考试试题及答案_第1页
2026年《云计算与大数据》期末考试试题及答案_第2页
2026年《云计算与大数据》期末考试试题及答案_第3页
2026年《云计算与大数据》期末考试试题及答案_第4页
2026年《云计算与大数据》期末考试试题及答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年《云计算与大数据》期末考试试题及答案一、单项选择题(每题2分,共20分)1.某企业需构建支持弹性扩展的数据分析平台,要求底层资源按需分配且无需管理物理服务器。其最佳云计算服务模式选择为()A.IaaSB.PaaSC.SaaSD.DaaS答案:B2.大数据处理中,以下哪项技术主要用于解决“实时流数据低延迟处理”问题?()A.HadoopMapReduceB.SparkRDDC.FlinkDataStreamD.HBase答案:C3.云原生架构中,服务网格(ServiceMesh)的核心功能是()A.资源弹性伸缩B.服务间通信与安全C.容器编排调度D.日志集中管理答案:B4.某金融机构需存储PB级客户交易明细数据,要求支持多版本历史查询且存储成本低。最适合的存储方案是()A.对象存储(如AWSS3)B.块存储(如iSCSI)C.文件存储(如NFS)D.关系型数据库(如MySQL)答案:A5.以下不属于大数据“5V”特征的是()A.Volume(规模大)B.Velocity(速度快)C.Variability(多变性)D.Value(价值密度低)答案:C6.边缘计算与云计算协同场景中,边缘节点的主要作用是()A.存储全局历史数据B.处理实时性要求高的本地数据C.提供大规模并行计算能力D.管理云资源调度策略答案:B7.某电商平台需对用户行为数据进行实时推荐,要求处理延迟小于100ms。其大数据处理架构应优先选择()A.批处理(BatchProcessing)B.流处理(StreamProcessing)C.交互式处理(InteractiveProcessing)D.图处理(GraphProcessing)答案:B8.Serverless架构的核心优势是()A.完全无需管理服务器B.支持无限并发C.降低开发复杂度D.保证100%可用性答案:C9.数据湖(DataLake)与数据仓库(DataWarehouse)的主要区别在于()A.数据存储格式(结构化vs非结构化)B.数据处理速度(快vs慢)C.数据用途(分析vs存储)D.数据规模(大vs小)答案:A10.云计算中,“多租户隔离”主要通过以下哪种技术实现?()A.虚拟化(Virtualization)B.容器化(Containerization)C.软件定义网络(SDN)D.加密传输(TLS)答案:A二、填空题(每空2分,共20分)1.云计算的三种典型服务模式是IaaS、PaaS和________。答案:SaaS2.Hadoop生态中,负责分布式存储的核心组件是________,负责资源调度的组件是________。答案:HDFS(Hadoop分布式文件系统);YARN(YetAnotherResourceNegotiator)3.大数据实时处理框架Flink的核心抽象是________和________。答案:流(Stream);状态(State)4.云原生技术栈的“三驾马车”通常指容器化、________和微服务。答案:服务网格(ServiceMesh)5.数据湖的典型存储格式包括Parquet、________和ORC。答案:Avro6.边缘计算的关键技术包括边缘节点部署、________和低延迟通信。答案:本地数据处理7.分布式计算中,Spark的RDD(弹性分布式数据集)具有________和________特性,支持容错。答案:不可变(Immutable);可分区(Partitioned)三、简答题(每题8分,共40分)1.简述云计算中“弹性伸缩”的实现原理及典型应用场景。答案:弹性伸缩通过监控系统实时采集资源使用指标(如CPU、内存、网络流量),当指标超过阈值时,自动触发扩容(增加实例)或缩容(减少实例)操作。底层依赖虚拟化或容器技术快速创建/销毁实例,并通过负载均衡器重新分配流量。典型场景包括电商大促期间的流量高峰应对、视频直播的并发访问支持、大数据计算任务的临时资源需求。2.对比HadoopMapReduce与Spark的技术差异,说明Spark在哪些场景下更具优势。答案:技术差异:MapReduce基于磁盘计算,任务分为Map和Reduce阶段,中间结果需落盘;Spark基于内存计算,通过RDD缓存中间结果,支持DAG(有向无环图)执行计划。优势场景:需要多次迭代计算的任务(如机器学习训练、图计算)、交互式数据分析(低延迟查询)、流批一体处理(结合SparkStreaming),因内存计算减少了IO开销,性能提升显著(通常快10-100倍)。3.数据湖与数据仓库的核心区别有哪些?企业如何选择两者的应用场景?答案:核心区别:(1)数据类型:数据湖存储结构化、半结构化、非结构化数据(如日志、图片、文本),数据仓库仅存储结构化数据;(2)处理阶段:数据湖在存储时不强制模式(Schema-on-Read),数据仓库需预先定义模式(Schema-on-Write);(3)用途:数据湖支持多场景分析(如AI训练、实时查询),数据仓库主要支持结构化报表与OLAP。选择策略:需处理多类型原始数据、支持探索性分析时选数据湖;需高效支持固定业务指标的结构化查询时选数据仓库;通常采用“数据湖+数据仓库”混合架构,湖仓一体(Lakehouse)是发展趋势。4.云原生架构中,容器化(如Docker)与传统虚拟化(如VMware)的主要区别是什么?各自适用场景如何?答案:区别:(1)隔离层级:虚拟化通过Hypervisor模拟硬件,容器通过LinuxNamespace/Cgroups实现进程级隔离;(2)资源占用:容器共享宿主机内核,资源开销小(启动秒级,内存占用MB级),虚拟化需运行独立OS(启动分钟级,内存GB级);(3)灵活性:容器更轻量,适合微服务的快速部署与弹性伸缩;虚拟化提供更彻底的隔离,适合需要独立OS环境的场景。适用场景:容器适用于云原生微服务架构、DevOps持续交付;虚拟化适用于需要强隔离的传统应用迁移、单租户专用资源场景。5.大数据隐私保护中,“联邦学习”(FederatedLearning)的核心思想是什么?与传统数据集中处理模式相比有何优势?答案:核心思想:在不移动原始数据的前提下,通过本地训练模型、上传模型参数(如梯度)的方式实现跨机构联合建模,数据“可用不可见”。优势:(1)隐私性:避免数据泄露风险(如医疗、金融等敏感数据);(2)合规性:符合GDPR、《个人信息保护法》等法规对数据本地化的要求;(3)效率性:减少数据传输成本,尤其适用于分布式设备(如手机、IoT终端)的协同学习。四、综合应用题(共20分)某零售企业计划构建“用户行为分析与精准营销”大数据平台,需求如下:数据来源:APP端点击流(实时,日均500GB)、线下门店POS交易(批量,日均100GB)、会员信息(结构化,存储于MySQL);分析需求:实时用户画像(性别/年龄/偏好)、促销活动效果实时评估(点击-下单转化率)、未来7天销量预测(基于历史数据);约束条件:存储成本可控,支持弹性扩展,需满足数据隐私合规(用户敏感信息不可出域)。请设计平台技术架构,需明确各组件功能及数据流程,并说明关键技术选型理由。答案:技术架构设计(总分20分,按以下要点评分)1.数据采集层(4分)实时数据(APP点击流):使用FlinkCDC或KafkaConnect采集,通过Kafka消息队列缓冲(高吞吐、低延迟);批量数据(POS交易):通过Sqoop或DataX定时(每日凌晨)导入HDFS或对象存储;会员信息(MySQL):通过Canal监听Binlog实现增量同步,或定时全量同步至数据湖。2.数据存储层(4分)实时数据暂存:Kafka(保留7天,支持重复消费);原始数据湖:对象存储(如AWSS3/阿里云OSS),存储格式为Parquet(列式存储,压缩率高,支持Schema演进),成本低于块存储;结构化数据:Hive数据仓库(元数据管理)+DeltaLake(支持ACID事务,满足湖仓一体需求);高性能查询:ClickHouse(实时OLAP,支持用户画像快速查询)或StarRocks(MPP架构,高并发)。3.数据处理层(6分)实时处理:Flink流处理(低延迟,<100ms),完成点击流清洗(去重、过滤无效事件)、用户行为关联(如将点击事件与会员ID绑定);批量处理:Spark批处理(夜间运行),计算POS交易的聚合指标(如门店日销售额、商品销量TOP10);机器学习:使用SparkMLlib或TensorFlowonYARN训练销量预测模型(特征包括历史销量、促销活动、天气等),模型输出至缓存(Redis)供实时调用。4.分析与应用层(4分)实时用户画像:ClickHouse存储用户标签(性别/年龄/偏好),通过API接口(如RESTful)提供给营销系统;促销效果评估:Flink实时计算转化率(下单数/点击数),结果输出至可视化平台(Grafana或Superset);销量预测:模型每日更新,预测结果写入Hive或MySQL,供运营人员查看。5.隐私与安全(2分)用户敏感信息(如手机号、身份证号)在采集时脱敏(哈希加密或部分替换),存储时使用加密存储(如AWSSSE-S3);联邦学习:若需跨门店联合建模(如不同区域用户偏好),采用联邦学习框架(如FedML),仅传输模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论