版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、南开大学20秋学期大数据导论在线作业(参考答案)大数据的特点不包含()。A.数据体量大B.价值密度高C.处理速度快D.数据不统一大数据的最显著特征是()。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段?()A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段下列哪个工具常用来开发移动友好地交互地图?()A.LeafletB.Visual.lyC.BPizza Pie ChartsD.Gephi医疗健康数据的基本情况不包括以下哪项?()A.诊疗数据B.个人健康管理数据C.公共安全数据D.健康档案数据数据仓库是随着时间
2、变化的,下列不正确的是()。A.数据仓库随时间变化不断增加新内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容D.数据仓库中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合IaaS是()的简称。A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务哪个选项不属于大数据4V特点?()A.VolumeB.ValidC.VarietyD.Value第一个提出大数据概念的公司是()。A.麦肯锡公司B.谷歌公司C.微软公司D.脸谱公司MapReduce中的Map和Reduce函数使用()进行输入输出。A.key/value对B.随机数值C.其他计算结果数
3、据清洗的方法不包括()。A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理以下不是数据仓库基本特征的是()。A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的下列不属于Google云计算平台技术架构的是()。A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2下列哪个R语言扩展包可以创建带有点和边的网络图?()A.ggplot2B.networkC.ggmapsD.animation基础设施即服务的英文简称是()。A.IaaSB.PaaSC.SaaS大数据时代预
4、测人类移动行为的数据特点是()。A.多样化B.数据量大C.维数高D.变化快借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。A.消费能力B.趋势报告C.购物结果关于R语言扩展包下列正确的是()。A.network可创建带有点和边的网络图B.animation可制作一系列的图像并将它们串联起来做成动画C.ggmaps通过树图来可视化层次型数据D.protfolio基于谷歌地图、OpenStreetMap及其他地图的空间数据可视化工具网络数据采集常用的是通过()或()等方式从网站上获取数据信息。A.网络爬虫B.网站公开APIC
5、.手动获取数据分析的类型根据数据分析深度可以分为()。A.描述性分析B.预测性分析sC.规则性分析数据变换(Data Transformation)的方法有()。A.光滑B.聚集C.数据泛化D.规范化按照数据量的大小,可将数据分析分为()。A.内存级数据分析B.Bl级数据分析C.海量级数据分析D.巨量级数据分析可使用(),(),()进行光滑。A.最大值B.箱中位数C.箱边界D.箱均值常见的分类方法有()。A.决策树B.贝叶斯网络C.遗传算法D.FP算法医疗大数据特点:除了包含了大数据4个“V”的特点之外还有()。A.多态性B.时效性C.不完整性D.冗余性大数据在医疗中的应用有()。A.流行性疾
6、病预防B.慢性病健康管理C.临床决策支持D.医疗器械研发一个HDFS集群由一个()和()构成。此外,还有与这两个角色之间作为沟通桥梁的客户端(Client)。A.一个名字节点B.若干个名字节点C.一个数据节点D.若干个数据节点主流分布式计算平台有()。A.googleB.IBMC.baiduD.Amazon大数据存储的特点与挑战有()。A.容量问题B.延迟问题C.安全问题D.成本问题百度大数据引擎主要包含()三大组件。A.开放云B.数据工厂C.百度大脑。减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。()A.正确B.错误广播变量在广播后可以修改。()A.正确B.错误
7、内存级分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。()A.正确B.错误云存储中用户需要按需付费并使用存储服务。()A.正确B.错误云存储是指通过集群应用、网络技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。()A.正确B.错误每个变量的最大值和最小值之差称为极差。()A.正确B.错误数据变换(Data Transformation)就是把原始数据转化为适合于数据挖掘的数据形式。()A.正确B.错误利用大数据技术对电子病历中的数字化信息进行分析处理,既能够让医
8、生的诊疗有迹可循,还可以发现最有效的临床路径,从而及时为医生提供最佳的诊疗建议。()A.正确B.错误数据集成(Data Integration)是将多个数据源中的数据合并存放到一个一致的数据存储中。()A.正确B.错误美国自然(Nature)杂志专刊The next google,第一次正式提出“大数据”概念。()A.正确B.错误用一个函数拟合数据来光滑数据称为回归。()A.正确B.错误RDD是一种自定义的可并行数据容器,可以存放任意类型的数据。()A.正确B.错误BI分析适用于总数据量在集群内存的最大级别以内的情况,使用内部数据库技术,适合实时业务分析需求。()A.正确B.错误云存储是一个由
9、网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等组成的复杂系统。()A.正确B.错误轨迹数据包含空间和时间属性,并且通常规模巨大且维度高。()A.正确B.错误预测性分析(Predictive Analysis)用于预测未来事件发生的概率和演化趋势。()A.正确B.错误数据存取和共享机制是大数据发展面临的挑战。()A.正确B.错误21世纪时数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓宽了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。()A.正确B.错误交通数据集通常包括空间和时间特性而且跨越大范围的时间空间。数据聚类可以有效的减小数据规模为随后的分析提供便利。()A.正确B.错误社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。()A.正确B.错误 参考答案:D参考答案:A参考答案:C参考答案:A参考答案:C参考答案:C参考答案:C参考答案:B参考答案:A参考答案:A参考答案:D参考答案:B参考答案:D参考答案:B参考答案:A参考答案:BCD参考答案:AB参考答案:AB参考答案:AB参考答案:ABC参考答案:ABCD参考答案:ABC参考答案:BCD参考答案:ABC参考答案:ABCD参考答案:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 与上级汇报工作制度
- 供电所值班工作制度
- 习酒制酒工工作制度
- 人财物管理工作制度
- 骨科护理质量控制与护理质量改进经验分享
- 业务监督岗工作制度
- 健身房卫生工作制度
- 办事处加强工作制度
- 办公室科室工作制度
- 动物救助站工作制度
- 2025版幼儿园章程幼儿园办园章程
- 《物流经济地理》课件(共十二章)-下
- 《大学英语》课程说课说课
- 2025年事业单位招聘考试职业能力倾向测验试卷(造价工程师类)
- 《技术经济》课件(共九章)
- 煤矿安全学习平台
- 推掌防御反击技术课件
- 外科ICU职业防护课件
- DB31/T 1339-2021医院多学科诊疗管理规范
- 浙江奇斌钢管科技有限公司年加工3万吨无缝钢管生产线项目环境影响报告表
- DB41T 1021-2015 衰老古树名木复壮技术规程
评论
0/150
提交评论