版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、)的发1. 数抿科学不仅可以推动数学、计算机科学 . 统计学、天体信息学等学科的发展. 而且又能够大力助推(展与进步。A 基础科学B 流体力学C 星本理论D 产业隐滋答案正确答案: D2x 如果 X 的平均值和标准差分别为 54000 和 16000. 使用 z 分敌规范化方法. X 的( ft 89500 被转换为( )。A 1.56B 1.25C 2.219D 1.19隐液答案正确答案:C. Cyber 空间是指以计算机技术. 现代通倍网络技术、( 竽信息技术的综合运用为基础. 以知识和信息为内容的新型空间.A 电子技术B 虚拟现实技术C 软件技术D 人工智能隐彼答案正确答案: B、 数抿
2、约简主耍有待征约简. 样木约简 . )和数值约简等。A 维数约简B 归一化C 数据变换D 致性隐液答案正确答案: A)。、 假定某属性X 的最小值、最大值分别为 42000 和 98000. 将属性 x=73600 映射到 00 0.1 中的值为 是结构化数据?网页是半结构化敌据。A 关系数据库数据B 视频C 图像D 声音隐濒答案正确答案 : AMapReduce fg 型适于 ()计算 .A 实时B 在线C 离线D?京式隐答案正确答案: C建立挖掘模型.选取或改进挖掘模型都需要验证.最常用的验证方法绘v。A 样本学习B 统计分析C 逻辑推理D 数学期望隐答案正确答案: A数据获取与存储符理是
3、大数据处理) 步。周期的第VB 2C 3D 5正确答案 : A隐激答案15.A 电子世界B 物理世界C 因特网D 广域网正确答案: B大数据主要来口( 与互联网世界。隐液答案16.网页数据绘vA 网站外部数据B 日志数据C 网站内部数据D 高速缓存数据隐激答案正确答案 : A17.大数据的 5 个待性是数抿址性 . () . 速度 . 真实性。A 稀绘性B 关联性C 实用性D 价值隐濒答案正确答案 : D. 多样18.(是NoSQL敌据阵中锻常用的存储方式A键值存倩方式B 按地址存储方式C 图存储方式D 列表存储方式隐液答案正确答案 : A.数据挖掘绘从数据集(可能是不完全的 . 有噪声的 .
4、 不确定性的、各种存储形式的)中挖堀出隐僧在其中的、人们 事先不知的、对抉策有用的()的过程。A 语义网B 产生式C 知识与信息D规划隐滋答案正确答案: C、数据科学是关于()的科学。A 算法B 数据C 倍息D 知识隐彳散答案正确答案: Bx数据挖掘主耍注垂解决分类.聚类.关联和定量定性(零问题?其垂点是寻找未知的模式与规律。A 预测B 检测C研究D 学习隐液答案正确答案: A22、数州清洗算法的衡虽标准主耍包含八错谋返回率和箱确度。A 冗余度B 返回率C 可用性D 一致性隐激答案正确答案 : B23 、奈奎斯待采样定理指出采样频率脱该大?信号中放高频率的(原始信号中的信息:A 2B 4C 6
5、D 3隐濒答案)倍时 . 采样 Z 后的数字倍号才能够完整地保留正确答案 : A1x (木题每个括号里裾要从 ABCD四个选项中选填一个字母?不可垂复)数据规范化的主要方法是(). ()和( )等。A掀小?墩大规范化方法B 模糊规范化方法C Z 分数规范化方法隐藏答案D 小数定标规范化方法正确答案: ACD2x (本题每个括号里雅翌从ABCD 四个选项中选填一个字母.不可重复)不完整数据的清洗绘指对缺失值的填补.主 耍采用的方法是()、() . ()A k? NN 近邻缺失数据填充B 就近补齐C 随机但填充D 平均值填充隐液答案正确答案: ABD(本题每个括号里需耍从ABCD四个选项中选填一个
6、字母?不可垂复)()是样本相对于均值的偏差平方和的平均 . ( )是绝对指标. 其值大小不仅取决于样本数据的分故程度 . ( 是标准差与均值的比值。( )是 指一组测呈值内最大值与掖小值 Z 差 . 又称范闱误差或全距.A 极差B 变异系数C 标准差D 样本方差隐液答案正确答案 : DCBA、(本题每个括号里潘耍从ABCD 四个选项中选填一个字母. 不可垂复)脏数据主耍是指( )、( )和( )?A 垂复数据B 不完整数据C 非结构化数据D 异常数据隐液答案正确答案 : ABD题每个括号里需耍从 ABCD四个选项中选填一个字母.不可垂复)OldSQL适用丁?(八NewSQL适用于() ? No
7、SQL 适用于( )?A事务处理应用B 口志数据存储C 数据分析腹用D 互联网应用隐彼答案正确答案: ACD(本题每个括号里需要从ABCD 四个选项中选填一个字母. 不可垂复)聚类就是将数据集分组为多个类或簇.在同一个簇中的数据对象(记录)Z间具有较高的()?而不同簇中的对象的()就比较大。我们将故落在外 . 不能归并到任何一类中的数据称为()。A 相似度B 模制度C 奇异点D 差别隐激答案正确答案 : ADC(本题每个括)、(号里需耍从 ABCD 四个选项中选填一个字母?不可垂复)网络爬虫流程主要分为()三部分。和(A 存储数据B 寻找网址C 解折网页隐彳散答案D 获取网贝正确答案 : AC
8、D&(本题每个桔号里需耍从 ABCD四个选项中选填一个字母.不可鱼复)均值就址().将一组数据中出现;火数 最多的数值叫(),(是指从小到大排列或从大到小挣列的一组数据中 ?处在中间位置上的一个数据? 一组n个观测值按数值大小排列.处于p%位 置的值称第p )。A 百分位数B 众数C 平均数D 中位数隐答案正确答案 : CBDA(本题每个括号星需要从 ABCD四个选项中选填一个字母.不可垂复)移动平均法是按对过去什干历史数据求算术平均数.并把该数据作为以后时期的预测值。移动平均法分有().()和多次移动平均法。A 寥次平均法B 一伙移动平均法C 二次移动平均法D 多次移动平均法隐液答案正确答案
9、 : BC(本题每个括号里潘要从ABCD四个选项中选填一个字母.不可垂复)从分析的结果来看.大数据分析主耍分为() . () : 从分析的方式来看. 大数据分析主要分为离线数据分析、()和()?A 探索性数据分析B 在线数据分析C 交互式分析D 定性数据分析隐彼答案正确答案: ADBC(本题每个括兮里需要从ABCD 四个选项中选填一个字母. 不可垂复由?数据随若()而变化 . 可以将(变化可视化 . 然后解释&致数据变化的原因A 环境B 时间C 数据D 知识隐激答案正确答案 : BC12、(本题每个括号里需要从 ABCDRII个选项中选填一个字母.不可垂复)网站内部数据主耍有(和()。A 日志
10、数据B 寄存器数据C 数抿库数据D 内存数据隐濒答案正确答案: AC13、(本题每个括号里需耍从ABCDH个选项中选填一个字母 ?不可重芟由大及小的数据展现方式是先给出一个()的 iffitfil. 可以引导读者具体深入到一个()的点,A 一般B 整体C 聚焦D 局部隐濒答案正确答案: BC(本题每个括号里需要从ABCD 四个选项中选填一个字母.不可垂复)在(比较的可视化展现中.可以对数据槃中()的不同方面给出一个有力的叙述与说明A 数据B 平滑处C 不关心D 突出隐彳散答案正确答案: AD(本题每个括弓里需要从 ABCD四个选项中选填一个字母.不可垂复去垂绘指在不同的时间维度内.垂复一个行
11、为产生的数据只计入一次v 按( )维度去莹主耍分为按小时去垂. 按口去重 . 按 正确答案:错决A 正确通过 )相同的分析A 正确B 错课隐答案正确答案:正确维数约简是便用编码机制来增大数据集的规模。VA 正确B 错谋隐濒答案正确答案:错谋将抽仪的指标敌据转换成我们熟悉的容易感知的敌据时.用户便更不容易理解图形耍我达的恿义。vA 正确B 错谋隐液答案正确答案:错谋22、噪声绘拆3!遨抵中的随机错谋和偏差.通过数据平滑技术可以识别噪彳行。V)A 正确B 错谋隐濒答案正确答案:错决、虽然约简后的数抿集变小而且不能保持原始数据的完整性. 但在这样的数据集卜 ?挖掘 . 仍然能够获得与约简前结果 .
12、()A 正确B 错谋隐藏答案正确答案:正确.离线敌据分析是指将待分析的敌据先存储?皱盘中然后进行数抿分析.离线数据分析用于较复朵和耗时的数据分析和批处理. ()B 错谋隐液答案正确答案 : 正确、探索性敌据分析是从某种假设出发 . 去探索其内在的数据规律性。 A 正确B 错误隐液答案正确答案:错决、计舁机科学是尊法与算法变换的科学 ?数抿科学是关 ?数抿的科学 ?数据科学是为研处探索Cyber 空间中数据界的 理论、方法和技术 . ()A 正确B 错谋隐液答案正确答案:正确.数揣分析是从一个假设出发.需翌口行选择方程或模型来与假设匹配.而数据挖掘不需耍假设.可以自动建立模型()A 正确B 错谋
13、隐液答案正确答案:正确.同构同质数据库是指同一类型的数据模型.问一型号的数据库系统*同构异质数据库杲指同一类型的敌占出 H 八不 问型号的数据库系统?()A 正确B 错谋隐濒答案正确答案:正确29、分箱平滑法堆-种数据局部平滑方法.它是通过考察所有的数据来平滑存储敌据B 错谋隐液答案正确答案 : 错谋30、MapReduce i+A将数据存储到内存中.然后对存储在硬盘中的静态数据进行集中计浓()A 正确B 错误隐液答案正确答案:错误. 在通常情况下. 聚类算法不是计算两个样本间的相似度. 而是用特征空间中的胆离作为度址标准来计算淅个样本间 的相异度 .()A 正确B 错谋隐激答案正确答案:正确
14、.全虽抽取类似?数据迁移或数抵复制.它将抽取数据源中发生改变的故据,把这些改变的数据从数据库中抽取出来?并转换成抽取工具可以识别的格式?()A 正确B 错谋隐濒答案正确答案:错决33、文本由记录组成.可以将整条记录看成一个字符巾来计算其相似度.再按某些规则合成得到文本相似度。A 正确B 错谋隐答案正确答案:正确34、离线数据处理技术比在线敌据处理技术成熟.MapReduce分布编程模型是一种三压计算.核心问题眦是利用并行化解决大数据址或大计算址的何题,( )B 错谋隐液答案正确答案 : 正确大数据址集成一般将处 理过程分布到源敌据上进行并行处理.并仅对结果进行集成。VA 正确B 错误隐液答案正确答案:正确传统数据获取与大数据获取方式相同。v )A 正确B 错谋隐液答案正确答案:错谋37、科学大数据的垂耍持点Z 一是有一定的科学规律可循。vA 正确B 错谋隐藏答案正确答案:正确38、如数据不完整.数据不一致.数据垂烫等?数据也能够有效地被利用。vA 正确B 错谋隐液答案正确答案:错谋39、数据快速大虽地产生并存储在Cyber空间中的现称为数据爆炸,()A 正确B 错谋隐液答案正确答案:正确40、网站内部数据与网站本身最为密切相关的数据是网站分析最常用的数据来源。VA
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年热带雨林幼儿园
- 2026年幼儿园营养搭配
- 2025年中国双孔单把面盆龙头市场调查研究报告
- 2025年中国单刀行书纪念壶市场调查研究报告
- 2026年幼儿园蔬菜分类
- 2026年美味的水果幼儿园
- 2026年幼儿园国学启蒙
- 线上激进投资者投资顾问服务协议书
- 财务分析2026年财务分析服务委托合同协议
- 2026年幼儿园认识虾子
- 中长导管健康宣教
- 期中测试卷(含答案)三年级英语下册辽师大版
- 学前教育毕业综述
- DB62T 3136-2023 公路沥青路面施工技术规范
- 江苏省南通市海安市2024-2025学年高二下学期4月期中生物试题(原卷版+解析版)
- 2025年入团考试团队效果试题及答案
- 疟疾防控知识试题及答案
- 肝包虫超声课件
- 西美附中英语考题及答案
- 东南大学版三基内科
- 倪海厦汉唐药方全集
评论
0/150
提交评论