2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第1页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第2页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第3页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第4页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024年人工智能训练师(初级)职业鉴定理论考试题库及答

一、单选题

1.下列关丁语音标注注意事项描述错误的是()。

A、背景噪音过大的,需标为无效

B、语音标注过程最好使用降噪耳机

C、确定标注文件中是否包含有效语音

D、带有口音的内容,需标为无效

答案:D

2.数据清洗的基本流程中纠正发现的错误的操作不包括0。

A、确认并改正

B、属性分离

C、定义数据清洗策略

D、标准化

答案:C

3.数据标注可依照标注的构成形式进行分类,下列不属于其分类的是()。

A、结构化标注

B、文本标注

C、非结构化标注

D、半结构化标注

答案:B

4.以下对于Excel基本操作的说法正确的是()。

A、Excel单元格的缺省字体中文为“宋体",英文为"TimeNewRoman"

B、Excel无法设置单元格边框线的粗细

C、在Excel中文字数值类型的水平对齐方式默认为右对齐

D、在Excel中字符类型的水平对齐方式默认为右对齐

答案:D

5.下列不属于数据标注图像处理工具的是()。

A、BitEdit处理软件

B、Nuend。处理软件

GPalEdit处理软件

D、Convert处理软件

答案:B

解析:

Nuendo是音频制作软件

6.下列关于数据集划分后,各数据集对应作用描述正确的是0。

A、测试集用来查看训练效果的

B、验证集是用来测试模型的实际学习能力的

C、训练集是用来训练算法模型的

D、分析集是用来分析模型运算情况

答案:C

解析:测试集用来检验最终选择最优的模型的性能如何

7.以下关于数据清洗中重复数据的处理方法,描述不正确的选项是0。

A、在数据库中,对于属性值相同的记录,可以将其看作是重复记录数据,相等

的记录可以合并为一条记录

B、合并或消除是处理重复数据的基本方法

C、重复数据检测主要分为基于字段和基于记录的重复检测

D、对于属性值相同的记录一般是将它们的记录时间进行修改以进一步区分

答案:D

8.下列关于大规模非结构化数据存储的描述错误的是___o

A、非结构化数据没有预定义的模型

B、文本、图片和音频属于典型的非结构化数据

C、非结构化数据适用于关系型数据库存储

D、大规模的非结构化数据存储需要使用非关系型数据库

答案:C

9.以下对遵纪守法的意义叙述错误的是()。

A、遵纪守法可能导致社会混乱和动荡

B、遵纪守法是社会活动的基本准则

C、遵纪守法是公平和正义的基石

D、遵纪守法有助于建立社会信任

答案:A

10.数据仓库中基于数据源的“脏”数据质量问题可分为两类,即()。

A、单因素数据源和多因素数据源问题

答案:C

14.数据采集时,应当注意的事项包含:()、采集质量。

A、深度理解、及时沟通

B、深度理解、建立采集规范

C、建立规范、及时去重

D、及时沟通、及时去重

答案:A

15.以下关于WindowslO“邮件”应用的操作的说法正确的是()。

A、“邮件”应用无法设置个性化界面颜色

B、“邮件”应用不可以自定义账户在应用中的名称

C、“邮件”应用可以通过【管理账户】选项添加邮件账户

D、“邮件”应用发送邮件无法插入图片、文件等附件

答案:C

16.介于完全结构化数据和完全无结构化数据之间的数据被称为()。

A、半结构化数据

B、非结构化数据

C、单结构化数据

D、复杂结构化数据

答案:A

17.以下关于自然语言处理相关描述不正确的选项是()。

A、自然语言处理的研究目的是实现自然语言通信的计算机系统

B、自然语言处理是计算机科学领域与人工智能领域中的一个重要方向

C、自然语言处理是一门机械工程学、计算机科学、数学于一体的科学

D、自然语言处理研究的是人与计算机之间用自然语言进行有效沟通的各种理论

和方法

答案:C

18.在统计学中,用()去估计总体参数的过程称为参数估计。

A、样本均值

B、样本中位数

C、总体均值

D、样本统计量

答案:D

19.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法

不正确的是()。

A、在使用“DirectQuery”选项时,在每次查看数据时不需要每次手动刷新数据

B、在使用“导入”选项时,PowerBI获取最新数据后会断开与数据库连接

C、在使用“DirectQuery”时,PowerBI不会将数据装载到内部数据库

D、“DirectQuery”适用于数据经常更新的情况

答案:D

20.对于数据清洗方法,以下说法错误的是0。

A、使用排序与合并是错误值的清洗方法之一

B、数据缺失值的清洗方法主要分为忽略缺失值数据和填充缺失值数据

C、使用简单规则库是错误值的清洗方法之一

D、清洗重复值的方法主要有相似度计算和基于基本近邻排序算法等方法

答案:A

21.0的道德准则强调避免伤害或侵犯他人权利。

A、诚实与诚信

B、肩负个人责任

C、保证公共利益

D、自由和尊重个人权利

答案:D

22.数据库设计步骤依次是:系统需求的调查与分析、()。

A、逻辑设计、概念设计、物理设计、实施与测试、运行维护

B、物理设计、逻辑设计、概念设计、实施与测试、运行维护

C、概念设计、逻辑设计、物理设计、运行维护、实施与测试

D、概念设计、逻辑设计、物理设计、实施与测试、运行维护

答案:D

23.以下过程不属于数据资源生命周期管理的是()。

A、数据获取

B、数据利用

C、数据加工

D、数据决策

答案:D

24.对于常用的Excel函数,以下说法错误的是()。

A、SUMIF函数用于多条件求和

B、COUNTIFS用于多条件计数

C、AVERAGEIFS用于多条件计算平均值

D、LARGE函数用于计算第K个最大值

答案:A

解析:A范围内求和

25.()不是数据仓库系统组成部分之一,但是在数据仓库系统开发与应用中是出

发点。

A、存储层

B、分析工具层

C、数据源

D、定义层

答案:C

26.以下关于客服机器人的评价维度中业务识别率和准确率的说法错误的是0o

A、业务识别率的定义是在整个人机对话中,被机器人识别为业务问题的数量占

总提问数的比例

B、在计算准确率时,回复是否正确可以由机器人进行判断,无需人工介入

C、业务识别率计算公式中的业务匹配数等于总提问数减去拒识问题数减去非业

务回复数

D、准确率二回复正确的对话数/考察范围内的对话数

答案:B

27.以下关于WindowslO常用输入法基本设置操作的说法正确的是0。

A、WindowslO不允许安装第三方输入法

B、WindowslO可以通过【字体】选项设置微软拼音输入法按键

C、WindowslO可以通过【日期和时间】选项删除输入法

D、使用Windows键+空格可以快速切换输入法

答案:D

28.商用数据标注平台对人脸标注建立可配置模板一般不需要考虑()o

A、性别

B、年龄类别

C、人脸肤色

D、说话声音

答案:D

29.以下属于商业智能(BI)核心作用的选项是()。

A、数据的钻取分析

B、数据的自动标注

C、取代传统的数据报表分析

D、滤除不符合要求的数据

答案:A

30.以下对于数据资源管理的意义描述不正确的是()。

A、企业取得竞争优势的关键

B、解决企业内部数据不一致问题的根本途径

C、是帮助企业降本增效的唯一途径

D、是信息系统进入成熟阶段的重要标志

答案:C

31.在SQL(结构化查询语言)的基本功能中,对数据库安全性和可用性的控制

管理体现了SQL的0功能。

A、数据操作

B、数据定义

C、数据控制

D、数据建模

答案:C

32.对于数字可视化技术的定义和基本概念,以下说法不正确的是()。

A、数据可视化中的数据开发是指利用一定算法和工具对数据进行定量的推演和

计算

B、数据可视化中的数据分析是指对多维数据进行切片、块、旋转等动作剖析数

C、数据可视化是利用数据分析和开发工具发现数据中已知信息的处理过程

D、数据可视化中的数据空间是指由n维属性和m个元素组成的数据集所构成的

多维信息空间

答案:C

33.以下对于网络运营者办理入网手续时的要求的说法错误的是()。

A、网络运营者为用户提供即时通讯服务不需要用户提供身份信息

B、网络运营需要对用户身份信息进行审核

C、用户不提供真实身份信息的,网络运营者不得为其提供相关服务

D、网络运营者办理入网手续时需要用户提供真实身份信息

答案:A

34.以下关于SQL(结构化查询语言)的相关操作,描述正确的选项是()。

A、UPDATEXXXSETXXX的SQL操作可以实现数据库字段的追加功能

B、在SQL中,DELETE关键字被用在删除表中的数据记录的语句中

C、定义SQL索引的时候关键词ASC表示降序

DxINSERTINTOXXXVALUESXXX操作是用来实现数据库字段的更新功能

答案:B

35.从信息系统的发展过程来看,信息系统进入成熟阶段的重要标志是()o

A、数据资源有效管理

B、数据采集技术的成熟

C、由人工处理数据转向计算机处理数据

D、数据采集渠道的增加

答案:A

36.以下对于WindowslO常用系统维护工具使用的说法正确的是()。

A、【可靠性监视程序】只能用于监测系统中的软件问题

B、在命令行输入eventvwr命令可以打开【事件查看器】

C、使用Ctrl+Shift+Esc可以打开【资源查看器】

D、在命令行输入reswn命令可以打开【任务管理器】

答案:B

37.()是商用数据标注平台不需要支持管理的数据来源。

A、来自本地的文本数据集

B、预训练模型的结构与参数

C、来自共享存储的语音数据集

D、来自云存储的图像数据集

答案:B

解析:二、判断题

38.以下关于WindowslO文件管理器的基本操作描述错误的是0。

A、文件资源管理器可以对文件搜索结果进行保存

B、文件资源管理器可以对文件按照名称进行分组

C、在文件资源管理器窗口按Ctrl+A可以删除文件或文件夹

D、在文件资源管理器窗口按Ctrl+Shift+N键可以快速创建新文件夹

答案:C

39.数据仓库的。特征体现在数据仓库随时间变化不断增加新的数据内容,删去

旧的无用的数据内容。

A、面向主题

B、集成

C、随时间不断变化

D、不可更改

答案:C

40.以下关于客服机器人的评价维度中平均对话轮次的说法正确的是0。

A、平均对话轮次是某类任务的对话中断数占某类任务的对话总数的比例

B、平均对话轮次衡量了产品推荐的精准度

C、平均对话轮次衡量了客服机器人的对话流程健康度

D、平均对话轮次是反馈给用户的正确结果数占反馈结果总数的比例

答案:C

41.数据标注的正确流程为()、数据质检。

A、数据清洗、数据标注、数据采集

B、数据标注、数据采集、数据清洗

C、数据采集、数据标注、数据清洗

D、数据采集、数据清洗、数据标注

答案:D

42.下列属于常见的位图图像格式的是0。

A、XML格式

B、SVG格式

C、JPG格式

D、MP4格式

答案:C

43.数据抽取的数据源不包含0。

A、Web数据

B、文本数据

C、图层数据

D、数据库数据

答案:C

44.数据标注最常见的分类方法是根据待标注数据类型进行分类,下列不属于其

分类的是()。

A、标注框标注

B、文本标注

C、视频标注

D、图像标注

答案:A

45.以下关于Word的操作的说法错误的是()。

A、Word可以通过【段落】选项进行字体设置

B、Ctrl+E可以将段落进行中间对齐

C、Word可以通过水平标尺的调整调节段落文字的缩进

D、Word可以通过【插入】选项卡下的【符号】选项插入特殊符号

答案:A

46.从事数据标注需要了解其基本概念,下列关于其基本概念描述不正确的是0o

A、标签主要就是标识数据特征、类别和属性等

B、标注任务是指按个人对任务的理解对数据集进行标注的过程

C、数据标注员负责对文本、图像、语音、视频等待标注数据进行归类、整理、

编辑、纠错、标注和批注

D、标注标注员负责对文本、图像、语音、视频等数据进行标注

答案:B

47.空缺值数据清洗分为三个步骤,步骤的顺序为()。

A、空缺值数据的处理、输出完整数据、空缺值数据的检测

B、空缺值数据的检测,空缺值数据的处理、输出完整数据

C、空缺值数据的处理、空缺值数据的检测、输出完整数据

D、输出完整数据、空缺值数据的处理、空缺值数据的检测

答案:B

48.()是商业智能(Bl)具备的功能。

A、人工数据整理

B、自动数据预处理

C、制作自动化报表

D、联机事务处理

答案:C

49.数据清洗的基本流程一共分为5个步骤,下列不属于数据清洗步骤的是t)o

A、数据分析

B、数据合并

C、干净数据回流

D、定义数据清洗策略与规则

答案:B

50.面向主题的、集成的、不可更改的、随时间不断变换的数据集合我们称之为()o

A、数据库

B、数据仓库

C、数据资源

D、数据中心

答案:B

51.采集到的数据要进行质量检查,同时也要注意数据采集的0和数据质量。

A、可解释度

B、价值密度

C、完整性

D、时效性

答案:D

52.以下对于ETL(数据仓库技术)增量加载与全量加载区别说法正确的是0。

A、全量加载能够将业务系统中的变化数据按一定的频率准确地捕获并加载到目

标表中

B、全量加载不会对业务系统造成太大的压力

C、增量加载相比全量加载技术实现更简单

D、增量加载不会影响现有业务

答案:D

53.根据预防系统蓝屏的方法,以下做法不恰当的是()。

A、系统能正常运行无需升级驱动、BIOS等软件

B、不需要定期对电脑进行病毒扫描

C、定期对重要的注册表文件进行备份

D、在关机时要尽量通过系统的关机按钮进行关机

答案:B

54.以下关于微软edge浏览器操作的说法正确的是()。

A、微软edge浏览器的阅读视图无法调节页面主题

B、微软edge浏览器的网页笔记无法使用荧光笔

C、微软edge浏览器的标签页无法显示网页预览

D、微软edge浏览器无法将网页固定到【开始】菜单

答案:C

55.下列关于词云图的优点描述不正确的是()。

A、用途范围单一

B、突出文本主旨

C、过滤低频文本信息

D、提炼关键信息

答案:A

56.商业智能(BI)工具主要有两种用途,分别是()。

A、进行数据采集和进行联机事务处理

B、进行数据抽样和进行可视化分析

C、进行自动化报表的制作和进行可视化分析

D、进行联机事务处理和进行自动化报表的制作

答案:C

57.数据库实体联系(Entity-ReIationship,E-R)模型需要转化为()才能被数据

库管理系统所支持。

A、物理结构

B、逻辑模型

C、外模式

D、关系模型

答案:D

58.对于各种数据结构的存储方式,以下说法错误的是()。

A、财务系统的数据属于大规模非结构化数据

B、非结构化数据没有预定义的模型

C、MPP可以用来管理计算高质量的结构化数据

D、采用MPP并行数据库集群与Hadoop集群的混合可以实现对PB量级、EB量级

数据的存储和管理

答案:A

59.下列属于常见的数据标注结果文件格式的是()。

A、xIs格式

B、doc格式

C、ra格式

D、XML格式

答案:D

60.DB2数据库系统属于0。

A、传统的桌面数据库系统

B、面向对象数据库系统

C、流行的关系数据库系统

D、其他数据源

答案:C

61.在中文分词技术中,搜索引擎模式是在精确模式的基础上对长词再次拆分提

高()。

A、召回率

B、精准率

C、精确率

D、准确率

答案:A

62.()是PowerBI(商业智能)支持的自然语言查询语言。

A、英语

B、西班牙语

C、俄语

D、汉语

答案:A

63.以下不属于语音智能客服机器人的主要功能特点的选项是0。

A、通过进行表情监测识别情绪变化

B、人机协助

C、智能意图识别

D、数据统计

答案:A

64.()不是进行系统备份的合适时机。

A、安装了重要软件后

B、对系统优化后

C、进行可能损坏系统的操作前

D、当系统感染计算机病毒后

答案:D

65.爱岗敬业的具体要求不包括()。

A、树立职业理想

B、积极进行创新

C、消极怠工

D、强化职业责任

答案:C

66.下列关于相关分析的描述不正确的是0。

A、相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统

计分析方法

B、相关分析中所有的变量都必须是随机变量

C、相关分析中相关系数是确定的

D、相关分析是研究从变量群中提取共性因子的统计技术

答案:D

67.下列关于图像标框标注的质量标准相关内容描述正确的是()。

A、标框的四周要与标注物最边缘像素点误差在3个像素以内

B、标框标注的四周边框需要覆盖住标注物并且标注框需要贴合目标

C、标框的四周要与标注物最边缘像素点大于4个像素,图片即为不合格

D、标注物最边缘像素点不需要进行判定

答案:B

68.以下对于系统蓝屏可能的原因与解决方法说法错误的是()。

A、一些计算机病毒会导致系统蓝屏,可以使用杀毒软件进行杀毒

B、在硬件问题上可以检查硬件是否插牢与是否出现氧化现象

C、系统蓝屏可以基本排除BIOS的问题

D、某些硬件驱动不兼容也会发生蓝屏错误,此时应进入安全模式将其禁用并安

装兼容的硬件驱动

答案:C

69.下列关于多重抽样检验方法的的优缺点描述正确的是0。

A、不能弥补其他检验方法的疏漏

B、需要耗费大量人力精力集中进行

C、能够合理调配质检员的工作重心

D、能够提高质检员的工作效率

答案:C

70.在数据标注质量检睑方法中,多重抽样检验方法辅助实时检验第一阶段数据

全样检验不合格,则第二阶段()。

A、质检员继续对标注员标注的数据进行全样检验

B、质检员只需对标注员标注数据的25%进行检验

C、质检员只需对标注员标注数据的50%进行检验

D、质检员将不再对标注员标注的数据进行检验

答案:A

71.以下不属于自然语言处理技术中中文分词切分歧义类型的选项是0。

A、嵌套型歧义

B、交集型歧义

C、混合型歧义

D、组合型岐义

答案:A

72.下列不属于文本标注需要注意的事项是()。

A、严格的审核制度

B、只能使用单一语言进行相关标注

C、充分了解语言学

D、迭代式标注

答案:B

73.以下关于WindowslO网络基本设置方法的说法正确的是()。

A、一般情况下设置电脑的IP只需要设置IPv4协议版本的地址

B、WindowslO可以通过【时钟与区域】功能设置IP地址与DNS地址

C、WindowslO只能手动设置IP地址

D、WindowslO只能手动设置DNS地址

答案:A

74.下列不属于常见的图像数据标注类型的是()。

A、多边形拉框

B、OCR文本识别

C、语义分割

D、语音转写标注

答案:D

75.SQL(结构化查询语言)具有(),用于对表和关系、索引、查询的定义与维护。

A、数据定义功能

B、数据控制功能

C、数据操作功能

D、数据建模功能

答案:A

76.下列不属于数据库系统三级模式的是()o

A、虚拟模式

B、内模式

C、外模式

D、模式

答案:A

77.在数据预处理步骤中,数据归约的作用是0。

A、得到数据集的规约表示以减少数据量并且使规约前后结果几乎相同

B、将数据转换为适用于数据挖掘的形式

C、使数据格式标准化、清除异常数据、清除重复数据、错误纠正

D、将多个数据源中的数据结合起来并统一存储

答案:A

78.如图所示的统计图的可以用于()。

A、展示数据的聚类分析结果

B、展示公司年度各项支出额度

C、比较多组数据随时间变化的趋势

D、展示两组数据之间的变化关系

答案:B

79.在数据预处理中,去除数据中的噪声并将连续数据离散化的过程被称为0o

A、数据规范化

B、属性构造

C、数据聚集

D、数据平滑

答案:D

80.在数据标注质量检睑方法中,多重抽样检验方法辅助全样检验第一轮数据抽

样检验全部合格,则第二轮0。

A、抽样检验的标注数据量较第一轮减少50%

B、抽样检验的标注数据量较第一轮减少30%

C、抽样检验的标注数据量较第一轮增加50%

D、抽样检验的标注数据量较第一轮增加30%

答案:A

81.在Excel中,TRIMMEAN函数的作用是0。

A、按单个条件计算平均值

B、计算算术平均值

C、按多个条件计算平均值

D、计算内部平均值(修剪平均值)

答案:D

82.下列不属于数据仓库的数据质量评价指标的是

A、差异性

B、适用性

C、完整性

D、准确性

答案:A

83.非结构化数据可以使用()进行存储。

A、结构化数据库

B、多结构化数据库

C、非结构化数据库

D、半结构化数据库

答案:C

84.()不是数据标注质量实时检验方法的优点。

A、及时发现问题并解决问题

B、有效减少标注过程中重复错误的重复出现

C、提高数据质检员的工作效率

D、提高数据质检员的工作效率

答案:D

85.以下不属于云存储模式组织框架的是()。

A、数据通信层

B、基础管理层

C、存储层

D、应用接口层

答案:A

86.在Excel中,()可以完成多区间的判断。

A、COUNT函数

B、RANK函数

C、IFS函数

D、MATCH函数

答案:C

87.以下对于微软edge浏览器的历史记录功能的说法正确的是()。

A、微软edge浏览器无法删除对某个网站的所有访问记录

B、微软edge浏览器只能删除最近30分钟的历史浏览记录

C、微软edge浏览器没有按键可以快速清除历史访问记录

D、微软edge浏览器可以一次删除多条历史访问记录

答案:D

88.下列关于因子分析的作用描述错误的是()。

A、因子分析常用于因子降维

B、因子分析可以用于描述同一变量各个类别之间的差异

C、因子分析可以找出隐藏且具有代表性的因子

D、因子分析可以按照权重计算出综合得分再进行回归或聚类分析

答案:B

解析:因子分析是指研究从变量群中提取共性因子的统计技术。

89.下列关于Excel2019数据透视表自定义计算功能描述不恰当的选项是0。

A、百分比选项的功能是值区域显示为基本字段和基本项的百分比

B、差异选项的功能是值区域字段显示为与基本字段项的差异百分比

C、无计算选项的功能是值区域字段显示为数据透视表中的原始数据

D、父行汇总的百分比是值区域字段显示每个数据项占该列父级项总和的百分比

答案:B

90.下列不属于常用的数据清洗转换方法的是()。

A、多数据源的合并

B、复杂数据的转换

C、数据粒度的转换

D、数据的商务规则计算

答案:B

91.()是在WindowslO系统下常用的即时通讯软件。

A、Excel表格编辑软件

B、MicrosoftEdge浏览器

C、Xmind思维导图工具

D、钉钉

答案:D

92.在数据采集渠道中组织与组织之间的合作,交换或购买数据来整合行业资源

的渠道被称为()。

A、网络数据采集

B、自行采集

C、共享行业数据

D、第三方合作

答案:D

93.以下对于数据质量问题的分类说法错误的是()。

A、数据仓库中基于清洗方式的“脏”数据质量问题可分为规律型“脏”数据和

随机型“脏”数据

B、数据质量的问题可以分为基于数据源的“脏”数据质量问题与基于清洗方式

的“脏”数据质量问题

C、基于数据源的“脏”数据质量问题可分为单数据源问题和多数据源问题

D、在基于数据源的“脏”数据质量问题中,单数据源情况下出现的问题在多数

据源情况下会变得更严重

答案:A

94.()情况下,用人单位不得解除劳动合同。

A、劳动者在试用期间被证明不符合录用条件的

B、劳动者不能胜任工作,经过培训或者调整工作岗位,仍不能胜任工作的

C、劳动者严重违反用人单位的规章制度

D、女职工在孕期、产期、哺乳期的

答案:D

95.以下不属于大数据的五大特征的选项是()。

A、多样

B、大量

C、低速

D、低价值密度

答案:C

96.以下不属于常见的数据质量问题的是0。

A、缺失值

B、重复值

C、错误值

D、重叠值

答案:D

97.对于空缺值、异常值与重复值的处理方法,以下说法错误的是()。

A、孤立点分析属于数据清洗中的异常值处理方法

B、重复数据检测主要分为基于字段和基于记录的重复检测

C、回归是数据清洗中的空缺值处理方法之一

D、合并或消除是处理重复数据的基本方法

答案:C

98.以下关于客服机器人的评价维度中推荐结果点击率的说法正确的是0。

A、推荐结果点击率衡量了客服机器人的产品设计友好度

B、推荐结果点击率是使用了客服机器人产品的用户数占用户总数或者曝光用户

数的比例

C、推荐结果点击率衡量了客服机器人的对话流程健康度

D、推荐结果点击率是推荐答案或内容的点击(或采纳)次数占推荐次数的比例

答案:D

99.以下不属于商业智能(BI)核心作用的选项是()。

A、数据的上钻和下钻

B、获取数据的多维度分析

C、数据的切片

D、取代传统的数据报表分析

答案:D

100.以下属于数据清洗中常见的异常值处理方法的选项是0。

A、随机森林

B、排序与合并

G回归

D、平均值填充

答案:C

101.对于在WindowslO应用商店安装、更新与卸载软件的操作,下列说法正确的

是()。

A、可以通过【下载与更新】选项卸载应用

B、通过WindowslO应用商店安装的应用无法更新

C、WindowslO应用商店无法查看已经获得的应用

D、WindowslO应用商店可以通过关键字快速搜索相关应用

答案:D

102.下列关于停用词表的构成相关描述恰当的选项是0

A、停用词表中含有需要使用的关键词

B、停用词表中含有已经在书面与口语中不再使用的词语

C、停用词表内容可自行定义

D、停用词表一般使用DOC格式文件存储

答案:C

103.下列关于数据标注质量全样检验方法的描述错误的是0。

A、全样检验不合格的数据需要标注员进行返工改正

B、数据标注质量全样检验方法需要耗费大量的人力精力集中进行

C、完成全样检验后,质检员需要将标注有问题的数据移交给标注员

D、数据标注质量全样检验在数据标注任务完成交付前可以不做

答案:D

104.下列关于数据仓库管理层的功能描述错误的是0。

A、完成数据库的定义

B、完成数据的归档、备份、维护、恢复

C、完成数据的抽取、转换、装载

D、元数据的管理

答案:A

105.职业道德的特点不包括0。

A、持久不变的永恒性

B、适用范围的有限性

C、发展的历史继承性

D、纪律性

答案:A

106.在Excel2019中,()可以用来生成随机数且需要输入参数。

A、RAND函数

B、MATCH函数

C、RANDBETWEEN函数

D、RANK函数

答案:C

107.道德的功能不包括()。

A、认识功能

B、进化功能

C、调节功能

D、评价功能

答案:B

108.对于自然语言处理中停用词的分类说法正确的是()。

A、停用词一般可分为功能词和判定词

B、搜索的短语中包含功能词不会使搜索结果出现问题

C、词汇词的使用十分广泛,不会降低搜索的效率

D、功能词不具有实际含义

答案:D

109.下列关于回归分析的描述不正确的是0。

A、回归分析研究的是因变量(目标)和自变量(预测器)之间的关系

B、回归分析是研究确定两种或两种以上变量间相互依赖的定量关系的统计分析

方法

C、回归分析通过分析由定性变量构成的交互汇总表来揭示变量之间的联系

D、回归分析可以用于研究人的身高与体重之间的相关关系

答案:C

110.以下对于PowerPoint2019基本操作的说法错误的是()。

A、在PowerPoint中,通过“SmartArt图形”功能插入的形状不能设置文字

B、在PPT模板中大多含有占位符,可以通过占位符导入多种可显示对象

C、可以通过直接粘贴的方式在幻灯片中插入图表

D、在PowerPoint中,不可以通过"SmartArt图形”功能插入表格

答案:A

111.关于PowerBI(商业智能)中的查询编辑器,下列说法正确的是()。

A、查询编辑器只能查询并显示原始数据的全部列

B、数据源的隐私级别设置错误会影响查询的性能

C、自定义列一般不需要定义数据类型

D、查询编辑器的默认联接种类是右外部连接

答案:B

112.关系模型中最重要的概念是关系,下列关于关系的特点描述正确的是()。

A、关系中元组是有先后顺序的

B、关系中属性是有先后顺序的

C、关系中的每个属性可以再分

D、关系中的每个属性是同质的

答案:D

113.在Excel中,下列日期函数相关功能描述不壬确的是()。

A、EDATE函数用于返回指定日期之前或之后指定月份数的日期

B、DAYS360函数按每年360天返回两个日期间相差的天数(每月30天)

C、DATEDIF函数用于返回日期中的月份

D、WORKDAY函数返回指定工作日之前或之后的日期

答案:C

114.以下关于申请专利权力归属方的规定的说法不正确的是()。

A、两个以上单位所完成的发明创造,除另有协议的以外,申请专利的权利属于

完成或者共同完成的单位

B、对发明人或者设计人的非职务发明创造专利申请,任何单位或者个人不得压

C、非职务发明创造,申请专利的权利属于单位

D、职务发明创造申请专利的权利属于单位,申请被批准后,单位为专利权人

答案:C

115.下列对于数据库与数据仓库的区别描述正确的是0。

A、数据仓库相比数据库可以更直观地对数据源中的数据进行操作

B、数据库中的数据是经过整理并按分析主题重新组织起来的

C、数据仓库和数据库两者之间无任何关联

D、数据仓库的基本目标是减少数据冗余和增加数据的独立性

答案:A

116.以下关于客服机器人的评价维度中业务覆盖率的说法正确的是()。

A、业务覆盖率越高则客服机器人可以理解更多的用户意图

B、业务覆盖率衡量了客服机器人的接待能力

C、业务覆盖率衡量了客服机器人回复问题的准确程度

D、业务覆盖率衡量了客服机器人产品推荐的精准度

答案:A

117.在数据质量的评价指标中,()的评价标准要求尽量选择数据重要的本质属性

并消除冗余。

A、适用性

B、简洁性

C、完整性

D、准确性

答案:B

118.数据清洗的基本流程中纠正发现的错误的操作不包括0。

A、确认并改

B、属性分离

C、定义数据清洗策略

D、标准化

答案:C

119.早期数据标注工作是由()完成。

A、研究数据标注的工程师

B、研究数据统计的工程师

C、研究人工智能算法的工程师

D、进行数据采集的工程师

答案:C

120.下列数据库实体联系(Entity-ReIationship.E-R)模型向关系模型的转化叙

述正确的是()。

A、1:n的联系必须与联系的任意一端实体所对应的关系模式合并

B、1:1的联系可以单独成为一个关系模式

C、m:n的连续可以与任何一方实体合并

D、实体联系模型中的联系可以直接被DBMS(数据库管理系统)支持和执行

答案:B

121.以下关于WindowslO“照片”应用的操作的说法错误的是()。

A、“照片”应用无法将图片合成视频

B、“照片”应用可以通过文件夹导入图片

C、“照片”应用可以对图片进行编辑美化

D、“照片”应用可以限据关键词搜索图片

答案:A

122.以下不属于电话机器人的优势的选项是0。

A、相比电销人员可以快速学习营销话术

B、可以通过表情监测识别情绪变化并改变沟通方式

C、提高拨打电话效率

D、可以快速采集大量数据用于数据分析

答案:B

123.数据标注可以根据标注者类型进行分类,下列属于该分类的是()。

A、拼音标注

B、结构化标注

C、文本标注

D、机器标注

答案:D

124.下列属于数据标注图像处理工具的是()。

A、EditPlus处理软件

B、GoldWave处理软件

C、BitEdit处理软件

D、Pet。。Is处理软件

答案:C

125.数据集市可分为()。

A、独立数据集市和从属数据集市

B、串行数据集市和独立数据集市

C、并行数据集市和虚拟数据集市

D、虚拟数据集市和嵌入数据集市

答案:A

126.下列属于SQL(结构化查询语言)常用查询的是()。

A、操作查询

B、视图查询

C、定义查询

D、嵌套子查询

答案:D

解析:SQL是一种数据库查询和程序设计语言。

127.以下对于云存储模式的概念与整体架构说法错误的是0。

A、云存储模式组织框架自底向上依次是存储层、基础管理层应用接口层以及访

问层

B、云存储的概念和云计算的概念是两种不同的概念

C、云.存储就是将存储资源放到云上为人们服务的一种新兴方案

D、云存储通常由具有完备数据中心设施的第三方提供

答案:B

128.以下对于微软edge浏览器的收藏夹功能的说法正确的是0。

A、微软edge浏览器的收藏夹功能默认是处于隐藏状态的

B、微软edge浏览器无法导入IE浏览器中收藏的网页

C、微软edge浏览器不能调整收藏夹栏的按钮次序

D、添加到收藏夹的网页无法重命名

答案:A

129.以下不属于Python数值分析常用软件库的选项是0。

A、Websockets库

B、NumPy库

C、MatplotIib库

D、Pandas库

答案:A

130.()规则限定了子关系中外键的取值。

A、实体完整性

B、参照完整性

C、域完整性

D、用户自定义完整性

答案:B

131.()的数据直接来自中央数据仓库。

A、整合数据集市

B、虚拟数据集市

C、独立数据集市

D、从属数据集市

答案:D

132.()规则分别限定了在关系中每一列属性都有确定的取值范围与关系中主键

的唯一性。

A、参照完整性与域完整性

B、用户自定义完整性与实体完整性

C、域完整性与实体完整性

D、实体完整性与参照完整性

答案:C

133.数据标注的工作特点是由()所决定的。

A、数据标注员的标注习惯

B、数据标注项目的特点

C、数据标注项目的周期

D、数据标注项目的进度

答案:B

134,下列属于数据标注质量检验方法的是()。

A、随机检验

B、定时检验

C、相互检验

D、实时检验

答案:D

135.在数据标注基本概念中,数据标注工具按照自动化程度不同可分为()o

A、语音标注工具、文本标注工具、图像标注工具

B、客户端标注工具、网页端标注工具

C、手动标注工具、半自动标注工具、自动标注工具

D、区域标注工具、拉框标注工具、分类标注工具

答案:C

解析:自动化程度

136.在自然语言处理中,下列关于分词标准描述恰当的是()。

A、分词可按照操作员习惯进行分词

B、分词标准中粗粒度切分最常应用的领域是搜索引擎

C、中文分词比英文分词更简单

D、分词标准可分为粗粒度和细粒度

答案:D

137.以下关于Windowsl0常用输入法基本设置操作的说法错误的是()。

A、WindowslO可以安装第三方输入法

B、WindowslO默认系统自带输入法没有微软五笔

C、WindowslO可以对输入法进行外观设置

D、WindowslO可以设置启用模糊拼音

答案:B

138.以下关于授予专利权的相关条件规定的说法不正确的是0。

A、在申请专利前六个月内,在国家出现紧急状态或者非常情况时,为公共利益

目的首次公开的发明不丧失新颖性

B、授予专利权的发明和实用新型,应当具备新颖性、创造性和实用性

C、授予专利权的外观设计不得与他人在申请日以前已经取得的合法权利相冲突

D、疾病的诊断和治疗方法可以授予专利权

答案:D

139.在WindowsW输入法中,v模式的作用是()。

A、方便输入中文数字,罗马数字与年份

B、进行笔画筛选

C、方便输入时间日期

D、拆分不认识的汉字

答案:A

140.数据仓库的管理部分由()、数据管理部件和元数据管理部件4部分组成。

A、数据集市定义部件、数据获取部件

B、数据集市定义部件,数据库定义部件

C、数据仓库定义部件、数据资源部件

D、数据仓库定义部件、数据获取部件

答案:D

141.以下对于Word中段落缩进方式的说法正确的是()。

A、左缩进是指段落所有行均向左移动一定的距离

B、右缩进是指段落所有行均向右移动一定的距离

C、悬挂缩进是指除段落第一行外其余各行缩进一定的距离

D、首行缩进是指段落中第一行文字从右向左缩进一定的距离

答案:C

142.在商用数据标注平台中,预识别引擎识别的结果最适合使用。格式存储。

A、JS0N

B、TXT

C、XLS

D、RAR

答案:A

解析:哈哈哈,其他3个我都知道是啥

143.下列关于聚类和分类相关内容描述错误的是0o

A、分类要求划分的类别是已知的

B、聚类的结果是确定的

C、分类是有监督的学习

D、聚类是无监督的学习

答案:B

144.()是数据采集的主要来源之一。

A、数据填充

B、机器生成

C、模拟仿真

D、页面表单数据

答案:B

145.在Excel中,使用()可以直接计算众数并且只返回一个结果。

A、MOD

B、SNGL函数

C、MATCH函数

D、MULT函数

E、ROUND函数

答案:A

146.()不属于数据清洗的基本流程中搜寻并确定错误实例的检测方法。

A、基于统计的方法

B、均值填充方法

C、聚类方法

D、关联规则方法

答案:B

147.数据仓库系统通常被分为()、分析工具层3个部分。

A、存储层、操作层

B、管理层、存储层

C、表现层、管理层

D、处理层、管理层

答案:B

148.下列关于Access数据库中常见的数据类型描述正确的是()。

A、货币型用来存储货币值,在计算中可以四舍五入

B、长文本用于注释与说明,最长为16384个字符

C、长整型数字占用4个字节的存储空间

D、短文本用于处理文本字符信息,最长为128个字符

答案:C

149.以下关于客服机器人的评价维度中拦截率的说法错误的是()o

A、用户与机器人的一次交互算作一次会话

B、拦截率衡量了客服机器人的接待能力

C、拦截率的计算必须基于有效会话数

D、由于业务特点或者用户习惯产生的转人工会话不属于有效的转人工会话

答案:A

150.以下关于Word的审阅功能的说法错误的是()。

A、在Word中可以通过【视图】选项卡在文档中添加脚注

B、批注内容在打印的文件中不会显示

C、在Word中可以通过更改组中的“接受”与“拒绝”功能来确认接受或者拒绝

修订

D、在Word中使用修订功能的情况下,修订过的文字会被突出显示

答案:A

151.数据仓库的数据质量评价指标主要包括数据的准确性、()、适用性。

A、多样性、完整性

B、完整性、简洁性

C、特殊性、简洁性

D、复杂性、唯一性A

答案:B

152.一般认为语音标注的质量标准是标注与发音时间轴误差在0语音帧以内。

Ax1个

B、3个

G5个

D、7个

答案:A

153.在Excel中,不能直接计算极值或条件极值的函数是0。

A、MAXIFS函数

B、MIN函数

C、0UNT函数

D、LARGE函数

答案:C

154.下列属于数据标注质量检验方法的是()。

A定时检验

B、抽样检验

C\定量检验

D、间接检验

答案:B

155.在Office快捷键操作中,Ctrl+B的功能是0。

A、字符变为粗体

B、段落居中

C、左对齐

D、打印文档

答案:A

156.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法

正确的是()。

A、在使用“导入”模式时总能看到最新的数据

PowerBI在使用“导入”模式时需要保持与数据库连接

C、“DirectQuery”不适用于数据经常更新的情况

D、在使用“DirectQuery”选项时,在每次查看数据时需要手动刷新数据

答案:C

157.对于在WindowslO应用商店安装、更新与卸载软件的操作,下列说法错误的

是()。

A、可以通过【设置】窗口下的【应用】选项卸载应用

B、在【我的资料库】中可以查看已经获得的应用

C、通过WindowslO应用商店安装的应用无法更新

D、可以通过WindowslO应用商店中的【集锦】选项按照类别快速查找并安装应

答案:C

158.关于PowerBI(商业智能)中查询编辑器的默认联接种类是0。

A、左外部连接

B、整合连接

C、右外部连接

D、内连接

答案:A

159.在Excel中,TREND函数与FORECAST函数的主要作用是()。

A、计算方差

B、计算中位数

C、计算样本标准差

D、利用线性回归进行插值计算

答案:D

160.以下对于数据库实体联系(Entity-ReIationship,E-R)模型基本概念描述正

确的是()。

A、每个实体的属性构成可以是不相同的

B、属性的取值范围的限定被称为实体

C、用于唯一确定或区分实体集中每一个实体的属性或属性组合称为实体码

D、将同类实体的属性陶成加以抽象可以得到属性型的概念

答案:C

161.以下对于Word中表格的边框与底纹设置的说法正确的是0。

A、可以通过选中表格并在【插入】选项卡中进行边框样式选择

B、在表格属性中可以设置表格边框显示的位置

C、在表格属性中不能设置表格线的粗细

D、在表格属性中可以设置边框与底纹

答案:D

162.在统计学中,以下关于中心极限定理相关内容描述正确的选项是0。

A、中心极限定理指出了随着样本数的增大,样本均值分布曲线越来越接近均匀

分布

B、中心极限定理能否发挥作用,主要看样本量的大小

C、中心极限定理指出了大量随机变量近似服从泊松分布的条件

D、一般认为中心极限定理的标准定义的样本量n,15时,样本量足够大

答案:B

163.关于自然语言处理技术中词频统计,以下描述错误的是0。

A、词频统计是对某一些给定的词语在某文件中出现的次数进行统计

B、词频统计是指将一个汉字序列切分成一个个单独的词的过程

C、词频统计是文本分析的重要方法之一

D、词频统计是文本挖掘的重要手段

答案:B

164.以下关于PowerBI(商业智能)自然语言查询,描述不正确的是()。

AvPowerBI支持使用英文实现自然语言查询

B、PowerBI不支持使月中文实现自然语言查询

C、PowerBI支持使用日语实现自然语言查询

DxPowerBI的在线版支持自然语言查询

答案:C

165.关于大数据处理面临的难题,下列描述错误的是0。

A、数据体量过大

B、维护成本昂贵

C、响应速度慢

D、并发读写量小

答案:D

166.以下关于客服机器人业务的目标说法错误的是()。

A、了解用户的问题需要客服机器人准确知道用户问题的意图,若意图缺失,还

需要与用户确认

B、了解问题的解法需要客服机器人知道大部分业务问题的答案,能够在识别到

用户意图之后给出解法

C、解答用户的问题需要客服机器人提高回答客户问题的效率

D、客服机器人的业务目标是了解用户的问题、了解问题的解法与解答用户的问

答案:C

167.以下属于云存储优点的是0。

A、易丢失

B、分类存储

C、易访问

D、存储空间小

答案:C

168.下列不属于数据标注公共服务领域应用场景的是()。

A、机器审核

B、欺诈检测

C、视频审核

D、文本审核

答案:B

169.以下关于Windows1。系统还原功能的操作描述错误的是0。

A、不能使用U盘启动盘还原系统

B、Ghost备份还原是以硬盘的扇区为单位进行的

C、开启系统还原后,系统会定期自动创建还原点

D、用户可以使用系统映像备份来还原系统

答案:A

170.在数据标注质量检验方法中,多重抽样检验方法辅助全样检验第一轮数据抽

样检验存在不合格数据,则第二轮()。

A、抽样检验中检验的标注数据量与第一轮相同

B、抽样检验中检验的标注数据量较第一轮减少50%

C、抽样检验中检验的标注数据量较第一轮增加75%

D、抽样检验中检验的标注数据量较第一轮增加100%

答案:D

171.以下对道德的定义说法不正确的是()。

A、人类的道德观念是受到宣传教育及社会舆论的长期影响而逐渐形成的

B、道德是一种社会意识形态,它是人们共同生活及其行为的准则和规范

C、道德观念是永恒不变的

D、道德不是人类先天具备的

答案:C

172.下列属于数据标注常用的语音标注工具是0。

A、Nuendo软件

B、Labelbox软件

C、Praat软件

D、BRAT软件

答案:C

173.对于数据库备份的一般做法描述错误的是()。

A、数据库备份一般备份在与数据库同一磁盘或同一文件夹目录下

B、数据经常变化的数据库需要经常进行备份

C、数据库可以在安全的情况下上传到云端备份

D、数据库备份的重命名一般需要在文件名中添加日期

答案:A

174,下列属于数据标注常用的文本标注工具是()。

AvBRAT软件

B、NotePad软件

C、LogViewer软件

D、EmEditor软件

答案:A

175.下列关于数据标注质量全样检验方法的优缺点描述错误的是()。

A、需要耗费大量人力精力集中进行

B、能够对数据集做到无遗漏检验

C、能够有效减少标注过程中重复错误的重复出现

D、可以对数据集进行准确率评估

答案:C

176.对于业务数据采集流程以下说法正确的是0。

A、Hive数据仓库工具属于实时数据采集流程步骤之一

B、Tensorflow机器学习框架属于实时数据采集流程步骤之一

C、日志文件属于离线数据采集流程步骤之一

D、Ajax异步更新网页技术离线数据采集流程步骤之一

答案:C

177.在数据标注质量检验方法中,一般安排在数据标注任务完成交付前实施的质

量检验方法是()。

A、实时检验

B、全样检验

C、相互检验

D、抽样检验

答案:B

178.数据预处理中的()是指构造新属性并添加到属性集的过程。

A、数据规范化

B、数据泛化

C、属性构造

D、数据平滑

答案:C

179.以下属于数据清洗中常见的重复数据处理方法的选项是()。

A、孤立点分析

B、消除

C、数据补齐

D、分箱

答案:B

180.以下关于客服机器人的评价维度中满意度和差评数的说法错误的是0。

A、满意度衡量了客服机器人的服务满意度

B、由于影响用户使用体验的因素很多,满意度无法直接指明问题所在

C、多数客户只会在不满意时给出反馈,所以关注差评率更加客观

D、满意度只能实施于会话维度

答案:D

181.一般认为上下左右边框与标注物最边缘像素点误差均要在()是图像标框标

注的合格标准。

A、0像素以内

B、1像素以内

C、2像素以内

D、3像素以内

答案:B

182.下列关于多音字标注的质量标准相关内容描述正确的是0。

A、多音字标注只要标注常用的几个读音,对于不常用的可以不标注

B、多音字标注的审核不需要借助字典等专业性工具进行检验

C、多音字标注需要标注一个字的全部读音,方言发音过多、复杂不考虑

D、多音字标注需要标注一个字的全部读音,有时包括方言发音

答案:D

183.以下关于SQL(结构化查询语言)的相关操作,描述错误的选项是()。

A、定义SQL索引的时候关键词DESC表示升序

B、SQL的追加数据操作要遵守创建表格时的完整性约束

C、使用SQL进行数据表更改与删除操作时务必小心谨慎

D、SQL的更新操作不增加、减少表中的记录,而是更改记录的字段值

答案:A

184.在Windows10系统下常用的即时通讯软件不包括0。

A、微信

B、腾讯文档

C、钉钉

D、QQ

答案:B

185.诚实守信的具体要求不包括()。

A、遵守合同与契约

B、有意或无意地欺骗他人

C、信守诺言和保守秘密

D、遵守法律和法规

答案:B

186.在Excel中,以下不可以用来计数或条件计数的函数是0。

A、COUNT函数

B、RANK函数

C、OUNTA函数

D、COUNTIF函数

答案:B

解析:RANK是排名函数

187.斯坦福大学教授李飞飞于2007年启动的()项目,加深了人们对人工智能领

域的认知,数据对人工智能的重要性,从而推进了数据标注的发展。

A、CityScapes

B、COCO

C、ImageNet

D、ADE20K

答案:C

188.职业道德的作用不包括0。

A、有助于提高全社会道德水平

B、有助于企业形成行业领导地位

C、规范约束职业内部人员的行为

D、促进本行业发展

答案:B

189.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验第一阶段数据

全样检验合格,则第二阶段0。

A、质检员继续对标注员标注的数据进行全样检验

B、质检员对数据进行抽样检验

C、质检员对标注员标注数据的25%进行检验

D、质检员对标注员标注数据的50%进行检验

答案:B

190.下列关于图像区域标注的质量检验标准相关内容描述错误的是()。

A、图像中转折拐角的边缘像素点噪声最容易产生标注误差

B、区域标注的难点在于对标注物的每一个边缘像素点都要进行检验

C、图像中转折拐角的边缘像素点噪声最大,需要仔细进行检查

D、区域标注像素点与标注物像素点误差要在4个像素以内

答案:D

解析:1给像素以内

191.对于数据标注的基本流程说法不正确的是0。

A、通过数据质检环节才算是真正完成了数据标注工作

B、数据采集是整个数据标注基本流程的首要环节

C、完成数据采集后,每一条数据都能够直接使用

D、完成数据清洗后即可进入数据标注环节

答案:C

192.下列属于语义标注的检验方式的选项是()。

A、针对语音数据中的音量进行检验

B、针对语音数据中的语速进行检验

C、针对上下文的情景环境进行检验

D、针对语音数据中的声音频率进行检验

答案:C

193.下列关于数据库与数据仓库的区别描述错误的是()。

A、数据仓库中的数据是企业一段时间的历史数据

B、数据库中的数据与当前业务相关

C、数据库就是数据仓库,数据仓库就是数据库,只是两者称呼不同

D、数据库中的数据是经过整理并按分析主题重新组织起来的

答案:C

194.在数据仓库的组织方式中,()存储了过去的详细数据,反映真实的历史情况,

老化的数据将进入该级别。

A、当前细节级

B、早期细节级

C、高度综合级

D、轻度综合级

答案:B

195.以下无法在典型的实时数据采集流程环节得到应用的是0。

A、HDFS分布式文件系统

B、Pytorch机器学习框架

C、Socket通信技术和Ajax网页更新技术

D、Flume分布式日志收集系统

答案:B

196.以下不属于数据预处理步骤的是()。

A、数据归约

B、数据标注

C、数据清理

D、数据变换

答案:B

197.下列处理方法中最适合处理词云图中干扰词的方法是()。

A、进行命名实体标注

B、手动去除干扰词

C、进行词性分析

D、使用停用词表过滤干扰词

答案:D

198.文本数据处理中,关于词性分析应用描述正确的选项是()。

A、词性标注可应用在语音识别预处理

B、词性分析可应用在分词结果筛选和过滤

C、词性分析对英语文本和中文文本的分析分类结果是一致的

D、词性分析只适合于英语,不适合中文领域

答案:B

199.以下关于微软edge浏览器操作的说法错误的是()。

A、在搜索栏输入搜索文字可以弹出搜索建议

B、在【高级设置】中可以更换默认搜索引擎

C、使用InPrivate窗口可以无痕浏览网页

D、微软edge浏览器不能创建超过4个标签页

答案:D

200,下列不属于文本标注需要注意的事项是。。

A、严格的审核制度

B、只能使用单一语言进行相关标注

C、制定文本标注规则

D、明确文本用途

答案:B

201.数据采集又称0,是指从各类数据库、机器设备、传感器等自动采集信息的

过程。

A、数据生成

B、数据获取

C、数据填充

D、数据模拟

答案:B

202.以下关于语音智能客服机器人的说法正确的是()。

A、语音智能客服机器人一般不支持随时打断的功能

B、语音智能客服机器人只能替代客服回答专业性较高的提问

C、语音智能客服机器人可以帮助企业提高服务效率

D、语音智能客服机器人可以通过表情监测识别情绪变化

答案:C

203.数据仓库中基于清洗方式的“脏”数据质量问题可分为两类,即0。

A、模式型“脏”数据与实例型“脏”数据

B、规律型“脏”数据和随机型“脏”数据

C、单峰型“脏”数据和长尾型“脏”数据

D、独立型“脏”数据和依赖型“脏”数据

答案:D

204.以下关于Access数据库中数字类型的存储空间大小的说法错误的是0。

A、单精度数字占用4个字节的存储空间

B、双精度数字占用4个字节的存储空间

C、长整型数字占用4个字节的存储空间

D、整型数字占用2个字节的存储空间

答案:B

解析:单精度4字节,双精度8字节

205.采集数据的质量可以从0、范围、可信性4个指标来衡量数据质量。

A、及时性、关联度

B、关联度、时效性

C、唯一性、及时性

D、时效性、完整性

答案:B

206.广义的数据资源涉及产生、()的整个过程。

A、处理、传播、交换

B、处理、传播、决策

C、管理、传播、交换

D、处理、存储、决策

答案:A

207.以下文件的扩展名与文件类型相匹配的是()。

A、pdf便携式文件

B、datCD音频文件

Cxxml可执行文件

D、ra压缩文件

答案:A

208.数据仓库的特征不包括0。

A、面向主题的

B、随时间不断变化的

C、集成的

D、可以修改的

答案:D

209.在统计学中,对于正态分布曲线特征描述正确的是0。

A、正态分布的众数小于中位数

B、正态分布曲线被称为双峰曲线

C、正态分布的众数等于均值

D、正态分布的均值大于中位数

答案:C

210.以下不属于数据清洗中常见的异常值处理方法的选项是()。

A、回归

B、分箱

C、孤立点分析

D、特殊值填充

答案:D

解析:回归常见,特殊应该不常见吧

211.下列不属于数据标注常用的语音处理工具的选项是()。

A、GoldWave编辑软件

B、Nuendo编辑软件

C、Protools处理软件

D、PalEdit编辑器

答案:D

212.以下不属于数据标注文本处理工具的是()。

A、PilotEdit编辑器

B、EmEditor编辑器

C、JSONViewer编辑器

D、Protools编辑器

答案:D

213.下列关于数据库的备份与恢复描述正确的是。

A、一般来说备份的数据库文件可以和当前数据库文件在同一磁盘上

B、数据库备份是一次性的工作

C、不能利用操作系统的文件复制功能将数据库文件复制到另一个位置存储

D、数据库备份和恢复可以用于保护数据库中的关键数据

答案:D

214.在数据分析方法中,用于两个及两个以上样本均数差别的显著性检验的分析

方法是0o

A、方差分析

B、回归分析

C、关联分析

D、因子分析

答案:A

解析:

差别

215.ETL(数据仓库技术)数据增量抽取方式包含全表比对方式、()、时间戳方

式。

A、触发器方式、日志表方式

B、全量抽取方式、日志表方式

C、全量抽取方式、全表比对方式

D、日志表方式、数据迁移方式

答案:A

216.下列不属于数据标注应用领域的是()。

A、金融领域

B、公共服务领域

C、建筑领域

D、电子商务领域

答案:C

217.在Excel2019中制作Z值百分位表可使用()函数。

A、NORMSDIST

B、NOR

C、DIST

D、AVERAGE函数

E、MODE函数

答案:A

解析:

EXCEL中的NORMDIST是指返回指定平均值和标准偏差的正态分布函数。

218.下列关于数据仓库中ETL(数据仓库技术)的概念描述不正确的是()。

A、ETL是实现商务智能(BI)的核心

B、ETL用来描述将数据从源端经过抽取、转换、加载至目的端的过程

C、ETL只能对单个源数据进行抽取

D、ETL可以对多种结构的源数据进行抽取

答案:C

219.根据人工智能训练师国家职业标准,五级工不需要掌握0。

A、对原始数据进行清洗和标注的方法

B、数据分类与统计工具的使用

C、数据采集工具的使用方法

D、对标注后的数据进行审核的方法

答案:D

220.下列关于语音标注的质量标准描述正确的是0o

A、标注与语音数据发音的时间轴尽量保持一致,控制误差值在4个语音帧内

B、标注与发音速度需要控制在每秒小于或等于3个字

C、标注与发音时间轴误差在1个语音帧以内

D、标注与语音发音分贝数据控制在60分贝以内

答案:C

221.早期数据标注工作是由()完成。

A、研究人工智能算法的工程师

B、研究数据分析的工程师

C、研究数据标注的工程师

D、研究数据清洗的工程师

答案:A

222.在数据清洗转换方法中,()主要是将不同业务系统中的相同类型的数据进行

统一。

A、多数据源的合并

B、数据粒度的转换

C、不一致数据转换

D、数据的商务规则计算

答案:C

223.在中文分词技术中,关于全模式分词的描述正确的选项是()。

A、Jieba分词工厂的标记模式参数默认是全模式分词

B、全模式分词不能解决歧义问题

C、对于同一段文本,全模式分词处理比精确模式分词要慢

D、全模式分词把文本中所有可能的词语都扫描处理且不存在冗余

答案:B

224.下列不属于自然语言处理技术在语音方面应用的选项是0。

A、语法校对

B、机器同声传译

C、聊天机器人

D、多媒体信息提取与文本转化

答案:A

225.以下不属于常用的数据分析方法是()。

A、聚类分析

B、相关分析

C、方差分析

D、实体关系分析

答案:D

226.在自然语言处理技术中,0的准确率已经成为评价一个分词系统好坏的重要

标志之一。

A、分词

B、词性分析

C、新词识别

D、词频统计

答案:C

227.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论