人工智能训练师(中级)职业技能等级认定考试题库_第1页
人工智能训练师(中级)职业技能等级认定考试题库_第2页
人工智能训练师(中级)职业技能等级认定考试题库_第3页
人工智能训练师(中级)职业技能等级认定考试题库_第4页
人工智能训练师(中级)职业技能等级认定考试题库_第5页
已阅读5页,还剩132页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(新版)人工智能训练师(中级)职业技能等级

认定考试题库

一、单选题

1.以下哪项不是维护智能软件系统以确保其正常运行的措施()

A、定期更新和升级软件

B、备份数据以防数据丢失

C、修复软件漏洞和错误

D、安装浏览器弹出的软件

答案:D

2.下列关于文本采集说法错误的是0

A、内容编辑是文本采集的重要方式

B、文本采集数据可以通过互联网爬虫获取

C、有些专业的文本数据是需要专家进行创作撰写的

D、客服对话是语音数据,不能转化为文本采集数据

答案:D

3.质检比例逐渐降低,意味着0

A、标注人员需要减少

B、标注人员需要增加

C、质检人员需要减少

D、质检人员需要增加

答案:C

4.再质检数据一般指的是()

A、标注过的数据

B、质检过的数据

C、没有被标注到的数据

D、没有被质检到的数据

答案:B

5.以下选项中,属于质量数据采集方式类型的是0

A、自动检测

B、半自动检测

C、手动检测

D、以上都对

答案:D

6.AIDP验收数据内没有哪项数据()

A、标注人员账号密码

B、标注数据量

C、质检人员信息

D、验收通过率

答案:A

7.在AIDP的使用过程中,正确的操作的是()

A、标注员需要进入智能平台标注端操作

B、定期进行平台更新,保证使用最新版本

C、数据导出需要在“管理端〃进行

D、以上都是

答案:D

8.对于采集项目数据质检,以下方式不正确的是0

A、等比例抽检

B、定量抽检

C、只质检首条数据

D、全量质检

答案:C

9.〃请问XX超市怎么走?〃一句中,用户的情感是0

A、积极

B、消极

C、中性

D、无法判断

答案:C

10.针对重复项合并的Excel表格可以使用哪个功能来实现快速填充?

A、替换

B、定位

C、冻结

D、数据透视表

答案:B

n.()采集是通过网络爬虫或者网站公开API等方式获得的。

A、网站信息

B、软件信息

C、系统信息

D、硬件信息

答案:A

12.质检数据积压,无法及时清空,会造成哪些风险()

A、准确率无法及时统计和同步

B、错误问题无法及时发现

C、有可能引发回扫

D、以上均是

答案:D

13.修改标准一般由以下哪个角色来执行

A、撰写标准的人

B、标注人员

C、质检人员

D、对标准提出建议的人

答案:A

14.一般情况下,随着项目阶段的推进,答疑量应该()

A、逐渐上涨

B、逐渐下降

C、保持不变

D、以上说法都不对

答案:B

15.下列哪个因素不会造成项目管理风险()

A、项目执行团队近期雾霾严重

B、标注团队项目负责人不及时读群消息

C、标注团队是新建公司,项目承接流程不完善

D、项目质检团队缺少及时的错误反馈机制

答案:A

16.下列操作中,有助于高效进行图像采集数据质检的是0

A、多图统一查看

B、安装自动放大图片查看的插件工具

C、设置图片自动轮播以快速查看

D、以上都可以

答案:D

17.当验收人员打回部分验收数据后,质检人员应该做哪个措施()

A、询问错误原因,及时修改并再次提交

B、据理力争,就是不改直接提交

C、无论错误原因,直接打回给上游标注

D、以上选项都可以

答案:A

18.数据分析过程中存在一个比较基础且重要的环节,它决定了元数

据是否优质,这个环节是()

A、数据整理

B、数据采集

C、预估数据量

D、确定数据量级及场景

答案:B

19.文本数据标注作为最常见的数据标注类型,是指将包括哪些内容

在内的文本进行标注,让计算机能够读懂并识别0

A、文字、符号

B、文字、数字

C、文本、图片

D、符号、数字

答案:A

20.在AdobePhotoshop中,钢笔的落笔点叫做()

A、闭合点

B、路径点

C、上把手

D、描点

答案:D

21.质检人员的质检尺度不会影响哪些内容()

A、标注人员的准确率

B、规则撰写的方向

C、质检人员的置信度

D、项目的准入速度

答案:B

22.假设某队列715个样本,有35个正例(需标为1),680个负例(需

标为0),我们要标出所有的正例。标注结果为50个正例,665个负

例,其中只有30个是真正的正例,请问该同学的精确率是()

答案:C

23.以下选项属于规则培训环节的是()

A、收集现场标注人员的问题

B、标注人员的人效需要提高

C、标注人员的质量需要提高

D、质检人员对标准可以有自己的理解

答案:A

24.当项目规则文字过多,标注人员理解有困难时,以下哪种做法错

误()

A、做一份梗概版规则,先帮助大家掌握规则框架

B、尽量将文字表述用图表表达出来,易于理解

C、统一规则的表达范式,格式统一容易被理解和记忆

D、没有什么好办法,只能努力学习原规则,因为是需求方出具的

答案:D

25.以下哪种答疑方式,沟通效率最高

A、线下面对面答疑

B、线上聊天群答疑

C、线上表格答疑

D、电话语音沟通

答案:A

26.如果采集数据包含的维度有分词,情感,扩句,改写,这部分采

集数据大概应用于哪种场景?

A、语音标注

B、NLP标注

C、关系标注

D、属性标注

答案:B

27.数据采集完成后,不能采取以下哪种方式将采集数据规范化()

A、采集数据命名规范统一

B、数据采集日期统一

C、采集数据格式统一

D、采集规格统一

答案:B

28.在AIDP进行质检过程中,如该题目暂时存疑,需要稍后处理,应

选择()

A、暂存并离开

B、提交并离开

C、押后

D、提交

答案:B

29.北京烤鸭的一级,二级,三级品类分别是()

A、美食;地方菜;北京菜

B、美食;北京菜;地方菜

C、北京菜;地方菜;美食

D、地方菜;北京菜;美食

答案:A

30.数据采集规则有问题时,可以()

A、仅和标注人员讨论

B、整理差异点,统一向需求方反馈

C、自行梳理并制定规则

D、不反馈问题

答案:B

31.在智能平台质检时,发现标注员漏选了标签,以下操作正确的是

0

A、勾选合格,睁一只眼闭一只眼

B、勾选合格,提醒标注同学以后注意

C、退出智能标注平台

D、勾选不合格,改成正确答案提交

答案:D

32.以下说法错误的是()

A、项目要求校对中英翻译结果,可以使用翻译软件以提高效率

B、项目要求对图片中的行人进行框选,应使用多边形框选工具

C、项目要求对音频进行文本转写,可以视情况添加标点符号

D、项目要求对视频进行优劣质量评测,应认真观看视频

答案:A

33.〃湖南省的张林海南省的王强山东省的王蒙四川省的邵杰〃针对以

上数据如何提取姓名信息

A、LEFT

B、FIND

C、RIGHT

D、TRIM

答案:A

34.以下哪项不会出现在一份规范的采集质检结果报告中()

A、采集数据质检准确率

B、采集效率

C、特殊案例

D、常见采集问题大类分析

答案:B

35.以下选项属于模型训练流程中关键节点的是()

A、数据质检

B、数据标注

C、数据打回

D、数据备份

答案:B

36.以下哪个选项是模型运行效果的直接获取渠道()

A、新闻B、广播

C、电视

D、模型测试

答案:D

37.在NLP项目质检作业中,质检员不需要做以下哪个步骤()

A、修改错误标签

B、修改关键点位置

C、修改公式符号

D、修改转写文本

答案:B

38.以下不属于图像采集项目常见易错点的是()

A、图像分辨率过低

B、图片格式不符

C、图片尺度大小属于合理范围

D、以上都不是

答案:C

39.以下选项中属于在使用智能平台时需注意的有()

A、标注完直接关机

B、按照要求保证软件始终为最新版本

C、标注过程遇到疑难case不提问

D、以上三种均可

答案:B

40.多边形标注工具页面分为:()、工具区、标签区和统计区

A、状态栏

B、展示区

C、标签区

D、画选区

答案:D

41.以下哪项属于数据标注项目数据统计时的关键指标0

A、人效

B、产出质量

C、产量

D、以上都是

答案:D

42.以下质检操作对应不同数据类型错误的是()

A、语音类:有效语段需要全部截出

B、文本类:小语种文本转译不允许有错别字

C、视频类:视频数据可允许部分丢帧

D、图片类:为保证数据多样性需要拍摄不同角度的图片

答案:C

43.需要采集论坛微博类的数据,同时最大化节约采集成本可以使用

以下哪种采集工具()

A、直接购买

B、网络爬虫

C、第三方合作

D、众包采集

答案:B

44.数据标注项目培训前需要做的准备不包括()

A、提前预习规则

B、准备试标数据

C、规则更新维护

D、传达时注意逻辑性

答案:D

45.以下哪些场景一定会涉及数据标注项目规则优化()

A、规则本身没有问题

B、规则覆盖率低

C、标注人员对规则提出质疑

D、质检人员对规则提出质疑

答案:B

46.在智能平台可以对图像中的目标进行分类、定位、检测等标注,

其中不包括0

A、车辆识别

B、人脸识别

C、物体检测

D、语音截取

答案:D

47.在模型测试中,用以下哪项内容来测试召回率()

A、测试集中的负例

B、测试集中的正例

C、验证集中的正例

D、验证集中的负例

答案:B

48.以下属于常见的数据采集进度要求指标的是()

A、图片采集人均效率

B、语音采集清晰度

C、文本采集重复率

D、视频采集无噪点

答案:A

49.下列公式表达正确的是()

A、=IF(F2=H2,〃是〃〃否〃)

B、=IF(F2=H2,〃是〃,〃否〃)

C、=IF(F2=H2,否,是)

D、=IF(F1=H1,是,〃否“)

答案:B

50.数据采集中会涉及到数据分析报告,采集数据的分析报告不需要

包括()

A、数据类型占比

B、米集人员家庭信息

C、数据总量

D、数据采集周期

答案:B

51.风险评估的主要步骤有?

A、识别风险

B、分析风险

C、制定应对策略

D、实施市场推广

答案:A

52.在解决方案架构设计中,通常需要考虑的方面有?

A、系统的可扩展性

B、系统的安全性

C、系统的可维护性

D、系统的美观性

答案:D

53.边缘计算的主要目的是?

A、降低数据传输延迟

B、增加数据中心的负载

C、提高数据处理的集中化

D、减少本地计算资源的使用

答案:A

54.在文本数据增强中,以下哪种方法常用?

A、数据清洗

B、同义词替换

C、图像裁剪

D、边缘检测

答案:B

55.在制定培训规划时,任务分析的目的是()。

A、明确工作对培训提出的要求

B、确定培训内容安排的前后顺序

C、转化为易于操作的指导方针

D、发现工作任务适合的培训类型

答案:A

56.以下哪项最能体现职场中的职业诚信?

A、遇到问题时总是寻找外部帮助

B、在不影响自己利益的情况下保持诚实

C、无论面对何种情况

D、仅在监督下工作时保持诚实

答案:C

57.以下哪项不是测试执行的主要任务?

A、执行测试用例

B、记录测试结果

C、修复代码缺陷

D、分析测试数据

答案:c

58.业务数据处理流程设计的关键目标是:

A、最小化数据处理时间

B、最大化数据存储空间

C、提高数据质量和可用性

D、增加数据处理步骤的复杂性

答案:C

59.测试实施的第一步是?

A、编写测试报告

B、搭建测试环境

C、执行测试用例

D、分析测试结果

答案:B

60.按照《劳动法》,用人单位解除劳动合同应当提前几日向劳动者书

面通知?

A、3日

B、7日

C、15日

D、30日

答案:D

61.市场调研的主要目的是?

A、了解市场需求和竞争状况

B、增加企业的销售额

C、提高企业的知名度

D、优化产品的设计

答案:A

62.需求收集过程中,通常需要避免的错误是?

A、过度依赖单一数据源

B、同时使用多种方法

C、频繁与用户沟通

D、记录详细信息

答案:A

63.监督学习的特征是?

A、不需要标签数据

B、使用标签数据进行训练

C、仅用于数据降维

D、仅用于数据生成

答案:B

64.选择智能产品时,需要考虑的关键因素是?

A、产品的功能适配性

B、产品的市场占有率

C、产品的用户界面D、产品的包装

答案:A

65.设计业务数据流程时,如何确保遵循跨国数据传输的法律要求?

A、仅在必要时传输数据

B、确保所有数据在传输前加密

C、遵守国际数据保护协议

D、使用专门的物理介质传输数据

答案:C

66.根据《劳动法》,在何种情况下劳动者有权终止劳动合同且不需提

前通知用人单位?

A、未按时足额支付劳动报酬

B、调整工作地点

C、改变工作内容

D、未提供必要的工作条件

答案:A

67.业务数据处理流程设计中,哪种工具能够提供即时反馈和改进建

议?

A、传统的纸质流程图

B、专业的流程模拟软件

C、基本的文字处理软件

D、静态的图像展示软件

答案:B

68.有效的业务分析方法不包括下面哪一项?

A、分析

B、分析

C、随机取样

D、成本效益分析

答案:C

69.在业务优化方法中,哪一项是关于提高工作效率的?

A、客户满意度调研

B、员工培训计划

C、业务流程自动化

D、市场扩展策略

答案:C

70.确保测试集标签准确性的关键步骤是?

A、数据清洗

B、数据标注验证

C、数据扩充

D、数据转换

答案:B

71.在智能产品的技术架构中,常见的通信协议不包括?

A、Wi-Fi

B、luetooth

C、Zigbee

D、USB

答案:D

72.在《劳动合同法》中,劳动合同续签应考虑哪个因素?

A、劳动者年龄

B、劳动者工作表现

C、劳动者工作态度

D、劳动者的技能和贡献

答案:D

73.杜邦分析法将净资产收益率分解为哪三个部分?

A、销售净利率、资产周转率和财务杠杆

B、销售毛利率、存货周转率和应收账款

C、营业利润率、投资回报率和资本结构

D、成本费用率、销售增长率和资产负债率

答案:A

74.什么是时间序列分析?

A、一种用于分析时间相关数据的方法

B、一种用于将数据转换成特定格式的方法

C、一种用于存储时间相关数据的方法

D、一种用于数据分析的方法

答案:A

75.机器学习是指什么?

A、计算机通过学习数据来改善性能的技术

B、将数据转换成特定的格式

C、存储数据的地方

D、数据分析的工具

答案:A

76.DataWorks的核心功能和特点不包括下列哪项()。

A、数据集成

B、数据开发

C、数据管理

D、数据分析

答案:D

77.下列选项中,不是Flume的特点的是?

A、可靠性

B、集中式架构

C、可扩展性

D、可管理性

答案:D

78.CSV文件是以什么标点符号为分隔符的()。

A、逗号

B、句号

C、单引号

D、双引号

答案:A

79.养老保险关系属于()

A、劳动关系

B、与劳动关系有密切联系的社会关系

C、国家进行劳动力管理中的关系

D、处理劳动争议过程中发生的关系

答案:B

80.神经网络中的感知机是由以下哪个科学家提出的?

A、MarvinMinsky

B、JohnMcCarthy

C、FrankRosenblatt

D、AlanTuring

答案:C

81.下述()不是知识的特征。

A、复杂性和明确性

B、进化和相对性

C、客观性和依附性

D、可重用性和共享性

答案:A

82.什么是梯度下降(GradientDescent)?

A、一种优化算法,用于最小化损失函数

B、一种分类算法,用于处理非线性数据

C、一种数据预处理技术,用于降低数据维度

D、一种特征选择方法,用于选择最相关的特征

答案:A

83.()不是手机里常用的智能APP。

A、美颜

B、语音助手

C、人脸识别

D、机器翻译

答案:C

84.下面关于函数说法错误的是()

A、函数的三要素是函数名、参数和返回值,定义函数时这三个要素

是必须的

B、如果没有return语句,则Python函数默认返回值为None

C、函数可以嵌套

D、使用def定义函数

答案:A

85.什么是强化学习?

A、机器学习算法通过给定的输入和输出数据进行训练

B、机器学习算法通过观察和理解数据进行训练

C、机器学习算法通过试错方法进行训练

D、以上都不是

答案:C

86.深度学习使用的最常见的激活函数是:

A、Sigmoid函数

B、ReLU函数

C、Tanh函数

D、Softmax函数

答案:B

87.人工智能中的〃自然语言处理〃是指什么?

A、让机器可以理解和处理人类的自然语言

B、让机器能够像人类一样进行语音交流

C、利用机器进行语言学研究的方法

D、让机器能够进行自动翻译

答案:A

88.以下对字典的说法不正确的是()

A、字典可以为空

B、字典的键不能相同

C、字典的键不可变

D、字典的值不可变

答案:D

89.下列选项中,哪项是由谷歌开发的人工能算法框架?

A、Kafka

B、Tensorflow

C、affe

D、Torch

答案:B

90.Hadoop2系列版本中默认的HDFS的block是多大?

A、32MB

B、64MB

C、128MB

D、16MB

答案:C

91.语音识别产品体系有四部分,下列哪项不是体系之一?

A、语音合成

B、语音播放

C、语音识别

D、语义理解

答案:B

92.以下哪个不属于大数据在电信行业的数据商业化方面的应用

A、精准广告

B、网络管理

C、营销洞察

D、大数据检测和决策

答案:B

93.在深度学习中,学习率衰减的作用是:

A、加速模型训练

B、减少模型的参数数量

C、减少模型的复杂度

D、改善模型的泛化能力

答案:D

94.以下哪个是计算机视觉领域的经典数据集?

A、CIFAR-10

B、MNIST

C、IMDB

D、ImageNet

答案:D

95.下面()是Labellmg数据标注结果文件的后缀名。

A、vi

B、xml

C、jpg

D、mov

答案:B

96.list(range(6))[::2]的执行结果为0?

A、[0,1,2,3,4,5]

B、[2,3,4,5,6]

C、[0,2,4]

D、[1,3,5]

答案:C

97.可以使用()接受用户的键盘输入。

A、input命令

B、input。函数

C、int()函数

D、format。函数

答案:B

98.老张交换名片后,小王打开手机中安装的灵云智能输入法app,拍

照老张的名片,很快得到名片文字信息并保存,这其中最主要应用的

技术是

A、模式识别

B、文字合成

C、图像搜索

D、图像还原

答案:A

99.以下哪个不是AI系统的应用之一?

A、语音识别

B、机器翻译

C、图像处理

D、数据存储

答案:D

lOO.Hadoop生态的组件不包括()。

A、HDFS

B、MapReduce

C、Hive

D、Flink

答案:D

101.人工智能中的〃深度学习〃是指什么?

A、一种特殊的机器学习算法

B、让机器可以进行深度思考的能力

C、通过模拟人脑神经网络的方式进行学习

D、让机器可以进行复杂问题的推理和决策

答案:C

102.深度学习中的自编码器(Autoencoder)主要用于:

A、特征提取

B、特征选择

C、特征降维

D、特征融合

答案:C

103.循环采集不包括()

A、URL循环

B、?本循环

C、单个元素循环

D、随机循环

答案:D

104,下面对数据标注描述哪一个是正确的0

A、所有的数据标注都可以使用脚本语言自动标注

B、可以通过算法来实现数据的自动标注

C、OCR手写转录完全可以通过识别工具实现自动转录

D、数据标注是个重复性很强的工作

答案:D

105.关于函数参数传递中,形参与实参的描述错误的是()。

A、实参与形参分别存储在各自的内存空间中,是两个不相关的独立

变量

B、Python实行按值传递参数。值传递指调用函数时将常量或变量的

值传递给函数的参数

C、实参与形参的名字必须相同

D、在函数内部改变形参的值时,实参的值一般是不会改变的

答案:C

106.人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵

盖了训练计算机使其能够完成()等人类行为的范畴。

A、自主学习、判断、执行

B、决策、判断、执行

C、自主学习、决策、执行

D、自主学习、判断、决策

答案:D

107.以下哪项不是神经网络的常见层类型?

A、卷积层

B、池化层

C、随机森林层

D、全连接层

答案:c

108.机器学习从不同的角度,有不同的分类方式,以下哪项不属于按

系统学习能力分类的类别

A、监督学习

B、无监督学习

C、弱监督学习

D、函数学习

答案:D

109.以下哪项不是机器学习的主要任务?

A、分类

B、聚类

C、回归

D、排序

答案:D

110.mapreduce计算模型适用于哪种任务?

A、多线程处理

B、有关联的行处理

C、批处理

D、实时数据变化处理

答案:C

111.以下哪项不是决策树算法的优点?

A、易于理解和解释

B、可处理非线性数据

C、不需要数据预处理

D、可以处理大规模数据集

答案:D

H2.数据采集中的数据包括RFID数据、()数据、社交网络交互数据

及移动互联网数据等海量数据。

A、智能设备

B、传感器

C、温湿度

D、日志

答案:B

113.下列说法中对专用人工智能理解正确的是()。

A、在某一个特定领域应用的人工智能。

B、不是真正在这次人工智能浪潮中起到影响的主角。

C、充分利用已掌握的技能来解决新问题、达到甚至超过人类智慧的

人工智能。

D、是众多科幻作品中颠覆人类社会的人工智能形象。

答案:A

114.什么是随机森林(RandomForest)?

A、一种无监督学习方法

B、一种特征选择技术

C、一种分类算法

D、一种回归算法

答案:C

115.关于Python内存管理,下列说法不正确的是

A、变量不必事先声明

B、变量?须先创建和赋值?直接使?

C、变量?须指定类型

D、可以使?del释放资源

答案:B

116.下列哪个是深度学习中常用的激活函数?

A、sigmoid函数

B、二阶阶跃函数

C、正弦函数

D、指数函数

答案:A

117.专家系统的主要组成部分不包括

A、知识库

B、推理引擎

C、用户接口

D、自主学习系统

答案:D

118.如果把知识按照作用来分类,下述()不在分类的范围内。

A、用控制策略表示的知识,即控制性知识。

B、可以通过文字、语言、图形、声音等形式编码记录和传播的知识,

即显性知识。

C、用提供有关状态变化、问题求解过程的操作、演算和行动的知识,

即过程性知识。

D、用提供概念和事实使人们知道是什么的知识,即陈述性。

答案:B

119.深度学习中的LSTM是什么的缩写?

A、LongShort-TermMemory

B、LongSequentialTrainingModel

C、LogisticSequentialTrainingModel

D、LogisticShort-TermMemory

答案:A

120.深度学习中的模型正则化是为了:

A、减少模型的参数数量

B、减少模型的复杂度

C、改善模型的泛化能力

D、防止模型过拟合

答案:D

121.数据集成主要解决数据的分布性和O问题。

A、同构性

B、异构性

C、公开性

D、一致性

答案:B

122.FOIL是()的学习算法

A、一阶规则

B、序贯覆盖

C、命题规则

D、剪枝优化

答案:A

123.数据仓库一般都是存在层次架构的,比如可以分为ODS、DW、DM

层,不同粒度的表,不同作用的表,一般会分布在不同的层级中,如

下相关信息表存放在ODS层的有()。

A、从源系统同步至数仓的粒度相同的一张登录日志表

B、日期为天粒度的登录统计表

C、从人的角度统计的登录情况表

D、日期为月粒度的登录统计表

答案:A

124.AnalyticDB的优势不包括()©

A、更大规模和更快读写能力

B、更高可用和可靠性

C、更高安全

D、分布式计算能力

答案:D

125.下面关于函数说法错误的是()

A、函数的三要素是函数名、参数和返回值,定义函数时参数和返回

值不是必须的

B、如果没有return语句,则Python函数默认返回值为None

C、函数不可以嵌套

D、使用def定义函数

答案:C

126•个?进?数据采集是,主要?于()

A、?页信息收集

B、生产数据采集

C、市场数据采集

D、社会公开信息

答案:A

127.BP神经网络的学习规则是()

A、梯度上升法

B、梯度下降法

C、梯度提升法

D、梯度曲线法

D、语义网络法

答案:B

128.设有变量a=〃Me〃,〃You〃,则变量a属于

A、字符串

B、元组

C、列表

D、集合

答案:B

129.以下不是数据标注员需要具备的素质

A、学习力

B、责任感

C、专注力

D、有兴趣

答案:D

13O.flv格式是()的常见后缀名。

A、语音文件

B、视频文件

C、文本文件

D、图像文件

答案:B

131.在深度学习中,数据集的划分常用的比例是:

A、60%训练集,20%验证集,20%测试集

B、70%训练集,15%验证集,15%测试集

C、80%训练集,10%验证集,10%测试集

D、90%训练集,5%验证集,5%测试集

答案:A

132.目前最先进的自然语言处理模型是哪个?

A、BERT

B、LSTM

C、GAN

D、SVM

答案:A

133.什么是无监督学习?

A、机器学习算法通过给定的输入和输出数据进行训练

B、机器学习算法通过观察和理解数据进行训练

C、机器学习算法通过试错方法进行训练

D、以上都不是

答案:B

134.数据标注规则的特点包括()①数据标注规则需要一致②数据标

注规则需要不断完善③需求方优先规则④质检优先规则⑤数据标注

规则不能改变

A、①②③④

A、①②③

B、③④⑤

C、②③④

D、①②⑤

答案:A

135.图像区域标注现在主要是

A、手动标注

B、自动化标注

C、半自动化标注

D、人工智能标注

答案:A

136.归纳推理是()推理

A、从一般到个别

B、从个别到一般

C、从个别到个别

D、从一般到一般

答案:B

137.工信部官网正式发布大数据产业〃一三五〃发展规划是在哪一年

A、1987

B、1997

C、2007

D、2017

答案:D

138.中国移动研发了智能客服问答机器人(),使业务流程自动化,更

加智能的回答用户解决业务咨询、业务办理、流量查询等问题。

A、精灵

B、阿尔法蛋

C、小度

D、移娃

答案:D

139.JS0N对象结构以〃〃开始,以“结束

A、{}

B、()

C、口

D、<>

答案:A

140.MPP是指

A、大规模并行处理系统

B、受限的分布式计算模型

C、集群计算资源管理框架

D、分布式计算编程框架

答案:A

141.文本内容是:我饿了。但是录音人有点儿结巴,连着说了四个我。

该怎么标注?

A、判该句无效

B、四个我饿了

C、我我我我饿了

D、我饿了

答案:C

142.什么是自然语言处理?

A、计算机理解和处理人类语言的技术

B、将数据转换成特定的格式的技术

C、存储数据的地方的技术

D、数据分析的工具的技术

答案:A

143.关于aorb描述错误的是()。

A、若a=Trueb=True贝!jaorb==True

B、若a=Trueb=False贝Uaorb-=True

C、若a=Trueb=True贝!jaorb==False

D、若a=Falseb=False贝!Jaorb==False

答案:C

144.从底层次数据抽象出高层次的描述过程叫做O。

A、抽样

B、离散化

C、数据立方体聚集

D、属性子集选择

答案:C

145.可以标为坏数据的是()。

A、图片显示方向不正确

B、图片局部显示不全

C、图片模糊放大后仍看不清楚

D、图片不够清晰但放大后可以看清楚

答案:c

146.人工智能在某种意义上来说是人工+智能,以下那些需要人工做

的工作()

A、数据采集

B、数据清洗

C、做标签

D、以上都对

答案:D

147.下列选项中,描述Flume对数据源的支持的是

A、只能使用HDFS数据源

B、可以配置数据源

C、不能使用文件系统

D、不能使用目录方式

答案:B

148.O是人以自然语言同计算机进行交互的综合性技术,结合了语

言学、心理学、工程、计算机技术等领域的知识。

A、情感交互

B、语音交互

C、体感交互

D、脑机交互

答案:B

149.在机器学习中,监督学习是指:

A、机器通过观察数据自主学习

B、机器根据给定的数据和标签进行学习

C、机器通过交互式学习改进自身性能

D、机器根据强化学习算法进行学习

答案:B

150.在同一台计算机中,内存和外存存取速度

A、看情况

B、一样快

C、内存快

D、外存快

答案:C

151.仅个体变元被量化的谓词称为()。

A、一阶谓词

B、原子公式

C、二阶谓词

D、全称谓词

答案:A

152.什么是K折交叉验证(K-foldCrossValidation)?

A、一种无监督学习方法

B、一种特征选择技术

C、一种模型评估方法

D、一种数据预处理技术

答案:c

153.人工智能中不是用〃如果…则…〃关联起来的说法不包括

A、产生式

B、规则

C、关系式

D、模式

答案:B

154.关于卷积神经网络以下说法不正确的是

A、常见池化层有最大池化与平均池化

B、卷积核不可以用来提取图片全局特性

C、处理图片时,是以扫描窗口的方式对图像做卷积

D、卷积神经网络可以包含卷积层,池化层和全连接层

答案:B

155.在计算机内部,数据的表示形式是()。

A、八进制

B、十进制

C、二进制

D、十六进制

答案:C

156.下面哪项不属于神经网络的范畴?

A、深度学习

B、机器学习

C、感知器

D、CNN

答案:B

157.什么是数据可视化?

A、通过图表和图形展示数据的过程

B、将数据转换成特定的格式的过程

C、存储数据的地方的过程

D、数据分析的工具的过程

答案:A

158.ImageNet项目标注了图像

A、万张图像

B、百万张图像

C、千万张图像

D、亿张

答案:C

159.HBase数据库中,数据存储是按()进行排序的。

A、列族名称

B、列族限定符名称

C、行键

D、时间戳

答案:C

160.数据预处理是指什么?

A、将数据转换成特定的格式

B、删除无用的数据

C、检查和修复数据错误

D、所有以上答案

答案:D

161.在人力资源管理中,人工智能能够帮助:

A、完全替代人力资源部门

B、自动化招聘和员工评估过程

C、减少员工的工作满意度

D、增加招聘过程的偏见

答案:B

162.在业务数据采集流程设计中,最重要的原则之一是:

A、尽可能使用手动数据录入

B、优先考虑数据的量而非质

C、保证数据的完整性和准确性

D、集中于单一数据源的使用

答案:D

163.为了确保测试结果的可靠性,应当?

A、进行多次测试

B、只进行一次测试

C、只使用一种测试方法

D、依靠手工测试

答案:A

164.性能评估报告通常包括?

A、性能测试结果

B、测试环境描述

C、测试方法和工具

D、市场预测

答案:A

165.在风险评估中,常用的分析方法是?

A、SWOT分析

B、PEST分析

C、FMEA分析

D、市场分析

答案:C

166.数据存储的常用方法有?

A、数据库

B、数据仓库

C、文件系统

D、区块链

答案:A

167.劳动合同法对劳动合同的书面形式有明确要求,下列哪种形式的

劳动合同是有效的?

A、口头协议

B、电子邮件确认

C、书面文本

D、微信消息确认

答案:C

168.发展趋势分析的重要性在于?

A、确定企业的短期目标

B、了解行业未来的发展方向

C、增加市场份额

D、提高产品质量

答案:B

169.为了符合数据保护法规,业务数据流程中的数据删除策略应该:

A、允许用户随时删除他们的数据

B、仅在数据泄露时删除数据

C、每五年删除一次所有数据

D、保留所有数据以备法律诉讼

答案:A

170.在培训过程中(),是使培训工作取得成功的关键之举。

A、讲求授课效果

B、实现培训课程目标

C、做好充分准备

D、调动学员参与的积极性

答案:D

171.以下关于数据科学过程步骤的描述,错误的是()

A、数据分析和挖掘方法不会影响到数据清洗手段和方式的选择

B、在一个数据分析项目中可能需要不止一次地执行数据清洗

C、数据呈现与可视化就是以恰当的方式呈现数据分析和挖掘的结果

D、数据清洗就是对数据进行针对性的整理和规范,以便于后面的分

析和处理

答案:A

172.以下内容属于硬件测试流程的是()

A、确定测试时间

B、准备相关测试设备

C、确认实验环境条件

D、以上都是

答案:D

173.个人准确率计算需要关注以下哪些数值()

A、质检数

B、错误数

C、申诉成功数

D、以上都是

答案:D

174.质检人员在项目质量不达标时,可以采取的手段是()

A、改变承接需求

B、交付数据

C、和标注同学拉齐规则理解

D、撰写标准

答案:C

175.在Excle中,Left函数的定义是()

A、返回原始字符串右N个字符串

B、返回原始字符串左N个字符串

C、返回原始字符串中间N个字符串

D、返回原始字符串第一个字符串

答案:B

176.以下哪项操作流程是错误的()

A、标注完成后点击提交

B、随意关闭当前标注页面

C、疑难数据未得到答疑,于是先把数据进行押后

D、离开座位时,选择〃提交数据并离开〃按键

答案:B

177.智能平台关键数据指标中的〃一致性〃是指()

A、标注人在不同时间或不同数据集上标注的一致性

B、标注人进行相似数据标注的数量

C、标注人标注同一数据集的时长

D、标注人标注同一数据集的人效

答案:A

178.什么模式下,质检会选择仅通过合格数据()

A、全检模式

B、抽检模式

C、以上都是

D、以上都不是

答案:A

179.哪个选项的人员一定不能导出AIDP平台数据()

A、离职后清除账号的人员

B、项目经理

C、项目质检

D、项目需求方

答案:A

180.以下不属于音频采集项目常见易错点的是()

A、录制环境不符要求

B、音频设备不符

C、文件格式大小不统一

D、噪音文件剔除

答案:D

181.以下哪个选项属于计算机安全软件()

A、第三方VPN

B、音乐软件

C、杀毒软件

D、多媒体软件

答案:c

182.若需计算飞书某工作表中Al、Bl、Cl单元格的数据之和,需使

用下述计算公式

A、=count(Al:Cl)

B、=max(Al:Cl)

C、=sum(Al:Cl)

D、-sum(Al,Cl)

答案:C

183.在文本仿写数据标注项目的质检作业中,质检员不需要关注()

A、仿写数据存在雷同

B、仿写数据的字数与原文严格一致

C、仿写数据存在错别字

D、仿写数据存在语法错误

答案:B

184.以下哪个项目不可以在AIDP上进行标注0

A、图片标注

B、语音标注

C、视频标注

D、车内人脸采集

答案:D

185.以下哪个图表多用于分析因果关系()

A、思维导图

B、鱼骨图

C、饼图

D、mindmapping

答案:B

186.在智能平台进行质检操作时,发现系统不稳定,经常出现卡顿,

应该()

A、减少质检数量,降低人效

B、向平台进行反馈

C、频繁点击提交

D、休息等待,知道不再卡顿

答案:B

187.对于智能平台中的重要数据,以下哪项可以避免数据丢失或损坏

0

A、数据监控

B、用户培训

C、调试系统

D、数据备份

答案:D

188.以下哪些人员不需要对智能平台功能的优化进行报告输出()

A、行政部门

B、标注人员

C、质检人员

D、项目经理

答案:A

189.在Excle中,若单元格中出现一连串的"#"符号,则需()

A、重新输入数据

B、删去这些符号

C、调整单元格的宽度

D、删去这些单元格

答案:C

190.以下关于项目标准的问题,说法不正确的是()

A、可能存在逻辑框架混乱的情况

B、可能出现较多专业术语

C、可能出现内容表达歧义的情况

D、由外部人员进行撰写

答案:D

191.以下哪项不属于规则培训技巧0

A、直接参与正式规则培训

B、规则预习阶段收集记录疑问

C、规则培训期间引导采集人员进行提问

D、培训期间进行实际案例演示,疏通采集逻辑

答案:A

192.为了提高检查的效率,在实际项目中往往会引入()

A、逐条抽取检查

B、抽样检查

C、机器检查

D、随机检查

答案:C

193.以下哪个选项,可能是优化答疑过程的目的()

A、提高答疑效率

B、优化答疑方式

C、提高项目准确率

D、以上都是

答案:D

194.以下关于数据标注规则培训说法正确的是()

A、只能通过线上的形式进行

B、培训人可以是质检人员

C、可以不进行规则培训

D、标注培训后可以不进行试标

答案:B

195.数据清洗中,针对重复数处理的描述,正确的是()

A、所有字段的值都相等的重复值可以保留

B、删除数据不会造成数据集大小变化

C、去重操作选取的字段会根据不同业务场景进行调整

D、不可只选取几个字段进行去重

答案:C

196.以下质检工作流程正确的是()

A、质检点确认-质检人员培训-输出批次数据质量报告-项目质量总结

报告

B、质检人员培训一标注人员培训I-项目质量总结报告-输出批次数据质

量报告

C、输出批次数据质量报告-质检人员培训-项目质量总结报告-质检点

确认

D、以上说法均不正确

答案:A

197.以下不属于数据标注项目规则培训目的的是()

A、让被培训人了解项目内容

B、明确如何开始试标

C、承接项目

D、明确质效要求

答案:C

198.在导出数据时,不可以进行筛选的数据信息是()

A、任务队列

B、任务状态

C、平台登录密码

D、任务周期

答案:B

199.Hadoop是()年诞生的?

A、1985-1985

B、1995-1996

C、2005-2006

D、2015-2016

答案:C

200.数据采集的基本步骤(ETL)中不包括哪项?

A、抽取转换

B、加载

C、计算

答案:C

201.人工智能中的〃强化学习〃是指什么?

A、让机器具备自主决策能力

B、通过奖惩机制让机器学习最优策略

C、利用神经网络进行学习和决策

D、让机器能够进行复杂问题的推理和决策

答案:B

202.〃大数据〃是需要新处理模式才能具有更强的决策力、洞察发现力

和流程优化能力来适应()、高增长率和多样化的信息资产。

A、海量

B、少数

C、小量

D、结构化

答案:A

203.什么是数据安全?

A、保护数据不被非法获取、篡改和破坏的措施

B、将数据转换成特定的格式的措施

C、存储数据的地方的措施

D、数据分析的工具的措施

答案:A

204.最初的大数据概念还比较模湖,只是隐约的知道像个性化推荐、

搜索引擎之类的处理需要大量数据,那么在搜索引擎方面,谁是世界

上最大的厂商?

A、谷歌

B、百度

C、360

D、bing

答案:A

205.人工智能的历史可以追溯到哪个时期?

A、20世纪50年代

B、19世纪80年代

C、21世纪90年代

D、18世纪30年代

答案:A

206.什么是特征工程(FeatureEngineering)?

A、一种无监督学习方法

B、一种数据可视化技术

C、一种数据预处理技术

D、一种优化算法

答案:C

207.数据智能是指利用什么技术和方法来提取、分析和利用数据?

A、人工智能

B、机器学习

C、数据挖掘

D、所有以上答案

答案:D

208.客服中心是运营商和客户接触较为频繁的通道,我们可以利用()

在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速

精准的找到答案。

A、大数据技术

B、客户画像

C、客户状态

D、客户心情

答案:A

209.O致力于计算机理解人类语言的句子或词语,目的是实现人机

交互。

A、文字校对技术

B、自然语言生成技术

C、中文自动分词技术

D、自然语言处理技术

答案:D

210.企业实行民主管理的基本形式是()

A、工会

B、职工代表大会

C、企业管理委员会

D、股东大会

答案:B

211.下列传感器中,哪个不属于本体感知型传感器0。

A、陀螺仪

B、光电编码器

C、霍尔效应编码器

D、超声波测距传感器

答案:D

212.关于函数参数传递中,形参与实参的描述错误的是()

A、实参与形参分别存储在各自的内存空间中,是两个不相关的独立

变量

B、Python实行按值传递参数。值传递指调用函数时将常量或变量的

值传递给函数的参数

C、实参与形参的名字可以相同,也可以不同

D、在函数内部改变形参的值时,实参的值也会改变的

答案:D

二.多项选择题

1.利用机器学习开发智能医疗系统的应用场景有?

A、医学图像分析

B、辅助诊断

C、药物研发

D、医疗流程优化

E、医疗知识图谱构建

答案:ABCD

2.需求分析的结果通常用于哪些方面?

A、制定产品开发计划

B、提高市场营销效果

C、优化运营流程

D、增加员工培训

答案:AC

3.智慧交通管理系统涉及哪些领域?

A、路况监测

B、交通预测

C、路径规划

D、异常事件处理

E、交通执法

答案:ABCD

4.开发多模态人机交互系统涉及的技术有?

A、计算机视觉

B、语音识别

C、手势识别

D、表情识别

E、交互行为建模

答案:ABCDE

5.测试集管理的内容包括?

A、数据存储

B、数据版本控制

C、数据访问权限管理

D、数据更新和维护

答案:ABCD

6.业务流程改进的目标包括哪些?

A、提高流程效率

B、减少流程步骤

C、优化资源分配

D、增加员工数量

答案:ABC

7.在智能产品选型过程中,哪些因素是需要考虑的?

A、产品功能

B、性能指标

C、成本效益

D、产品的市场营销策略

答案:ABC

8.数据收集的常用方法包括?

A、网络爬虫

B、数据库查询

C、传感器采集

D、手动录入

答案:ABCD

9.测试结果记录的重要性在于?

A、提供问题分析的依据

B、确保测试的可追溯性

C、提高测试覆盖率

D、提高测试效率

答案:AB

10.机器学习中,交叉验证的主要目的是什么?

A、评估模型的性能

B、选择最优模型

C、防止过拟合

D、增加模型复杂度

答案:AB

11.数据采集的方法有哪些?

A、问卷调查

B、传感器数据

C、网络爬虫

D、财务报表分析

答案:ABC

12.智能家居系统的主要应用场景有哪些?

A、家庭安全监控

B、自动化设备控制

C、环境监测

D、财务管理

答案:ABC

13.性能测试的主要目的是?

A、测试系统的稳定性

B、测试系统的响应时间

C、测试系统的负载能力

D、测试系统的安全性

答案:ABC

14.微服务架构的核心思想包括哪些?

A、将单一应用程序分解为多个小的独立服务

B、提高系统的安全性

C、增加系统的耦合度

D、提高系统的可维护性

答案:AD

15.需求收集的方法有哪些?

A、问卷调查

B、访谈

C、观察

D、实验

答案:ABC

16.提高数据标注质量的方法包括?

A、提供详细的标注指南

B、使用一致的标注规范

C、定期进行标注检查

D、使用自动标注工具

答案:ABCD

17.高级技师技能指导的方法主要有()。

A、作业前培训指导

B、课题指导

C、课堂式培训指导

D、现场培训指导

E、模拟培训指导

答案:CE

18.常见的测试方法有?

A、单元测试

B、集成测试

C、系统测试

D、回归测试

答案:ABCD

19.构建智能决策支持系统需要整合哪些能力?

A、数据采集与处理

B、知识库构建

C、推理与建模

D、可视化展现

E、交互式决策

答案:ABCDE

20.数据增强的主要目的是?

A、增加训练数据的多样性

B、减少模型的过拟合

C、提高模型的泛化能力

D、降低数据的复杂性

答案:ABC

21.微服务架构的主要优点有哪些?

A、提高系统的可维护性

B、增加系统的耦合度

C、提高系统的可扩展性

D、降低系统复杂性

答案:AC

22.评估人工智能系统的安全性包括哪些方面?

A、数据安全

B、模型安全

C、系统可靠性

D、隐私保护

E、伦理风险

答案:ABCDE

23.要创新,应必须做到().

A、学习钻研、激发灵感

B、大胆地试、大胆地闯

C、敢于提出新的问题

D、循规蹈矩

答案:ABC

24.确保测试集质量的方法包括?

A、数据一致性检查

B、标签准确性验证

C、数据去重

D、数据转换

答案:ABC

25.下列关于创新的论述中,不正确的是0。

A、创新就是出新花样

B、服务也需要创新

C、创新是企业进步的灵魂

D、引进别人的新技术不算创新

E、创新需要灵感,不需要情感

答案:ADE

26.以下属于实践性教学方法的有().

A、谈话法

B、练习法

C、讲授法

D、实验法

E、实习作业法

答案:BDE

27.机器人系统集成需要哪些人工智能能力?

A、计算机视觉

B、自然语言处理

C、智能规划与控制

D、机器人操作系统

E、运动学建模

答案:ABCD

28.机器学习在智能物流领域的应用包括?

A、需求预测

B、路径规划

C、仓储管理

D、配送优化

E异常检测

答案:ABCDE

29.在数据分析过程中,Python中常用的库有哪些?

A、pandas

B、numpy

C、matplotlib

D、scikit-learn

答案:ABCD

30.风险评估的步骤包括哪些?

A、识别风险

B、分析风险

C、制定应对策略

D、实施风险应对措施

答案:ABCD

31.常见的机器学习算法包括?

A、线性回归

B、决策树

C、支持向量机

D、K-means

答案:ABCD

32.常见的数据预处理方法有

A、数据挖掘

B、数据标注

C、数据清洗

D、信息脱敏

答案:CD

33.不属于常见问题解答模块的主要技术的是

A、问句相似度计算

B、语料库的构建

C、查询扩展

D、模式匹配

答案:BCD

34.以下框图顺序正确的是

A、从左到右,从上到下

B、从左到右,从下到上

C、大题-大题题号-小题-小题题号-答题区

D、大题-小题-大题题号-小题题号-答题区

答案:AC

35.关于Python正确的是

A、Python中的异常只是系统抛出

B、使用try语句可以捕捉异常

C、用户可以自定义异常

D、异常不会终止程序的执行

答案:BC

36.联想存储的特点是

A、可以存储许多相关(激励,响应)模式对

B、以分布、稳健的方式存储信息

C、即使输入激励模式完全失真时,仍然可以产生正确的响应模式

D、可在原存储中加入新的存储模式

答案:ABCD

37.拉框标注通常用于自动驾驶应用中的

A、行人标注

B、交通灯识别

C、车道线标注

D、汽车识别

答案:ABD

38.数据清洗过程中,总归可以归为3个阶段,分别是

A、数据加工

B、数据质量检查

C、数据校对

D、数据标准化

答案:BCD

39.机器智能种类包括

A、机器动作智能

B、机器行为智能

C、左右大脑加小脑功能

D、机器语言智能

答案:BC

40.下列属于感知智能的相关技术有哪几项

A、人脸识别

B、图像识别

C、语言识别

D、指纹识别

答案:ABCD

41.定义类如下:classhello():defshowinfo(sef):print(self,x)下

面描述正确的是

A、该类不可以实例化

B、该类可以实例化

C、在pycharm工具中会出现语法错误,说self没有定义

D、该类可以实例化,并且能正常通过对象调用showinfo()

答案:AC

42.下列选项中属于感知技术的是

A、机器学习技术

B、计算实施技术

C、语音识别技术

D、机器视觉

答案:CD

43.数据预处理是一种数据挖掘技术,包括

A、数据清洗

B、数据集成

C、数据归约

答案:ABC

44.Python可以应用以下那些领域

A、网站开发

B、人工智能

C、APP

D、数据科学

答案:ABCD

45.基因遗传算法的组成部分包括

A、初始化编码

B、适应度函数

C、选择

D、交叉和变异

答案:ABCD

46.自然智能包括

A、高级智能

B、超级智能

C、人类智能

D、机器智能

答案:CD

47.不能让计算机能够说话

A、STT

B、TTS

C、ASR

D、00T

答案:ACD

48.下列对人工智能芯片的表述,正确的是()

A、一种专门用于处理人工智能应用中大量计算任务的芯片

B、能够更好地适应人工智能中大量矩阵运算

C、相对于传统的CPU处理器,智能芯片具有很好的并行计算性能

D、目前处于成熟高速发展阶段

答案:ABC

49.认知语言更多的考虑

A、语法

B、词韵

C、语义

D、语用

答案:CD

50.以下那些方面是机器人能够做到的

A、医疗

B、围棋

C、写诗

D、灾害后救灾行为

答案:ABC

51.ASR在中文领域有很大的难度,主要原因是

A、中文博大精深

B、方言众多

C、目前ASR技术不成熟

D、数据量不够

答案:AB

52.数据预处理是一种数据挖掘技术,包括

A、数据清洗

B、数据集成

C、数据归约

D、数据变换

答案:ABCD

53.业务流程分析的第一步是?

A、基于模型的方法

B、基于统计的方法

C、基于专家知识的方法

D、基于随机选择的方法

答案:ABC

54.数据清洗的步骤包括?

A、数据去重

B、处理缺失值

C、数据标准化

D、数据变换

答案:ABCD

55.机器学习的主要类型有?

A、监督学习

B、无监督学习

C、半监督学习

D、强化学习

答案:ABCD

56.设计人工智能系统需要考虑哪些伦理原则?

A、公平公正

B、隐私保护

C、透明可解释

D、人工审核

D、删除特征

答案:ABC

57.分布式系统架构的优势有哪些?

A、提高系统扩展性

B、增强系统容错性

C、降低系统复杂性

D、提高系统的单点性能

答案:AB

58.机器学习在个性化推荐中可应用哪些算法?

A、协同过滤

B、内容推荐

C、关联规则挖掘

D、决策树

E、隐马尔可夫模型

答案:ABE

59.数据划分的目的是?

A、确保模型训练的公平性

B、验证模型的泛化能力

C、提供模型评估的基准

D、提高数据处理效率

答案:ABC

60.数据分析项目的常见步骤有哪些?

A、理解业务需求

B、数据采集

C、数据预处理

D、特征工程

E、模型训练

答案:ABCDE

61.数据集划分的常见方法有?

A、随机划分

B、分层抽样

C、时间序列划分

D、地理位置划分

答案:ABC

62.常用的测试结果分析指标包括?

A、精度

B、召回率

C、Fl-score

D、AUC

答案:ABCD

63.在CI/CD流程中,持续交付(CD)侧重于哪些方面?

A、自动化测试

B、自动化部署

C、用户培训

D、配置管理

答案:ABD

64.数据分析中常用的工具包括哪些?

A、Excel

B、Python

C、R

D、PowerPoint

答案:ABC

65.文本生成系统可应用于哪些场景?

A、智能写作辅助

B、自动摘要

C、文案创作

D、机器翻译

E、对话生成

答案:ABCE

66.以下哪些属于机器学习的分类任务?

A、图像识别

B、文本生成

C、情感分析

D、语音识别

答案:AC

67.提高测试集质量的方法有?

A、数据清洗

B、数据标注验证

C、数据安全检查

D、数据备份

答案:ABC

68.深度学习中的优化算法通常包括哪些?

A、随机梯度下降(SGD)

B、批量梯度下降(BatchGD)

C、小批量梯度下降(Mini-BatchGD)

D、遗传算法

答案:ABC

69.机器学习可支持实现智慧农业的哪些应用?

A、作物生长监测

B、病虫害识别

C、环境因子分析

D、产量预测

E、农资需求预测

答案:ABCDE

70.系统集成测试的步骤包括哪些?

A、计划

B、设计

C、执行

D、评估

答案:ABCD

71.测试方案设计中需要考虑的因素包括?

A、测试环境

B、测试数据

C、测试预算

D、测试时间

答案:ABD

72.在系统集成过程中,常见的挑战有哪些?

A、兼容性问题

B、性能瓶颈

C、数据一致性

D、用户界面设计

答案:ABC

73.业务流程重组的步骤包括哪些?

A、识别现有流程

B、设计新流程

C、实施新流程

D、评估新流程效果

答案:ABCD

74.自动驾驶汽车中的人工智能系统涉及哪些功能?

A、对象检测

B、行为预测

C、决策规划

D、信息融合

E、高精地图构建

答案:ABCD

75.性能优化的目标有哪些?

A、提高系统的响应速度

B、提高系统的稳定性

C、增加系统的开发时间

D、优化系统的外观设计

答案:AB

76.流程改进的常见方法有哪些?

A、消除冗余流程

B、自动化重复性任务

C、优化资源分配

D、增加员工培训

答案:ABC

77.构建测试集时应考虑的因素有?

A、数据的代表性

B、数据的多样性

C、数据的最新性

D、数据的完整性

答案:ABD

78.在集成测试中,常用的测试工具有哪些?

A、Jenkins

B、Selenium

C、JUnit

D、Photoshop

答案:ABC

79.在智能产品的协同工作机制中,关键技术有哪些?

A、数据通信协议

B、人机交互

C、系统集成

D、产品包装

答案:ABC

80.智能教育系统可提供哪些服务?

A、个性化学习路径

B、知识建模

C、自适应教学

D、在线考试

E、学习效果评估

答案:ABCE

81.数据处理的步骤包括哪些?

A、数据清洗

B、数据存储

C、数据分析

D、数据可视化

答案:ABC

82.测试结果分析的关键步骤有?

A、收集测试数据

B、分析测试结果

C、撰写测试报告

D、修复测试缺陷

答案:ABC

83.在项目管理中,成本控制的方法有哪些?

A、成本预测

B、成本预算

C、成本跟踪

D、成本优化

答案:ABCD

84.成人比较抗拒纯理论知识的讲解,喜欢实践,因此()教学方法更

适合成人教学。

A、纯讲授法

B、行动学习法

C、情境模拟法

D、演示法

答案:BCD

三.判断题

1.机器学习中,监督学习不需要标注数据进行训练。

A、正确

B、错误

答案:B

2.SWOT分析可以帮助识别项目的内部优势和外部机会。

A、正确

B、错误

答案:A

3.数据挖掘可以用来预测客户行为。

A、正确

B、错误

答案:A

4.头脑风暴的主要目的是生成大量创意。

A、正确

B、错误

答案:A

5.根据劳动法,用人单位在裁员前,必须向工会或全体员工说明情况,

听取意见。

A、正确

B、错误

答案:A

6.测试实施的第一步是搭建测试环境。

A、正确

B、错误

答案:A

7.行业生命周期的四个阶段是引入期、成长期、成熟期和衰退期。

A、正确

B、错误

答案:A

8.使用常用浏览器的〃隐身〃或〃无痕〃浏览模式时,浏览器将不会保存

任何历史记录、Cookie或临时文件。

A、正确

B、错误

答案:A

9.按照劳动法,未成年工享有与成年工相同的劳动报酬和福利待遇。

A、正确

B、错误

答案:A

10.项目管理的核心要素包括进度管理、成本管理和风险管理。

A、正确

B、错误

答案:A

11.杜邦分析法只适用于制造业企业。

A、正确

B、错误

答案:B

12.数据增强技术可以增加训练数据的多样性,提高模型的泛化能力。

A、正确

B、错误

答案:A

13.团队协作的重要性在于提高项目的效率和质量。

A、正确

B、错误

答案:A

14.数据清洗的目的是为了提高数据质量和一致性。

A、正确

B、错误

答案:A

15.需求管理是业务分析中一个持续的过程。

A、正确

B、错误

答案:A

16.测试集的版本控制有助于记录和追踪数据的变化。

A、正确

B、错误

答案:A

17.劳动法明确禁止用人单位以任何形式收取劳动者的押金。

A、正确

B、错误

答案:A

18.业务流程图主要用于展示业务流程的具体步骤。

A、正确

B、错误

答案:A

19.保持工作场所的清洁和整洁是每位员工的共同责任。

A、正确

B、错误

答案:A

20.测试集管理的内容不包括数据的版本控制。

A、正确

B、错误

答案:B

21.设计测试方案时,不需要考虑测试环境的影响。

A、正确

B、错误

答案:B

22.测试结果分析的主要目的是发现并修正系统中的缺陷。

A、正确

B、错误

答案:A

23.员工应该接受所有的工作指派,即使这些工作超出了他们的职责

范围。

A、正确

B、错误

答案:B

24.云计算的主要特征包括按需自助服务和广泛的网络访问。

A、正确

B、错误

答案:A

25.教学方法是教学策略的具体化,介于教学策略与判断教学实践之

间,教学方法要受制于教学策略。

A、正确

B、错误

答案:A

26.流程改进的目标是增加流程步骤。

A、正确

B、错误

答案:B

27.使用Pandas进行数据处理时,无法处理缺失值。

A、正确

B、错误

答案:B

28.智能产品的协同工作机制主要涉及产品间的数据交换和控制-

A、正确

B、错误

答案:A

29.数据可视化工具对于设计业务数据相关流程是非必须的。

A、正确

B、错误

答案:B

30.数据流设计的主要目的是优化数据传输路径。

A、正确

B、错误

答案:A

31.需求收集的方法包括问卷调查、访谈和观察。

A、正确

B、错误

答案:A

32.数据标注仅限于图像数据的标注。

A、正确

B、错误

答案:B

33.技能教学方法管控包括教学方法和测评方法的管控。

A、正确

B、错误

答案:A

34.根据劳动法,劳动者在法定工作时间之外提供的劳动应视为加班,

应支付加班费。

A、正确

B、错误

答案:A

35.智能产品的技术架构不包括传感器和执行器。

A、正确

B、错误

答案:B

36.数据划分是为了将所有数据用于训练模型。

A、正确

B、错误

答案:B

37.手工数据录入是业务数据采集流程设计中推荐的实践。

A、正确

B、错误

答案:B

38.实施后监控的主要任务是确保解决方案按计划执行。

A、正确

B、错误

答案:A

39.利益相关者分析不仅帮助识别谁会影响项目,还帮助理解如何管

理他们的期望。

A、正确

B、错误

答案:A

40.成本控制的主要目的是确保项目在预算内完成。

A、正确

B、错误

答案:A

41.K折交叉验证是一种常用的模型评估方法。

A、正确

B、错误

答案:A

42.测试结果记录的重要性在于提供问题分析的依据并确保测试的可

追溯性。

A、正确

B、错误

答案:A

43.在业务数据处理流程设计中,快速打字是一个关键技能。

A、正确

B、错误

答案:B

44.智能产品选型不需要考虑性能测试结果。

A、正确

B、错误

答案:B

45.按照劳动法,用人单位可以要求劳动者在每周工作7天,不休息。

A、正确

B、错误

答案:B

46.测试集质量保障包括对数据标签的准确性验证。

A、正确

B、错误

答案:A

47.根据劳动法,劳动合同终止时,用人单位应当向劳动者支付经济

补偿。

A、正确

B、错误

答案:A

48.智能产品的互操作性是指不同智能产品之间能够协同工作。

A、正确

B、错误

答案:A

49.授课技巧的高低是影响培训效果的关键因素。

A、正确

B、错误

答案:A

50.分布式系统架构的优势是降低系统复杂性。

A、正确

B、错误

答案:B

51.业务分析师应该避免使用数据可视化,因为它可能会混淆利益相

关者。

A、正确

B、错误

答案:B

52.在完成视频采集数据的质检后,需要结合数据中出现的典型和特

殊错误点输出质检报告。

A、正确

B、错误

答案:A

53.有些采集规则比较复杂,除了进行培训外,还需要多次根据实际

采集过程的反馈的问题进行规则修订,如果质检人员在采集过程中发

现问题可以进行修改()

A、正确

B、错误

答案:B

54.智能平台在后台进行数据导出需要相应权限

A、正确

B、错误

答案:A

55.为了高效完成文本采集项目的质检工作,我可以选择性地查看采

集文本数据,无需通篇检阅。

A、正确

B、错误

答案:B

56.在操作平台进行审核时,浏览器提示内存不足,此时可以检查或

关闭浏览器的插件,观察问题是否还存在。

A、正确

B、错误

答案:A

57.人效是衡量采集进度的重要指标之一()

A、正确

B、错误

答案:A

58.ASR项目中的常见错误可能有语音段截取错误和转写错误。

A、正确

B、错误

答案:A

59.项目标准培训时不需要对标注人员提问

A、正确

B、错误

答案:B

60.应该适当地设计实验或数据采集方法,以获得真实和完整的研究

究数据。

A、正确

B、错误

答案:A

61.无法通过项目培训对标注人员的吸收效果进行确认

A、正确

B、错误

答案:B

62.如果发现系统存在安全漏洞或数据泄露风险,需要立即反馈给技

术支持团队,以便进行修复和加固0

A、正确

B、错误

答案:A

63.在网络环境维度中,安装杀毒软件不符合智能平台安全运行的规

范()

A、正确

B、错误

答案:B

64.AIDP可以对30天前的历史数据进行导出。

A、正确

B、错误

答案:A

65.采集工作的异常数据包含数据遗漏

A、正确

B、错误

答案:A

66.采集方案是开展采集的重要指导性文件,采集方案中需要明确采

集的操作方法、采集设备、采集人力安排。

A、正确

B、错误

答案:A

67.及时对项目经验进行总结,包括分析共性问题和梳理特殊题目标

注方法,有助于提升项目质量。

A、正确

B、错误

答案:A

68.检查用户的身份认证、权限管理和操作日志等方面,确保用户的

合法性和操作的可追溯性。

A、正确

B、错误

答案:A

69.在项目执行过程中,可以向项目经理提需,增加快捷键从而增加

效率。

A、正确

B、错误

答案:A

70.返修过程中可以看到质检结果,也可以看到不合格原因,但是不

能修改质检结果。

A、正确

B、错误

答案:A

71.在对智能平台优化提需时,需要与技术支持人员进行充分的交流

和沟通,及时反馈问题和需求,以便更好地解决问题和满足需求。

A、正确

B、错误

答案:A

72.只要通过标准培训,就可以通过试标准入。

A、正确

B、错误

答案:B

73.A项目质量要求90%,抽检比例10%,某标注人员标注120条,质检

错误6条,该人员质量可达标。

A、正确

B、错误

答案:B

74.质检数据不合格的都需要申诉并安排质检员进行答疑。

A、正确

B、错误

答案:B

75.质检是数据采集规则培训中的关键环节()

A、正确

B、错误

答案:B

76.在确定数据采集需求的过程中,遇到模糊内容,应该沟通采集数

据需求方(客户),多方综合判断后再处理

A、正确

B、错误

答案:A

77.对于采集验收报告的撰写,需要根据需求填写项目是否合格及其

相应的合格率

A、正确

B、错误

答案:A

78.项目越成熟风险因素越少,甚至完全没有风险。

A、正确

B、错误

答案:B

79.智能平台在后台可以随意进行数据导出,无需相应权限

A、正确

B、错误

答案:B

80.按抽样率随机抽出盲审,盲审任务分配给不同于初审的人员审核。

若初/盲审核不一致则生成质检,抽样率不可调整。

A、正确

B、错误

答案:B

81.数据标注项目质检的质量报告输出的维度可以不向标注人员同步。

A、正确

B、错误

答案:B

82.可以通过利用网络爬虫或者数据埋点等方式进行数据采集。

A、正确

B、错误

答案:A

83.进行数据采集项目规则培训时,为了让学员快速掌握,需要结合

实操练习。

A、正确

B、错误

答案:A

84.质检提交时会检查是否修正全部不合格标注框以及视频帧,如果

未全部修改则不允许提交。

A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论