人工智能训练师三级理论知识试题及答案

上传人：h*** IP属地：广东上传时间：2026-03-14 格式：DOCX 页数：192 大小：116.44KB 积分：5.99 举报 版权申诉

已阅读5页，还剩187页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

一、单选题1.以下哪种数据标注类型主要用于图像识别任务，为图像中的不同对象添加边界框并标注类别？A.文本标注B.图像分类标注C.目标检测标注D.语义分割标注答案：C2.在人工智能训练中，以下哪个不属于常用的深度学习框架？A.TensorFlowB.PyTorchC.Scikit-learnD.Keras答案：C3.以下哪种数据增强方法适用于图像数据，通过改变图像的颜色、亮度、对比度等属性来增加数据多样性？A.旋转B.缩放C.颜色抖动D.翻转答案：C4.当训练模型出现过拟合现象时，以下哪种方法不能有效缓解？A.增加训练数据B.减少模型复杂度C.增加正则化项D.增加训练轮数答案：D5.以下关于人工智能训练师在数据清洗阶段的工作，描述错误的是？A.去除重复数据B.处理缺失值C.对数据进行分类标注D.纠正数据中的错误答案：C6.在自然语言处理中，以下哪个技术用于将文本转换为计算机能够理解的向量表示？A.词性标注B.词嵌入C.命名实体识别D.句法分析答案：B7.以下哪种评估指标常用于分类模型的性能评估？A.均方误差（MSE）B.准确率C.平均绝对误差（MAE）D.决定系数（R²）答案：B8.在人工智能训练中，以下哪种优化算法常用于调整模型的参数以最小化损失函数？A.梯度下降法B.主成分分析（PCA）C.聚类分析D.决策树算法答案：A9.以下关于人工智能训练数据的说法，正确的是？A.数据量越大越好，不需要考虑数据质量B.训练数据和测试数据可以完全相同C.数据的多样性对模型的泛化能力有重要影响D.只需要使用单一类型的数据进行训练答案：C10.在图像识别任务中，以下哪种卷积神经网络架构以其高效的特征提取能力和较少的参数而闻名？A.VGGB.ResNetC.MobileNetD.Inception答案：C11.以下哪种数据标注工具常用于图像标注？A.LabelImgB.ProdigyC.AmazonMechanicalTurkD.RapidMiner答案：A12.在人工智能训练中，以下哪种情况会导致梯度消失问题？A.使用ReLU激活函数B.网络层数过深C.增加训练数据D.减小学习率答案：B13.以下关于人工智能训练师在模型部署阶段的工作，描述正确的是？A.只需要将训练好的模型部署到服务器上即可，无需考虑其他因素B.要确保模型在不同环境下的性能和稳定性C.模型部署后不需要进行监控和维护D.部署的模型不需要与现有系统进行集成答案：B14.在自然语言处理中，以下哪种技术用于识别文本中的关键信息，如人物、地点、组织等？A.情感分析B.文本分类C.命名实体识别D.文本生成答案：C15.以下哪种数据预处理方法可以将数据缩放到指定的范围，通常是[0,1]？A.标准化B.归一化C.正则化D.离散化答案：B16.在人工智能训练中，以下哪种模型适合处理序列数据，如时间序列或文本？A.支持向量机（SVM）B.决策树C.循环神经网络（RNN）D.随机森林答案：C17.以下关于人工智能训练中的超参数，描述错误的是？A.超参数是在训练过程中自动调整的参数B.不同的超参数设置可能会导致模型性能的差异C.常见的超参数包括学习率、批量大小等D.超参数的选择需要通过实验和经验来确定答案：A18.在图像分类任务中，以下哪种评估指标可以衡量模型对正样本的识别能力？A.召回率B.特异度C.准确率D.F1值答案：A19.以下哪种数据标注方式适用于语音数据，将语音转换为文本并进行标注？A.语音转文字标注B.语音分类标注C.语音情感标注D.语音关键词标注答案：A20.在人工智能训练中，以下哪种策略可以提高模型的泛化能力？A.只使用单一类型的训练数据B.增加模型的复杂度C.进行数据增强D.减少训练数据量答案：C21.()工具可以将Caffe/TensorFlow等模型转化为华为NPU芯片支持的模型，供开发者直接使用。A.流程编排B.模型转换C.图引擎优化D.算子开发答案：B22.优化器的选择可能受到模型()的影响。A.复杂度B.形状C.色彩D.明亮度答案：A23.在团结协作中，对他人提供帮助是一种()。A.负面行为B.积极贡献C.无关紧要D.个体主义答案：B24.()填充缺失值费时费力，不适用数据集大的情况。A.人工B.回归分析C.全局常量D.均值填充答案：A25.关于支持向量机算法，以下说法错误的是?()A.可以解决线性可分问题B.可以解决线性不可分问题C.不能解决线性不可分问题D.将样本映射于高维空间答案：C26.()是人与计算机进行信息交互的接口界面。A.WiFi接口B.插件接口C.人机交互接口D.数据库接口答案：C27.敏感数据的()和去标识化处理、系统抵抗黑客攻击的能力等问题很突出。A.删除B.脱敏C.强化D.抛弃答案：D28.以下选项中，常用于分词的工具有()。A.jiebaB.gensimC.TF-IDFD.HMM答案：A29.当事人订立、履行合同，应当遵守()、行政法规，尊重社会公德，不得扰乱社会经济秩序，损害社会公共利益。A.法律B.道德C.义务D.意志答案：A30.ResNet通过()来增加卷积层数学习更深层次的特征。A.利用多个不同的kernel_size的卷积核B.加入残差块C.正则化D.加入RNN答案：B31.分布式文件系统能够方便不同用户使用，这表现了系统的()。A.可扩展性B.可靠性C.易用性D.高效性答案：C32.ASCII码表中的特殊字符NUL表示()?A.承认B.警告C.回车D.空白答案：D33.良好的文本标注是项目成功的()。A.过程B.基础C.结果D.无关因素答案：B34.()语音标注中检验每个的标注是否与语音数据发音的时间轴保持一致。A.字B.字母C.词语D.句子答案：A35.在Tensorflow2.0中，用于保存和加载模型权重的函数是()。A.tf.save_weightsB.tf.load_modelC.tf.save_modelD.tf.load_weights答案：C36.正则表达式一般进行()操作，进行文本匹配。A.图片B.字符串C.视频D.动画答案：B37.关于LSTM与RNN说法正确的是()。A.RNN比LSTM能记住更长的上下文信息B.双向的RNN比单向RNN更能捕捉上下文信息C.LSTM比RNN更容易发生梯度消失D.LSTM比RNN简单，而且模型效果好答案：B38.进行主成分分析要对数据进行()。A.去中心化B.中心化C.集成化D.去集成化答案：B39.以下不能用于评估模型的是()。A.准确率B.召回率C.汉明损失D.均值答案：D40.召回率(recall)的计算方法为()。A.(TP+TN)/(P+N)B.(FP+FN)/(P+N)C.TP/(TP+FP)D.TP/P答案：D41.文本语料的来源可能是()。A.报纸B.鼠标C.键盘D.耳机答案：A42.数据清洗的目的是()。A.过滤或修改不符合要求的数据B.节省数据存储空间C.提高数据使用效率D.去除内容复杂的数据答案：C43.HSV中V表示()。A.色相B.饱和度C.亮度D.红色答案：C44.()指的是在分布式数据库能方便地通过水平或垂直扩展提高系统的整体性能，且不需要改变系统程序。A.数据冗余性B.易扩展性C.透明性D.自治性答案：B45.以下不属于TensorFlow2.0中查看是否是tensor的方法的是()。A.is_tensorB.isinstanceC.deviceD.type答案：C46.PyTorch的主要特点之一是其()。A.高效率B.易学易用C.100%准确D.低计算要求答案：B47.结巴分词的安装包括全自动安装、()和手工安装。A.半自动安装B.电动安装C.水力安装D.机械安装答案：A48.以下()不属于linux系统。A.windowsB.centosC.ubuntuD.redhat答案：A49.反向传播算法包含以下哪个阶段?()A.部署上线B.权重更新C.初始化D.数据预处理答案：B50.对于脸部截断或者戴口罩的人脸图片，选择()标注，合理推断每个点位。A.普遍性B.大多数C.随机性D.推测性答案：D51.深度学习和机器学习算法说法正确的是()。A.机器学习就是深度学习B.机器学习包含深度学习C.深度学习包含了机器学习D.以上都是答案：B52.关于概率图模型的描述，下列说法正确的是()。A.HMM属于有向图模型B.马尔可夫网络属于有向图模型C.贝叶斯网络属于无向图模型D.CRF属于有向图模型答案：A53.模型中的正则化项用于()。A.提高模型复杂度B.降低模型复杂度C.增加数据维度D.减少数据维度答案：B54.()以下哪个是文本分类的步骤?A.图片分类B.文本分类模型建立C.语义分割D.人脸识别答案：B55.以下属于集成学习算法的是()。A.DecisiontreeB.LogisticC.BoostingD.SVM答案：C56.MoXing的主要功能是()。A.华为自研的深度学习工具库B.华为自研的深度学习引擎C.TensorFlow等深度学习引擎的分布式训练加速框架、API接口的封装和加速D.TensorFlow等深度学习引擎API接口的简单封装答案：C57.在昇腾芯片硬件架构中，优化的重点是提高()。A.训练速度B.推理性能C.存储效率D.所有以上答案：B58.根据数据标注对象不同，可以分为()标注、语言标注、图像标注和视频标注。A.文本B.地点C.图形D.时间答案：A59.关于职业道德对企业发展的积极作用，你认为正确的论述是()。A.职业道德是协调同事之间关系的法宝B.职业道德只能维系职工与领导之间的表面关系C.与物质激励相比，职业道德的作用较弱D.遵守职业道德有助于提高服务水平，但对提高产品质量的作用不明显答案：A60.()是数据的基本单位。A.数据项B.集合C.数组D.组合项答案：B61.集成学习中的Voting方法是基于()进行的。A.平均B.投票C.加权求和D.选择最优模型答案：B62.图像类标注任务的数据结果为带有()的信息?A.格式B.特征C.标签D.数量答案：C63.以下关于图像滤波说法不正确的是()。A.图像处理中滤波将信号中特定的波段频率滤除，从而保留所需要的波段频率信号。B.中值滤波器将邻域内像素排序后的中位数值输出以代替原像素值。它能实现降噪，但无法保留了原始图像的锐度。C.图像滤波分为线性滤波和非线性滤波D.图像滤波是图像预处理的主要流程之一，在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制。答案：B64.下列哪一个不是语音预处理的操作?()A.预加重B.分帧C.加窗D.加权答案：B65.Iinux中ps-f命令中表示“进程ID”信息的是()。A.UIDB.PIDC.PPIDD.CMD答案：B66.下面属于多媒体素材编辑软件的是()。A.电脑管家B.数据库软件C.文件管理D.视频编辑工具答案：D67.深度学习中常见的优化算法包括()。A.支持向量机B.AdaBoostC.遗传算法D.梯度下降答案：D68.()是由人和计算机共同组成的一个系统。A.苹果系统B.人机协同系统C.操作系统D.鸿蒙系统答案：B69.手部的21个关键点包括()、各指尖以及各指节骨连接处。A.脚腕B.手腕C.脚尖D.脚踝答案：B70.MindSpore框架提供了丰富的()功能，适用于不同应用场景。A.部署B.训练C.推理D.所有以上答案：D71.优化器的学习率是一个()参数。A.固定的B.动态的C.随机的D.不相关的答案：B72.分布式存储系统的可伸缩性指的是其能够()。A.限制存储容量B.支持大规模扩展C.降低带宽需求D.简化管理任务答案：B73.在最优策略求解中，动态规划和贪婪算法的主要区别在于()。A.时间复杂度B.是否考虑全局最优解C.是否适用于连续问题D.是否适用于离散问题答案：B74.Python中，文本数据是使用()。A.intB.floatC.stringD.ouble答案：C75.模型的准确度是指模型在()方面的表现。A.数据规模B.特定任务C.时间复杂度D.空间复杂度答案：B76.下列不属于HMM模型问题的是()。A.解码B.学习C.评估D.测试答案：D77.HSV中V取值范围为()。A.0-360B.0-1C.0-180D.-2答案：B78.Iinux中Is是什么操作。()A.以最基本的形式显示当前目录下的文件和目录B.切换目录C.修改D.查询答案：A79.以下哪个是常用的损失函数()?A.ReLUB.SoftmaxC.交叉熵D.感知器答案：C80.计算机病毒是编制者在计算机()中插入的破坏计算机功能或者数据的代码。A.程序B.文件C.系统D.网络答案：A81.在模型中使用正则化项的目的是()。A.提高模型复杂度B.防止过拟合C.增加数据维度D.减少数据噪声答案：B82.人脸3D朝向工具涉及的()、辅助调整的操作很多。A.更新B.旋转C.裁剪D.删除答案：B83.TPOT是宾夕法尼亚大学遗传算法实验室开发的一个()框架。A.苹果系统B.鸿蒙系统C.自动机器学习D.元学习答案：C84.要解决数据的()、敏感数据的脱敏和去标识化处理等问题。A.标注B.来源合法性C.清洗D.收集答案：D85.模型的有效性通常通过()来评估。A.复杂度B.准确度C.速度D.精确度答案：B86.()中的人身权是与智力活动成果创造人的人身不可分离的专属权。A.知识产权B.私有产权C.劳动产权D.共有产权答案：A87.以下不是大数据存储需要注意的是()。A.延时B.数据吞吐速度C.能源的消耗D.存储模型设计答案：C88.CART算法选择()作为属性选择标准。A.信息增益B.信息增益率C.基尼系数D.经验答案：C89.()为使用者提供一个分配、流转和协作处理问题的工作平台。A.产品开发工具B.信息交流工具C.问题管理工具D.备忘录工具答案：C90.以下不是特征选择方法的是()。A.伸缩聚类B.过滤法C.递归消除法D.嵌入法答案：A91.KNN的K值选择方法不包括()。A.取训练集中样本总数的平方根B.根据验证集，通过交叉验证确定K值C.基于经验D.设为样本总个数答案：D92.以下属于人脸识别步骤的是()。A.文本标注B.语音标注C.视频标注D.人脸表情分类答案：D93.下面属于数据预处理的是()。A.数据缺失值处理B.文本分析C.分类预测D.模式识别答案：A94.当事人应当()公平原则确定各方的权利和义务。A.遵循B.学习C.效仿D.违背答案：A95.强化学习中，奖励信号的作用是()。A.惩罚智能体B.提供学习方向C.限制动作空间D.减小探索率答案：B96.以下哪个选项不属于自然语言处理技术的三个层面()。A.词法分析B.句法分析C.语音分析D.语义分析答案：C97.Iinux中more是什么操作。()A.查看文本内容B.切换目录C.修改D.查询答案：A98.手势识别可以被视为()理解人体语言的方式，从而在机器和人之间搭建比原始文本用户界面或甚至图形用户界面更丰富的桥梁。A.计算机B.机械C.动物D.机器人答案：A99.神经网络深度过深容易出现()问题。A.梯度消失B.梯度爆炸C.模型欠拟合D.训练数据丢失答案：A100.假如你在训练一个线性回归模型，有下面两句话：1.如果数据量较少，容易发生过拟合。2.如果假设空间较小，容易发生过拟合。关于这两句话，下列说法正确的是()。A.1和2都错误B.1正确，2错误C.1错误，2正确D.1和2都正确答案：B101.以下不属于爱岗敬业的表现的是()。A.树立理想B.强化责任C.提高技能D.玩忽职守答案：D102.在梯度下降算法中，有各种不同的改进版本。在面向对象的语言实现中，往往把不同的梯度下降算法封装成一个对象，称为()。A.迭代器B.装饰器C.优化器D.加速器答案：C103.ModelArts目前支持的预置模型不包括()。A.图像分类B.物体检测C.基因测序D.图像分割答案：C104.以下根据邻近值决定其类别的监督算法是()。A.knnB.kmeansC.SVMD.决策树答案：A105.人工神经网络包括输入层、()和输出层。A.卷积层B.池化层C.隐藏层D.Softmax层答案：C106.以下损失函数可以用于回归任务的是()。A.Hinge损失函数B.L2损失函数(MSE:均方误差)C.0-1损失函数D.交叉熵损失函数答案：B107.最基本的超参数优化算法之一是()。A.鸿蒙系统B.网格搜索C.苹果系统D.安卓系统答案：B108.()用于较复杂和耗时的数据分析和处理，一般通常构建在云计算平台之上。A.机械挖掘B.离线数据分析C.手动挖掘D.物理挖掘答案：B109.()数据标注中，负责标记数据的是哪个角色?A.标注员B.审核员C.管理员D.检查员答案：A110.在()境内的企业、个体经济组织(以下统称用人单位)和与之形成劳动关系的劳动者，适用《中华人民共和国劳动法》。A.中国B.美国C.俄罗斯D.法国答案：A111.以下哪个不是华为一站式AI开发平台ModelArts目前支持的预置模型?()A.基因测序B.物体检测C.图像分类D.图像分割答案：A112.以下哪个不是深度学习的优化器?()A.MomentumB.AdaboostC.AdagradD.Adam答案：B113.在算法的特点中，复杂性通常与算法的()相关。A.时间复杂度B.空间复杂度C.算法优势D.数据规模答案：A114.()泛指将收集到的原始信息按照一定程序和方法进行处理。A.食品加工B.流程加工C.信息加工D.机械加工答案：C115.Tensorflow2.0中的KerasSequential模型适用于()。A.多输入多输出模型B.复杂的非线性拓扑结构C.简单的线性堆叠模型D.循环神经网络答案：C116.()通过在文本文件最后一行后放置文件来指明文件的结束。A.截止标志B.开始标志C.结束标志D.转折标志答案：A117.以下不属于常见的强化学习应用场景的是()。A.商品推荐系统B.新闻推荐系统C.人脸识别D.围棋游戏答案：C118.下面属于数据预处理过程的是()。A.数据挖掘B.模型构建C.数据清理D.回归预测答案：B119.团结协作能够提高团队的()。A.竞争性B.创造力C.分歧D.紧张氛围答案：B120.以下哪个属于机器学习的主要分类任务?()A.图像生成B.文本分类C.语音合成D.数据聚类答案：B121.正则化在深度学习中可以通过以下哪种方式实现?()A.减小学习率B.DropoutC.增加网络深度D.使用梯度下降答案：B122.文件系统的作用是()。A.处理图形处理B.硬件管理C.存储管理D.网络管理答案：C123.以下不属于训练词向量的算法的是()。A.Word2VecB.FasttextC.GloveD.Negativesling答案：D124.下面属于定序等级的数据的是()。A.成绩等级B.血型C.工作种类D.人名答案：A125.隐马尔科夫链解码问题使用的经典算法是()。A.EM算法B.前向算法C.Viterbi算法D.后向算法答案：C126.最优策略求解中，回溯算法常用于解决()问题。A.最短路径B.图像处理C.搜索D.数据挖掘答案：C127.ModelArts预置模型的本质是()。A.强化学习B.GANC.迁移学习D.增强学习答案：C128.在多媒体应用中，音频信号处理常用于()。A.图像分析B.语音识别C.视频编码D.文本处理答案：B129.大部分数据文件以()格式存储。A.二进制B.八进制C.十进制D.十六进制答案：A130.()公民、法人或者非法人单位的作品，不论是否发表，依照《中华人民共和国知识产权法》享有著作权。A.中国B.日本C.法国D.德国答案：A131.以下哪种神经网络解决了网络退化问题?()A.CNNB.RNNC.FasterR-CNND.ResNet答案：D132.TensorFlow2.0不支持以下哪个运算符()。A.//B.C.powD.^答案：D133.Iinux中mkdir是()操作。A.显示文件最后几行内容B.创建目录C.修改D.查询答案：B134.团结协作在解决复杂问题时的作用类似于()。A.放弃B.单打独斗C.求助他人D.逃避责任答案：C135.通常使用以下哪个模型对强化学习问题建模?()A.隐马尔科夫模型B.高斯混合模型C.动态规划D.马尔科夫决策过程答案：D136.计算机病毒具有()特点，通常是指在其它正常程序或数据中寄生。A.隐蔽性B.寄生性C.可触发性D.传染性答案：B137.算法的特点通常包括()。A.易实现B.高效率C.无偏差D.100%准确答案：B138.最优策略求解中，贪婪算法的特点是()。A.综合考虑长远利益B.只考虑当前局部最优解C.适用于所有问题D.不受时间复杂度限制答案：B139.循环神经网络中的隐藏层具有记忆功能，可以()过去的信息。A.重构B.保留C.遗忘D.替换答案：C140.CNN用参数相同的kernel去扫描整副图像。实现了同一图像在不同位置、不同角度的旋转、不同大小、不同光照等条件下，都会被识别为同一物体，这一特点体现了CNN哪方面的核心思想()。A.局部感知B.全局共享C.尺度不变D.降维答案：B141.GAN属于以下哪种神经网络()。A.反馈神经网络B.卷积神经网络C.循环神经网络D.生成对抗网络答案：D142.分布式文件系统有相应的容错机制，这表现了系统的()。A.可扩展性B.可靠性C.易用性D.高效性答案：B143.()在下列节日期间应当依法安排劳动者休假。A.情人节B.父亲节C.母亲节D.清明节答案：D144.下面在神经网络中引入了非线性的是()。A.随机梯度下降B.ReLUC.卷积函数D.以上都不正确答案：B145.字词的重要性随着它在文件出现的次数()。A.反比下降B.正比增加C.保持不变D.无法评价答案：B146.单链表中，我们对于每个节点除了需要定义数据之外还必须定义()。A.链表的终止符B.链表的头节点C.链表的指针域D.链表的尺寸答案：C147.在AI服务中，语音识别的主要应用场景包括()。A.语音助手B.语音翻译C.语音搜索D.所有以上答案：D148.优化器的选择对模型的训练过程和结果有着重要的()。A.影响B.作用C.需求D.必要性答案：A149.Iinux中head操作默认显示()行。A.10B.5C.20D.2答案：A150.MindSpore框架支持的硬件加速是()。A.CUDAB.OpenCLC.AscendD.ROCm答案：C151.()下列哪一项是在数据库选取硬件配置时不是主要的考虑因素。A.硬件的品牌B.日常访问用户数量C.高峰期每个用户的访问频率D.系统冗余比例答案：A152.昇腾芯片硬件架构的性能特点使其适用于()。A.移动设备B.云计算C.嵌入式系统D.所有以上答案：D153.将人的推理能力和智力不断向人工智能系统迁移和放大，这是一个()的过程。A.一般迁移B.常见迁移C.普通迁移D.智能迁移答案：D154.文本情感分类是()对于文本中表达的情感进行分类的计算。A.计算机B.控制器C.翻译器D.分析器答案：A155.计算机病毒的自我复制是指()。A.病毒能够自动修复文件B.病毒传播到新的文件或系统C.病毒自动删除文件D.病毒能够修改文件属性答案：B156.在图像识别流程设计中，什么是数据预处理的作用?()A.增加数据噪声B.提高模型复杂度C.改善数据质量D.减小数据规模答案：C157.关于孤立词识别说法错误的是()。A.孤立词识别需要提前指定候选词集B.孤立词识别输入的是一个词的语音文件C.孤立词识别的难度大于连续词识别D.孤立词识别常用的算法是HMM-GMM答案：C158.在Tensorflow2.0中，用于保存整个模型的函数是()。A.tf.save_modelB.tf.saveC.tf.save_graphD.tf.export_model答案：A159.自主无人系统的()是一种智能控制器。A.风扇B.控制器C.内存D.磁盘答案：A160.正则化在深度学习中的主要目的是()。A.提高模型复杂度B.减小模型容量C.避免过拟合D.加速训练过程答案：C161.中文分词主要针对()。A.英文B.法文C.德文D.中文答案：D162.在强化学习中，贝尔曼方程用于()。A.衡量动作的价值B.预测状态转移概率C.限制智能体的行为D.计算累积奖励答案：D163.Atlas人工智能计算平台支持哪些Al服务?()A.人脸识别B.语音合成C.自然语言处理D.所有以上答案：D164.训练CNN时，可以对图像进行平移、缩放等预处理来提高模型()能力。A.模仿B.适应C.泛化D.编码答案：C165.()是基于自然选择理论的宏启发式算法。A.加法B.减法C.遗传算法D.乘法答案：C166.昇腾芯片软件架构的设计理念注重()。A.开放性B.封闭性C.单一性D.所有以上答案：A167.以下选项不属于华为云EI自然语言处理服务提供的意图理解API所支持的领域的是()。A.运动类B.天气类C.新闻类D.闹钟类答案：A168.关于词向量用One-hot编码方式的描述，不正确的是()。A.容易产生维度灾难B.每个词都处于同等的重要程度C.实现了文本向量化D.语义相近的词，其词向量距离也越近答案：D169.文件的操作类别中，复制文件属于()。A.创建B.修改C.移动D.删除答案：A170.在隐马尔科夫问题中，通过观测数据推断模型参数的问题属于()问题。A.学习B.评价C.解码D.编码答案：A171.()是受生物免疫系统启发而推出的智能搜索算法。A.加法B.减法C.乘法D.免疫算法答案：D172.机器学习中的朴素贝叶斯算法主要用于()。A.分类B.回归C.聚类D.强化学习答案：A173.下列属于正则化的有()。A.dropoutB.SigmoidC.tanhD.LeakyReLU答案：A174.机器学习中的决策树算法可用于()。A.聚类B.分类C.回归D.降维答案：B175.()是指发现并纠正数据文件中可识别的错误的一道程序。A.删除B.数据清洗C.查询D.增加答案：B176.文件的操作类别中，查找文件属于()。A.创建B.修改C.移动D.删除答案：D177.以下算法不可以用于文本分类的是()。A.朴素贝叶斯B.奇异值分解C.卷积神经网络D.循环神经网络答案：B178.在深度学习中，激活函数用于()。A.增强模型的表达能力B.减小模型的复杂度C.优化模型参数D.数据标准化答案：A179.深度学习开发中，常用的优化器包括()。A.SGDB.RMSpropC.AdamD.所有选项都正确答案：D180.文件的操作应用中，重命名文件通常用于()。A.创建新文件B.修改文件内容C.更改文件名称D.删除文件答案：C181.以下不属于深度学习神经网络的是()。A.CNNB.RNNC.LogisticD.LSTM答案：C182.以下哪个任务属于多媒体应用中的图像处理?()A.语音合成B.图像分割C.文本分类D.数据聚类答案：B183.循环神经网络中的时间步表示模型对输入数据的()。A.顺序关系B.随机性C.特征提取D.变化答案：A184.下列是Linux系统的优点的是()。A.时效性B.一致性C.安全性好D.波动性强答案：C185.MindSpore框架中的计算图构建方式是()。A.静态图B.动态图C.静态动态都支持D.无法确定答案：B186.以下()是降维算法。A.PCAB.网格搜索C.LassoD.k-means答案：A187.服务器进行软件升级时应该()。A.最小化影响范围及人群B.采用最快的升级策略C.采用工作量最小的升级策略D.随意选取时间段进行升级答案：A188.ModelArts自动学习服务可以使用户零代码实现的不包含以下哪一项()。A.数据标注B.模型训练C.部署上线D.数据分离答案：D189.基于区域建议的算法，也被归纳为Two-Stage算法，该类算法进行目标检测时分两步，首先进行候选区域提取，再进行最终的分类和定位。以下不属于Two-Stage算法的是()。A.R-CNNB.FastR-CNNC.FasterR-CNND.SSD答案：D190.()是一种近似逼近的方法，属于基于序列模型优化的算法。A.界面优化B.显示优化C.贝叶斯优化D.声音优化答案：C191.数据分类的基本原则不包括()。A.稳定性B.综合实用性C.兼容性D.随机性答案：D192.GRU属于以下哪种神经网络()。A.前馈神经网络B.卷积神经网络C.循环神经网络D.生成对抗网络答案：C193.专家系统的知识表示通常采用()。A.数据库存储B.图形处理C.人工规则D.随机算法答案：C194.下列关于表格型数据处理说法不正确的是()。A.Pandas以及Numpy提供多种数据类型以及相应处理方法。B.Sklearn中机器学习方法一般直接将模型训练在整个数据集上。C.进行表格型数据之前一般要进行很长时间的预处理。D.对于分类回归聚类等不同的数据挖掘方法，将有不同的模型评估指标答案：B195.以下不属于系统维护内容的是()。A.系统应用程序维护B.数据维护C.代码维护D.数备查询答案：A196.以下不属于语音信号特征提取的方法的是()。A.LPCB.MFCCC.LPCCD.LPCCC答案：D197.词频统计可以统计单词的次数和()。A.词性B.笔画C.出现频率D.大小答案：C198.()以下哪个操作属于数据增强?A.数据标准化B.分类C.聚类D.有监督学习答案：A199.Iinux中rmdir是()操作。A.显示文件最后几行内容B.删除目录C.修改D.查询答案：B200.数据处理中的异常值处理常采用的方法是()。A.删除包含异常值的样本B.用中位数替代异常值C.使用均值平滑异常值D.忽略异常值答案：A201.模型中的参数调优通常使用的方法是()。A.交叉验证B.特征选择C.数据标准化D.集成学习答案：A202.下面是机器学习的应用领域的是()。A.物理领域B.建筑学分析C.力学分析D.模式识别答案：D203.Iinux中cd是什么操作。()A.新建B.切换目录C.修改D.查询答案：B204.下列哪个工具不属于文本处理工具()。A.NotePadB.NotdPad++C.Wise开放标注平台D.画图答案：D205.深度学习中的权重共享是指()。A.不同层之间共享权重B.不同模型之间共享权重C.不同任务之间共享权重D.不同样本之间共享权重答案：C206.以下不属于常用容灾技术中网络层镜像的优点的是()。A.屏蔽主从站点之间的存储阵列的异构性B.对镜像卷的处理能力要求低C.降低本地数据保护的成本D.镜像卷能提供连续的数据访问答案：D207.可以通过()清洗网页数据，匹配有效的数据。A.正则表达式B.文本编辑C.图片裁剪D.网页裁剪答案：C208.下面是结巴分词的功能的是()。A.数据挖掘B.表格分析C.词性标注D.图片剪辑答案：C209.根据数据标注对象不同，可以分为文本标注、语言标注、()标注和视频标注。A.时间B.图像C.地点D.工程师答案：B210.公司服务器每天会产生大量数据，为能方便保存并在需要时快速调取记录，需要进行()。A.文档管理B.日志管理C.问题管理D.变更管理答案：B211.分类算法预测的标签是()。A.离散型B.连续型C.自变型D.因变型答案：A212.隐马尔科夫链解码问题常常使用的算法是()。A.前向后向算法B.前向算法C.维特比算法D.后向算法答案：C213.如果一个前馈神经网络具有线性输出层和至少一层隐藏层，只要给予网络足够数量的神经元，便可以实现以足够高精度来逼近任意一个在n维实数空间的紧子集上的连续函数。这个定理是()。A.万能函数定理B.万能逼近定理C.万能网络定理D.万能连续定理答案：B214.一般说，Numpy-Matplotlib-Pandas是数据分析和展示的一条学习路径，以下对这三个库不正确的说明是()。A.Pandas仅支持一维和二维数据分析，多维数据分析要用NumpyB.Matplotlib支持多种数据展示，使用Pyplot子库即可C.Numpy底层采用C实现，因此，运行速度很快D.Pandas也包含一些数据展示函数，可不用Matplotlib答案：A215.算法分类的应用可以帮助选择适用于不同任务的()。A.硬件设备B.编程语言C.算法模型D.操作系统答案：C216.数据处理是数据挖掘之前必不可少的()。A.最终目的B.最低目标C.理想目标D.准备工作答案：D217.以下哪个是用于回归问题的常见损失函数()?A.交叉熵B.均方误差C.SoftmaxD.Sigmoid答案：B218.()需要对文本内容进行文字识别和标注。A.图像标注B.语言标注C.视频标注D.文本标注答案：D219.主成分分析属于()。A.有监督学习B.半监督学习C.强化学习D.无监督学习答案：D220.Iinux中In是什么操作。()A.给文件或目录创建连接B.切换目录C.修改D.查询答案：A221.关于智能体的策略描述正确的是()。A.策略是指在给定环境下智能体的期望回报B.策略是指在给定环境下智能体的动作概率分布C.策略越随机越好D.对于已给给定的环境最优策略只有一个答案：B222.将word文档转换成pdf格式可能会出现()问题。A.文字准确B.段落分明C.文字乱码D.结构清晰答案：C223.小批量梯度下降中的小批量体现在()。A.每次参数迭代时都使用从数据集抽出一部分进行训练B.每次参数迭代时都使用从特征中抽出一部分进行训练C.每次参数迭代时都使用从误差中抽出一部分进行训练D.每次参数迭代时都使用从超参数中抽出一部分进行训练答案：A224.下面哪些数据可以需要进行处理()。A.正确的数据B.可信的数据C.缺失值数据D.有效的数据答案：C225.以下哪个选项不属于自然语言处理技术的三个层面?()A.词法分析B.句法分析C.语音分析D.语义分析答案：C226.下列关于Word2vec的说法不正确的是()。A.不易产生维度灾难B.语义相近的词，其词向量距离也越近C.训练完之后，每个词的词向量可以根据上下文进行动态调整D.实现了文本向量化答案：C227.根据数据标注()不同，可以分为文本标注、语言标注、图像标注和视频标注。A.时间B.地点C.标注师D.对象答案：D228.Atlas人工智能计算平台主要用于()。A.数据挖掘B.图像识别C.语音识别D.文本分析答案：B229.以下不属于逻辑服务器的是()。A.数据库系统B.网页，客户端C.文件存储系统D.数据交换系统答案：B230.Sigmoid激活函数的输出范围是()。A.0到1B.-1到1C.任意实数D.0到正无穷答案：A231.以下不属于模型的超参数的是()。A.池化层中的步长B.神经网络的权重C.学习率D.卷积层中卷积核的大小答案：B232.文本情感分析研究涵盖了包括自然语言处理、挖掘、信息检索、信息抽()取、机器学习和本体学等多个领域。A.信息B.数字C.文本D.语句答案：A233.以下哪项是数据交付的步骤()。A.特征规约B.邮件通知C.样本集成D.属性构造答案：B234.()是分析网页数据之前的重要步骤。A.数据分类B.数据分析C.数据挖掘D.清洗数据答案：D235.下面关于Series和DataFrame的理解，哪个是不正确的?()A.DataFrame表示带索引的二维数据B.Series和DataFrame之间不能进行运算C.Series表示带索引的一维数据D.可以像对待单一数据一样对待Series和DataFrame对象答案：B236.()标注需要对文本内容进行文字识别和标注。A.文本B.语言C.视频D.图像答案：A237.统计一个词在不同文件中的出现次数的变化趋势可以用()展示。A.箱线图B.草图C.饼图D.折线图答案：D238.在数据处理中，One-Hot编码常用于处理()。A.连续型数据B.缺失值C.文本数据D.分类变量答案：D239.Iinux中tail操作默认显示()行。A.10B.5C.20D.2答案：A240.要搜索“口味虾的做法”,可以用()。A.浏览器B.电脑管家C.画图软件D.办公软件答案：A241.HMM可以做的所有事情，CRF()。A.都能做B.都不能做C.部分能做D.以上都不是答案：A242.计算机病毒的防范措施包括()。A.定期更新操作系统和防病毒软件B.随意点击未知链接C.共享病毒样本D.不使用防火墙答案：A243.数据采集和()行业的链条长。A.标注B.清洗C.删除D.收集答案：A244.()语音类型的数据结果包含哪些内容?A.标签信息B.特征C.数量D.图片答案：A245.AI服务中的自然语言处理任务涵盖了哪些方面?()A.文本分类B.文本生成C.语音识别D.所有以上答案：D246.分布式存储的特点不包括()。A.可扩展B.高性能C.高容错D.高成本答案：D247.ModelArts训练作业支持用户自定义算法，用户的代码()上传。A.通过云硬盘上传B.通过OBS上传C.通过网络存储服务上传D.通过网页上传答案：B248.线性回归模型的预测结果是()。A.离散值B.分类标签C.连续值D.类别概率答案：C249.常用的数据类型是()。A.数值型B.机械硬盘C.固态硬盘D.字节答案：D250.以下关于sklearn说法错误的是()。A.fit(x,y):传入数据以及标签即可训练模型。但是每个方法训练的时间和参数设置，数据集大小以及数据本身的特点有关B.sklearn中包含了大量的优质的数据集，在你学习机器学习的过程中，你可以通过使用这些数据集C.sklearn提供多种数据预处理方法如数据归一化以及正则化D.通常我们经常会把训练数据集进一步拆分成训练集和验证集，这个划分比例是规定的答案：D251.以下不属于隐马尔科夫模型的三大问题的是()。A.学习B.解码C.预测D.确定隐藏状态集合答案：D252.模型的有效性评估可以包括对其在不同数据集上的()。A.泛化能力B.精度C.训练速度D.参数数量答案：A253.深度学习中常用的损失函数MSE代表()。A.MaximumB.MeanC.MinimumD.Median答案：B254.专家系统的推理引擎负责()。A.数据挖掘B.逻辑推理C.文件系统设计D.并行计算答案：B255.ID3算法选择()作为属性选择标准。A.信息增益B.信息增益率C.基尼系数D.经验答案：A256.计算机存储单位中，1KB等于多少字节()?A.1024B.1000C.1048D.1002答案：A257.下面属于数据清洗的是()。A.物理分析B.文本分析C.删除缺失值D.化学分析答案：C258.损失函数在神经网络中的重要性主要体现在()。A.加速数据输入B.提高计算速度C.评估模型性能D.增加层的数量答案：C259.多层次智能不包括()。A.感知智能B.分布智能C.思维智能D.行为智能答案：C260.下列哪一个是家用智能设备()。A.桶装水B.铅笔C.电吹风D.自动扫地机器人答案：D261.集成学习中的Bagging方法主要用于()。A.特征选择B.数据降维C.模型集成D.参数优化答案：C262.机器学习算法中，以下不属于集成学习策略的是()。A.BaggingB.oostingC.StackingD.Marking答案：D263.下面是python的数据类型的是()。A.整型B.表格C.指针D.文档答案：A264.()需要想数据标注公司明确表达自己的需求。A.数据标注员B.需求公司C.网络工程师D.程序员答案：B265.根据其判断，如果一个项目有可能失败，或者费用过高，违反知识产权法规，或者存在问题，应()。A.忽略无视B.隐瞒不报C.及时上报D.虚假上报答案：C266.计算机存储单位中，硬盘容量一般以()表示。A.GBB.MBC.TBD.KB答案：C267.MindSpore框架的开发环境可以支持()。A.PythonB.JavaC.++D.所有以上答案：A268.定类等级的数据只按()分类。A.数据大小B.文件大小C.句子长度D.类别名称答案：A269.在算法的特点中，高效率通常指的是算法在()方面的表现。A.时间和空间B.算法复杂度C.模型准确度D.数据规模答案：A270.以下选项不属于语音声学特征的是()。A.语义B.频率C.时长D.振幅答案：A271.图像分类网络中常用的网络不包括()。A.VGGB.RNNC.ResNetD.SENet答案：B272.语音识别的难点是()。A.地域性差异B.场景性差异C.个体性差异D.以上都是答案：D273.计算机存储单位中，最小的存储单元是()。A.字节B.位C.千字节D.兆字节答案：B274.将数据分散存储在多台独立的设备上属于()。A.分布式存储B.集中存储C.存储备份D.结构化存储答案：A275.用户通过ModelArts的AI市场分享的内容不包括()。A.模型B.数据集C.API应用D.代码答案：D276.需求公司是数据标注规则的()。A.终结者B.桥梁C.起始者D.定制者答案：A277.运用()方法最大限度地减少对用户反馈信息的询问次数。A.被动学习B.主动学习C.物理学习D.简单学习答案：B278.LSTM属于以下哪种神经网络()。A.前馈神经网络B.卷积神经网络C.循环神经网络D.生成对抗网络答案：C279.在计算机硬件技术指标中，度量存储空间大小的基本单位是()。A.字B.二进位C.字节D.双字答案：C280.()是指数据记录的信息是否存在异常或错误。A.完整性B.一致性C.准确性D.及时性答案：C281.卷积神经网络(ConvolutionalNeuralNetwork,CNN)包括卷积层，和全()连接层。A.隐藏层B.输出层C.池化层D.输入层答案：C282.下列说法中，符合雇员交流时语言规范的是()。A.多说俏皮话B.语速要快C.充满幽默感D.用尊称，不用忌语答案：D283.ModelArts数据管理中的数据集来源不包括()。A.从OBS上传本地文件创建B.从ModelArts市场导入C.数据标注好之后发布成数据集D.从网页上传本地文件创建答案：D284.()指的是个节点上的数据由本地数据库管理系统自治管理。A.数据冗余性B.易扩展性C.透明性D.自治性答案：D285.在循环神经网络中，长短时记忆网络(LSTM)是一种用于解决()问题的结构。A.图像处理B.自然语言处理C.语音识别D.所有以上答案：D286.Tensorflow2.0中用于模型训练的主要循环函数是()。A.tf.train_loopB.tf.fitC.tf.trainingD.tf.train答案：B287.神经网络中的反向传播算法用于()。A.训练模型B.特征选择C.数据预处理D.可视化数据答案：A288.Atlas人工智能计算平台提供的计算资源主要用于()。A.计算机视觉B.自然语言处理C.机器学习D.所有以上答案：D289.数据合并的目的是()。A.处理异常数据B.将有关联的数据放在同一表中C.对数据进行标准化D.对数据进行离散化答案：B290.深度学习中，卷积神经网络(CNN)常用于()。A.自然语言处理B.图像识别C.强化学习D.聚类分析答案：B291.模型中的学习率是用于()。A.控制模型复杂度B.加速训练过程C.调整参数权重D.防止过拟合答案：C292.查看文件内容的命令不包括()。A.catB.echoC.moreD.less答案：B293.TensorFlow2默认的即时执行模式(EagerExecution)带来了灵活及易调试的特性，但在特定的场合，例如追求高性能或部署模型时，我们依然希望使用TensorFlow1.X中默认的图执行模式(GraphExecution),以下哪个选项可以将TensorFlow的执行模式转换成图执行模式?()A.tf.sessionB.tf.function修饰符C.tf.trainD.tf.convert_to_tensor答案：B294.下列不属于智能系统业务的是()。A.推荐系统B.智能识别C.网络游戏D.智能问答答案：A295.Tensorflow2.0中的KerasAPI用于()。A.创建神经网络模型B.数据预处理C.损失函数计算D.所有选项都正确答案：D296.循环神经网络中的短时记忆效应有助于处理数据中的()关系。A.长期B.时序C.静态D.时域答案：B297.在数据处理中，缺失值处理常采用的方法是()。A.删除包含缺失值的样本B.用均值填充缺失值C.使用中位数替代缺失值D.忽略缺失值答案：B298.()技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。A.翻译B.数字C.识别D.智能答案：A299.数据是组成数据库的基本单元，构建高质量的数据库，必须对原始数据进行()。A.数据删除B.数据查询C.数据修改D.数据优化答案：D300.在强化学习中，环境模型的作用是()。A.衡量动作的价值B.预测状态转移概率C.限制智能体的行为D.提供奖励信号答案：B301.在神经网络中，隐藏层的目的是()。A.直接与输入层交互B.提取特征和模式C.输出预测结果D.存储数据答案：B302.分布式存储的特点主要包括()。A.高可靠性B.单点故障C.低带宽需求D.中心化管理答案：A303.数据分布自适应是一类最常用的()方法。A.单位B.数据C.元素D.迁移学习答案：D304.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A.频繁挖掘B.分类和预测C.数据预处理D.数据流挖掘答案：C305.CNN用参数相同的kernel去扫描整副图像。实现了同一图像在不同位置、不同角度的旋转、不同大小、不同光照等条件下，都会被识别为同一物体，这一特点体现了CNN哪方面的核心思想?()A.局部感知B.全局共享C.尺度不变D.降维答案：B306.下面关于数字图像量化等级的描述，错误的是()。A.量化等级越高，图像层次越丰富B.量化等级越高，图像灰度分辨率越低C.量化等级越高，图像质量越好D.量化等级越高，图像数据量越大答案：B307.团结协作可以帮助团队更好地()。A.避免挑战B.应对挑战C.忽视挑战D.降低目标答案：B308.优化器的学习率设置对训练过程中的()具有重要影响。A.收敛速度B.训练集大小C.随机性D.参数数量答案：A二、多选题1.以下属于人工智能训练师在数据收集阶段的工作内容有（）A.确定数据来源B.制定数据收集计划C.进行数据标注D.评估数据质量

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能训练师三级理论知识试题及答案

文档简介

温馨提示

最新文档

评论

人工智能训练师三级理论知识试题及答案

文档简介

温馨提示

最新文档

评论

相关文档