人工智能训练师(初级)技能鉴定近年考试真题试题库-300题-含答案_第1页
人工智能训练师(初级)技能鉴定近年考试真题试题库-300题-含答案_第2页
人工智能训练师(初级)技能鉴定近年考试真题试题库-300题-含答案_第3页
人工智能训练师(初级)技能鉴定近年考试真题试题库-300题-含答案_第4页
人工智能训练师(初级)技能鉴定近年考试真题试题库-300题-含答案_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1一、单选题1.商用数据标注平台一般分为标注任务平台和系统管理平台两部分,()不属于系统管理平台。A、绩效管理B、标注任务列表C、流程管理D、资产管理答案:B2.下列关于词云图的优点描述不正确的是()。A、用途范围单一B、突出文本主旨C、过滤低频文本信息D、提炼关键信息答案:A3.数据标注可依照标注的构成形式进行分类,下列不属于其分类的是()。A、结构化标注B、文本标注C、非结构化标注D、半结构化标注答案:B4.下列处理方法中最适合处理词云图中干扰词的方法是()。A、进行命名实体标注B、手动去除干扰词C、进行词性分析D、使用停用词表过滤干扰词答案:D5.根据预防系统蓝屏的方法,以下做法不恰当的是()。A、系统能正常运行无需升级驱动、BIOS等软件B、不需要定期对电脑进行病毒扫描C、定期对重要的注册表文件进行备份D、在关机时要尽量通过系统的关机按钮进行关机答案:B6.下列关于图像区域标注的质量检验标准相关内容描述错误的是()。A、图像中转折拐角的边缘像素点噪声最容易产生标注误差B、区域标注的难点在于对标注物的每一个边缘像素点都要进行检验C、图像中转折拐角的边缘像素点噪声最大,需要仔细进行检查D、区域标注像素点与标注物像素点误差要在4个像素以内答案:D7.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验第一阶段数据全样检验合格,则第二阶段()。A、质检员继续对标注员标注的数据进行全样检验B、质检员对数据进行抽样检验C、质检员对标注员标注数据的25%进行检验D、质检员对标注员标注数据的50%进行检验答案:B8.以下对于系统蓝屏可能的原因与解决方法说法错误的是()。A、一些计算机病毒会导致系统蓝屏,可以使用杀毒软件进行杀毒B、在硬件问题上可以检查硬件是否插牢与是否出现氧化现象C、系统蓝屏可以基本排除BIOS的问题D、某些硬件驱动不兼容也会发生蓝屏错误,此时应进入安全模式将其禁用并安装兼容的硬件驱动答案:C9.在数据清洗转换方法中,()主要是将不同业务系统中的相同类型的数据进行统一。A、多数据源的合并B、数据粒度的转换C、不一致数据转换D、数据的商务规则计算答案:C10.在Excel中,以下不可以用来计数或条件计数的函数是()。A、COUNT函数B、RANK函数C、OUNTA函数D、COUNTIF函数答案:B11.在数据预处理中,去除数据中的噪声并将连续数据离散化的过程被称为()。A、数据规范化B、属性构造C、数据聚集D、数据平滑答案:D12.介于完全结构化数据和完全无结构化数据之间的数据被称为()。A、半结构化数据B、非结构化数据C、单结构化数据D、复杂结构化数据答案:A13.下列属于数据标注质量检验方法的是()。A、定时检验B、抽样检验C、定量检验D、间接检验答案:B14.以下无法在典型的实时数据采集流程环节得到应用的是()。A、HDFS分布式文件系统B、Pytorch机器学习框架C、Socket通信技术和Ajax网页更新技术D、Flume分布式日志收集系统答案:B15.下列关于数据库系统三级模式之间关系描述正确的是()。A、内模式是模式的部分抽取,模式表示物理级数据库B、模式表示物理级数据库,内模式表示概念级数据库C、模式表示概念级数据库,外模式是模式的部分抽取D、模式是内模式的物理实现,外模式是内模式的部分抽取答案:C16.以下关于客服机器人的评价维度中业务识别率和准确率的说法错误的是()。A、业务识别率的定义是在整个人机对话中,被机器人识别为业务问题的数量占总提问数的比例B、在计算准确率时,回复是否正确可以由机器人进行判断,无需人工介入C、业务识别率计算公式中的业务匹配数等于总提问数减去拒识问题数减去非业务回复数D、准确率=回复正确的对话数/考察范围内的对话数答案:B17.图像标框标注的质量标准是根据()判定的。A、像素点B、尺寸大小C、数量规模D、图像格式答案:A18.在中文分词技术中,关于全模式分词的描述正确的选项是()。A、Jieba分词工厂的标记模式参数默认是全模式分词B、全模式分词不能解决歧义问题C、对于同一段文本,全模式分词处理比精确模式分词要慢D、全模式分词把文本中所有可能的词语都扫描处理且不存在冗余答案:B19.在中文分词技术中,文本分析最适合使用()进行分词。A、搜索引擎模式B、半自动模式C、全模式D、精确模式答案:D20.数据仓库中基于数据源的“脏”数据质量问题可分为两类,即()。A、单因素数据源和多因素数据源问题B、单构数据源与异构数据源问题C、单数据源问题和多数据源问题D、单阶数据源问题和多阶数据源问题答案:C21.数据转换是数据清洗过程的重要步骤之一,它的主要任务是进行不一致数据转换、()及一些商务规则的计算。A、缺失数据的转换B、异常数据的转换C、复杂数据的转换D、数据粒度的转换答案:D22.在统计学中,以下关于中心极限定理相关内容描述正确的选项是()。A、中心极限定理指出了随着样本数的增大,样本均值分布曲线越来越接近均匀分布B、中心极限定理能否发挥作用,主要看样本量的大小C、中心极限定理指出了大量随机变量近似服从泊松分布的条件D、一般认为中心极限定理的标准定义的样本量n≥15时,样本量足够大答案:B23.以下关于Windows10“计算器”应用的操作的说法正确的是()。A、Windows10“计算器”应用无法查看计算的历史记录B、Windows10“计算器”应用只有“标准”和“科学”两种模式C、Windows10“计算器”应用不能进行时间与速度的换算D、单击C按钮可以清除当前运算答案:D24.数据仓库中的数据通常采用分级的方式进行组织,一般包括()、轻度综合级、高度综合级、元数据5个部分。A、中度综合级、当前细节级B、早期细节级、低度综合级C、低度综合级、高度细节级D、早期细节级、当前细节级答案:D25.对于常用的Excel函数,以下说法错误的是()。A、SUMIF函数用于多条件求和B、COUNTIFS用于多条件计数C、AVERAGEIFS用于多条件计算平均值D、LARGE函数用于计算第K个最大值答案:A26.下列关于停用词表的构成相关描述恰当的选项是()A、停用词表中含有需要使用的关键词B、停用词表中含有已经在书面与口语中不再使用的词语C、停用词表内容可自行定义D、停用词表一般使用DOC格式文件存储答案:C27.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法不正确的是()。A、在使用“DirectQuery”选项时,在每次查看数据时不需要每次手动刷新数据B、在使用“导入”选项时,PowerBI获取最新数据后会断开与数据库连接C、在使用“DirectQuery”时,PowerBI不会将数据装载到内部数据库D、“DirectQuery”适用于数据经常更新的情况答案:D28.数据仓库的管理部分由()、数据管理部件和元数据管理部件4部分组成。A、数据集市定义部件、数据获取部件B、数据集市定义部件、数据库定义部件C、数据仓库定义部件、数据资源部件D、数据仓库定义部件、数据获取部件答案:D29.数据标注是对文本、图像、语音、视频等待标注数据进行()、纠错、标注和批注等加工操作。A、加载、整理、编辑B、整理、分析、编辑C、归类、分析、整理D、归类、整理、编辑答案:D30.关于PowerBI(商业智能)中查询编辑器的默认联接种类是()。A、左外部连接B、整合连接C、右外部连接D、内连接答案:A31.()不是数据标注的正确流程中数据质检的常用方法。A、随机验证B、多人验证C、埋题验证D、标注人员状态验证答案:A32.()情况下,用人单位不得解除劳动合同。A、劳动者在试用期间被证明不符合录用条件的B、劳动者不能胜任工作,经过培训或者调整工作岗位,仍不能胜任工作的C、劳动者严重违反用人单位的规章制度D、女职工在孕期、产期、哺乳期的答案:D33.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法正确的是()。A、可以通过【下载与更新】选项卸载应用B、通过Windows10应用商店安装的应用无法更新C、Windows10应用商店无法查看已经获得的应用D、Windows10应用商店可以通过关键字快速搜索相关应用答案:D34.以下属于商业智能(BI)核心作用的选项是()。A、数据的钻取分析B、数据的自动标注C、取代传统的数据报表分析D、滤除不符合要求的数据答案:A35.对于各种数据结构的存储方式,以下说法错误的是()。A、财务系统的数据属于大规模非结构化数据B、非结构化数据没有预定义的模型C、MPP可以用来管理计算高质量的结构化数据D、采用MPP并行数据库集群与Hadoop集群的混合可以实现对PB量级、EB量级数据的存储和管理答案:A36.以下不属于大数据的五大特征的选项是()。A、多样B、大量C、低速D、低价值密度答案:C37.文本数据处理中,词性分析又叫做()。A、中文分词B、词频统计C、词性标注D、命名实体标注答案:C38.ETL(数据仓库技术)数据增量抽取方式包含全表比对方式、()、时间戳方式。A、触发器方式、日志表方式B、全量抽取方式、日志表方式C、全量抽取方式、全表比对方式D、日志表方式、数据迁移方式答案:A39.采集到的数据要进行质量检查,同时也要注意数据采集的()和数据质量。A、可解释度B、价值密度C、完整性D、时效性答案:D40.在中文分词技术中,搜索引擎模式是在精确模式的基础上对长词再次拆分提高()。A、召回率B、精准率C、精确率D、准确率答案:A41.描述两个变量关系的散点图有时可以做出近似直线,当该直线从左下向右上方倾斜时,则称两个变量()。A、弱相关B、不相关C、正相关D、负相关答案:C42.以下关于Windows10常用输入法基本设置操作的说法错误的是()。A、Windows10可以安装第三方输入法B、Windows10默认系统自带输入法没有微软五笔C、Windows10可以对输入法进行外观设置D、Windows10可以设置启用模糊拼音答案:B43.作为管理资源的数据资源不仅限于数据本身,还包括用以()、存储和使用数据的资源。A、输出、决策B、处理、加工C、加工、决策D、产生、加工答案:D44.以下对于Word中表格的边框与底纹设置的说法正确的是()。A、可以通过选中表格并在【插入】选项卡中进行边框样式选择B、在表格属性中可以设置表格边框显示的位置C、在表格属性中不能设置表格线的粗细D、在表格属性中可以设置边框与底纹答案:D45.以下对于微软edge浏览器的历史记录功能的说法正确的是()。A、微软edge浏览器无法删除对某个网站的所有访问记录B、微软edge浏览器只能删除最近30分钟的历史浏览记录C、微软edge浏览器没有按键可以快速清除历史访问记录D、微软edge浏览器可以一次删除多条历史访问记录答案:D46.下列关于SQL(结构化查询语言)特点描述错误的是()。A、运算的对象和结果都是表B、高度过程化C、表达简单,使用词汇少D、具有较好移植性答案:B47.在数据标注基本概念中,数据标注工具按照自动化程度不同可分为()。A、语音标注工具、文本标注工具、图像标注工具B、客户端标注工具、网页端标注工具C、手动标注工具、半自动标注工具、自动标注工具D、区域标注工具、拉框标注工具、分类标注工具答案:C48.以下关于Windows10文件管理器的基本操作描述正确的是()。A、在文件资源管理器中选择【共享】选项卡可以在布局组中选择所需的视图B、使用Windows+E键可以快速打开文件资源管理器C、在打开文件资源管理器时默认打开【此电脑】窗口D、Ctrl+Y快捷键可以用于删除文件答案:B49.以下对于ETL(数据仓库技术)数据增量抽取方式描述正确的是()。A、触发器方式在增量抽取时逐条比对源表和目标表的记录,将新增或修改等变化的记录过滤读取出来B、全表比对方式在增量抽取时通过比较指定抽取时间与抽取源表的时间戳字段值决定要抽取的数据C、时间戳方式根据抽取要求在数据源表上建立插入、修改、删除3种触发器D、ETL的增量抽取是从增量日志中抽取,而不是直接在源表中抽取数据答案:D50.下列不属于常用的数据清洗转换方法的是()。A、多数据源的合并B、复杂数据的转换C、数据粒度的转换D、数据的商务规则计算答案:B51.在Excel中,使用()可以直接计算众数并且只返回一个结果。A、MODB、SNGL函数C、MATCH函数D、MULT函数E、ROUND函数答案:A52.以下关于客服机器人的评价维度中满意度和差评数的说法错误的是()。A、满意度衡量了客服机器人的服务满意度B、由于影响用户使用体验的因素很多,满意度无法直接指明问题所在C、多数客户只会在不满意时给出反馈,所以关注差评率更加客观D、满意度只能实施于会话维度答案:D53.数据库设计步骤依次是:系统需求的调查与分析、()。A、逻辑设计、概念设计、物理设计、实施与测试、运行维护B、物理设计、逻辑设计、概念设计、实施与测试、运行维护C、概念设计、逻辑设计、物理设计、运行维护、实施与测试D、概念设计、逻辑设计、物理设计、实施与测试、运行维护答案:D54.在人工智能领域,()是评价数据质量的首要指标。A、可信性B、范围C、关联度D、时效性答案:C55.以下不属于商业智能(BI)核心作用的选项是()。A、数据的上钻和下钻B、获取数据的多维度分析C、数据的切片D、取代传统的数据报表分析答案:D56.数据标注可以根据标注者类型进行分类,下列属于该分类的是()。A、拼音标注B、结构化标注C、文本标注D、机器标注答案:D57.以下关于关键信息基础设施的运行安全相关规定的说法错误的是()。A、运营者需要将检测评估情况和改进措施报送相关负责关键信息基础设施安全保护工作的部门B、关键信息基础设施的运营者应当每三年对网络安全性进行一次检测评估C、国家网信部门应当统筹协调有关部门定期组织关键信息基础设施的运营者进行网络安全应急演练D、国家网信部门应当统筹协调有关部门对网络安全事件的应急处置与网络功能的恢复等,提供技术支持和协助答案:B58.统计图中的折线图适用于()。A、描述和比较多组数据随时间变化的趋势B、比较多组数据之间存在的关联C、比较同类别和不同类别变量总和差异D、描述数据在平面或空间的分布答案:A59.下列关于图像标框标注的质量标准相关内容描述正确的是()。A、标框的四周要与标注物最边缘像素点误差在3个像素以内B、标框标注的四周边框需要覆盖住标注物并且标注框需要贴合目标C、标框的四周要与标注物最边缘像素点大于4个像素,图片即为不合格D、标注物最边缘像素点不需要进行判定答案:B60.以下关于自然语言处理相关描述不正确的选项是()。A、自然语言处理的研究目的是实现自然语言通信的计算机系统B、自然语言处理是计算机科学领域与人工智能领域中的一个重要方向C、自然语言处理是一门机械工程学、计算机科学、数学于一体的科学D、自然语言处理研究的是人与计算机之间用自然语言进行有效沟通的各种理论和方法答案:C61.以下关于微软edge浏览器操作的说法错误的是()。A、在搜索栏输入搜索文字可以弹出搜索建议B、在【高级设置】中可以更换默认搜索引擎C、使用InPrivate窗口可以无痕浏览网页D、微软edge浏览器不能创建超过4个标签页答案:D62.下列关于数据标注质量全样检验方法的优缺点描述错误的是()。A、需要耗费大量人力精力集中进行B、能够对数据集做到无遗漏检验C、能够有效减少标注过程中重复错误的重复出现D、可以对数据集进行准确率评估答案:C63.以下关于Windows10网络基本设置方法的说法错误的是()。A、Windows10可以通过桌面任务栏右下角的wifi图标连接无线网络B、Windows10可以通过【更改适配器选项】按钮设置IP地址与DNS地址C、在连接无线网络后可在浏览器登录路由器管理界面修改连接无线网络的密码D、Windows10必须要手动为电脑分配IP地址答案:D64.对于数字可视化技术的定义和基本概念,以下说法不正确的是()。A、数据可视化中的数据开发是指利用一定算法和工具对数据进行定量的推演和计算B、数据可视化中的数据分析是指对多维数据进行切片、块、旋转等动作剖析数据C、数据可视化是利用数据分析和开发工具发现数据中已知信息的处理过程D、数据可视化中的数据空间是指由n维属性和m个元素组成的数据集所构成的多维信息空间答案:C65.下列不属于文本标注需要注意的事项是()。A、严格的审核制度B、只能使用单一语言进行相关标注C、充分了解语言学D、迭代式标注答案:B66.下列不属于数据库系统三级模式的是()。A、虚拟模式B、内模式C、外模式D、模式答案:A67.以下关于申请专利权力归属方的规定的说法不正确的是()。A、两个以上单位所完成的发明创造,除另有协议的以外,申请专利的权利属于完成或者共同完成的单位B、对发明人或者设计人的非职务发明创造专利申请,任何单位或者个人不得压制C、非职务发明创造,申请专利的权利属于单位D、职务发明创造申请专利的权利属于单位,申请被批准后,单位为专利权人答案:C68.下列属于数据标注常用的语音标注工具是()。A、Nuendo软件B、Labelbox软件C、Praat软件D、BRAT软件答案:C69.在Office快捷键操作中,Ctrl+B的功能是()。A、字符变为粗体B、段落居中C、左对齐D、打印文档答案:A70.下列关于多音字标注的质量标准相关内容描述正确的是()。A、多音字标注只要标注常用的几个读音,对于不常用的可以不标注B、多音字标注的审核不需要借助字典等专业性工具进行检验C、多音字标注需要标注一个字的全部读音,方言发音过多、复杂不考虑D、多音字标注需要标注一个字的全部读音,有时包括方言发音答案:D71.以下对于Word图片布局的说法正确的是()。A、浮于文字上方是将图片浮在文字上方但不会遮盖其他对象B、环绕型是将文字或其他对象环绕在图片周围C、嵌入型是将图片作为一个对象嵌入在一列中D、上下环绕型是将图片独占一列或多列,其他对象位于图片的左右侧答案:B72.下列不属于数据仓库的数据质量评价指标的是_____。A、差异性B、适用性C、完整性D、准确性答案:A73.下列关于数据仓库管理层的功能描述错误的是()。A、完成数据库的定义B、完成数据的归档、备份、维护、恢复C、完成数据的抽取、转换、装载D、元数据的管理答案:A74.下列属于常见的位图图像格式的是()。A、XML格式B、SVG格式C、JPG格式D、MP4格式答案:C75.对于自然语言处理中停用词的分类说法正确的是()。A、停用词一般可分为功能词和判定词B、搜索的短语中包含功能词不会使搜索结果出现问题C、词汇词的使用十分广泛,不会降低搜索的效率D、功能词不具有实际含义答案:D76.()不是劳动者可以解除劳动合同的条件。A、用人单位以暴力、威胁或者非法限制人身自由的手段强迫劳动者劳动B、劳动者在试用期间被证明不符合录用条件C、用人单位未及时足额支付劳动报酬D、用人单位未按照劳动合同约定提供劳动保护或者劳动条件答案:B77.()是PowerBI(商业智能)支持的自然语言查询语言。A、英语B、西班牙语C、俄语D、汉语答案:A78.以下关于客服机器人的评价维度中解决率的说法错误的是()。A、解决率是由客服机器人解决问题的会话数占总有效会话数的比例B、解决率衡量了客服机器人接待能力C、解决率衡量了客服机器人的数据分析能力D、解决率=解决问题的会话数/总有效会话数答案:C79.下列属于数据标注常用的图像标注工具是()。A、PalEdit软件B、LabelImg软件C、YEDDA软件D、Photoshop软件答案:B80.在SQL(结构化查询语言)的基本功能中,对数据库安全性和可用性的控制管理体现了SQL的()功能。A、数据操作B、数据定义C、数据控制D、数据建模答案:C81.下列关于数据仓库中ETL(数据仓库技术)的概念描述不正确的是()。A、ETL是实现商务智能(BI)的核心B、ETL用来描述将数据从源端经过抽取、转换、加载至目的端的过程C、ETL只能对单个源数据进行抽取D、ETL可以对多种结构的源数据进行抽取答案:C82.以下对于云存储模式的概念与整体架构说法错误的是()。A、云存储模式组织框架自底向上依次是存储层、基础管理层应用接口层以及访问层B、云存储的概念和云计算的概念是两种不同的概念C、云.存储就是将存储资源放到云上为人们服务的一种新兴方案D、云存储通常由具有完备数据中心设施的第三方提供答案:B83.()规则分别限定了在关系中每一列属性都有确定的取值范围与关系中主键的唯一性。A、参照完整性与域完整性B、用户自定义完整性与实体完整性C、域完整性与实体完整性D、实体完整性与参照完整性答案:C84.()是劳动合同不可以约定的条款。A、限制女职工合法权益的条款违反劳动合同的责任B、违反劳动合同的责任C、劳动保护和劳动条件D、工作内容答案:A85.下列不属于ETL(数据仓库技术)常用的数据加载方法是()。A、旁路加载B、全量加载C、增量加载D、批量加载答案:A86.下列属于数据标注图像处理工具的是()。A、EditPlus处理软件B、GoldWave处理软件C、BitEdit处理软件D、Protools处理软件答案:C87.在数据库设计过程中,最主要的工作是进行()。A、逻辑设计B、物理设计C、系统需求的调查与分析D、概念设计答案:C88.面向主题的、集成的、不可更改的、随时间不断变换的数据集合我们称之为()。A、数据库B、数据仓库C、数据资源D、数据中心答案:B89.以下关于Word的操作的说法错误的是()。A、Word可以通过【段落】选项进行字体设置B、Ctrl+E可以将段落进行中间对齐C、Word可以通过水平标尺的调整调节段落文字的缩进D、Word可以通过【插入】选项卡下的【符号】选项插入特殊符号答案:A90.诚实守信的具体要求不包括()。A、遵守合同与契约B、有意或无意地欺骗他人C、信守诺言和保守秘密D、遵守法律和法规答案:B91.以下不属于常见的数据质量问题的是()。A、缺失值B、重复值C、错误值D、重叠值答案:D92.下列关于回归分析和相关分析的区别描述不正确的是()。A、相关分析中所有的变量都必须是随机变量,回归分析中自变量必须是确定的B、回归分析侧重于研究随机变量间的依赖关系,相关分析侧重于发现随机变量间的种种相关特性C、相关分析中相关系数是确定的,回归分析中可以存在多个回归方程D、相关分析中需要对变量进行自变量与因变量划分,而回归分析中的变量关系是对等的答案:D93.以下关于客服机器人的评价维度的说法正确的是()。A、差评数是客服机器人的应答能力的评价指标之一B、客服机器人的接待能力的评价指标包括拦截率和满意度C、客服机器人的能力模型通常由接待能力和应答能力两个方面组成D、客服机器人的应答能力的评价指标包括业务识别率和满意度答案:C94.关于自然语言处理技术中词频统计,以下描述错误的是()。A、词频统计是对某一些给定的词语在某文件中出现的次数进行统计B、词频统计是指将一个汉字序列切分成一个个单独的词的过程C、词频统计是文本分析的重要方法之一D、词频统计是文本挖掘的重要手段答案:B95.()不是数据标注质量实时检验方法的优点。A、及时发现问题并解决问题B、有效减少标注过程中重复错误的重复出现C、提高数据质检员的工作效率D、提高数据质检员的工作效率答案:D96.对于空缺值、异常值与重复值的处理方法,以下说法错误的是()。A、孤立点分析属于数据清洗中的异常值处理方法B、重复数据检测主要分为基于字段和基于记录的重复检测C、回归是数据清洗中的空缺值处理方法之一D、合并或消除是处理重复数据的基本方法答案:C97.在统计学中,集中趋势最常见的三种形式是()。A、均值、中位数和众数B、方差、中位数和四分位数C、均值、标准差和方差D、众数、极差和四分位数答案:A98.一般的数据清洗策略分类中,根据概率统计学原理检测并修改数值异常的记录的数据清洗策略是()。A、与特定应用领域无关的清洗策略B、手工清洗策略C、特定应用领域的清洗策略D、自动清洗策略答案:C99.下列关于语音标注注意事项描述错误的是()。A、背景噪音过大的,需标为无效B、语音标注过程最好使用降噪耳机C、确定标注文件中是否包含有效语音D、带有口音的内容,需标为无效答案:D100.在数据清洗中,错误值的清洗方法不包括()。A、使用统计分析B、使用排序与合并C、使用简单规则库D、使用不同属性间约束答案:B101.下列不属于常见的图像数据标注类型的是()。A、多边形拉框B、OCR文本识别C、语义分割D、语音转写标注答案:D102.下列关于聚类和分类相关内容描述错误的是()。A、分类要求划分的类别是已知的B、聚类的结果是确定的C、分类是有监督的学习D、聚类是无监督的学习答案:B103.斯坦福大学教授李飞飞于2007年启动的()项目,加深了人们对人工智能领域的认知,数据对人工智能的重要性,从而推进了数据标注的发展。A、CityScapesB、COCOC、ImageNetD、ADE20K答案:C104.在数据分析方法中,可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系的分析方法是()。A、方差分析B、回归分析C、关联分析D、因子分析答案:C105.在Excel中,()可以完成多区间的判断。A、COUNT函数B、RANK函数C、IFS函数D、MATCH函数答案:C106.下列不属于自然语言处理技术在语音方面应用的选项是()。A、语法校对B、机器同声传译C、聊天机器人D、多媒体信息提取与文本转化答案:A107.在Excel2019中,下列不属于查找引用类函数的选项是()。A、MIN函数B、VLOOKUP函数C、INDIRECT函数D、OFFSET函数答案:A108.从事数据标注需要了解其基本概念,下列关于其基本概念描述不正确的是()。A、标签主要就是标识数据特征、类别和属性等B、标注任务是指按个人对任务的理解对数据集进行标注的过程C、数据标注员负责对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标注和批注D、标注标注员负责对文本、图像、语音、视频等数据进行标注答案:B109.以下关于Windows10系统还原功能的操作描述错误的是()。A、不能使用U盘启动盘还原系统B、Ghost备份还原是以硬盘的扇区为单位进行的C、开启系统还原后,系统会定期自动创建还原点D、用户可以使用系统映像备份来还原系统答案:A110.数据仓库系统通常被分为()、分析工具层3个部分。A、存储层、操作层B、管理层、存储层C、表现层、管理层D、处理层、管理层答案:B111.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验的操作方法错误的是()。A、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为抽样检验B、标注员第一阶段数据全样检验不合格,第二阶段转换为全样检验合格,第三阶段继续为抽样检验C、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验合格,第三阶段继续为抽样检验D、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为全样检验答案:A112.以下关于Windows10“照片”应用的操作的说法错误的是()。A、“照片”应用无法将图片合成视频B、“照片”应用可以通过文件夹导入图片C、“照片”应用可以对图片进行编辑美化D、“照片”应用可以根据关键词搜索图片答案:A113.()不属于数据清洗的基本流程中搜寻并确定错误实例的检测方法。A、基于统计的方法B、均值填充方法C、聚类方法D、关联规则方法答案:B114.下列关于回归分析的描述不正确的是()。A、回归分析研究的是因变量(目标)和自变量(预测器)之间的关系B、回归分析是研究确定两种或两种以上变量间相互依赖的定量关系的统计分析方法C、回归分析通过分析由定性变量构成的交互汇总表来揭示变量之间的联系D、回归分析可以用于研究人的身高与体重之间的相关关系答案:C115.数据标注的工作特点是由()所决定的。A、数据标注员的标注习惯B、数据标注项目的特点C、数据标注项目的周期D、数据标注项目的进度答案:B116.以下不属于数据清洗中常见的异常值处理方法的选项是()。A、回归B、分箱C、孤立点分析D、特殊值填充答案:D117.下列有关字符编码和二进制编码的描述正确的是()。A、字符编码的可读性相比二进制编码更强B、二进制编码文件可以使用记事本浏览C、二进制编码在不同应用程序中有不同的编码方式D、二进制编码文件译码相比字符编码更容易答案:A118.爱岗敬业的具体要求不包括()。A、树立职业理想B、积极进行创新C、消极怠工D、强化职业责任答案:C119.以下关于客服机器人的评价维度中业务覆盖率的说法正确的是()。A、业务覆盖率越高则客服机器人可以理解更多的用户意图B、业务覆盖率衡量了客服机器人的接待能力C、业务覆盖率衡量了客服机器人回复问题的准确程度D、业务覆盖率衡量了客服机器人产品推荐的精准度答案:A120.职业道德的作用不包括()。A、有助于提高全社会道德水平B、有助于企业形成行业领导地位C、规范约束职业内部人员的行为D、促进本行业发展答案:B121.下列关于数据集划分后,各数据集对应作用描述正确的是()。A、测试集用来查看训练效果的B、验证集是用来测试模型的实际学习能力的C、训练集是用来训练算法模型的D、分析集是用来分析模型运算情况答案:C122.数据库实体联系(Entity-Relationship,E-R)模型的构成要素是()。A、实体、属性、联系B、实体、操作、连接C、对象、控制、连接D、对象、实体、联系答案:A123.在统计学中,用()去估计总体参数的过程称为参数估计。A、样本均值B、样本中位数C、总体均值D、样本统计量答案:D124.在Windows10系统下常用的即时通讯软件不包括()。A、微信B、腾讯文档C、钉钉D、QQ答案:B125.下列关于大数据处理面临的难题描述正确的是()。A、传统的结构化存储模式可以满足种类各异的多源异构数据的存储需求B、所有的数据挖掘计划都能得到理想的结果C、集中式数据存储与处理需要使用配置相当高的硬件保障数据处理性能导致投入及运维成本很高D、传统的信息管理系统面对不断增长的数据量和动态数据使用场景在速度响应方面可以满足要求答案:C126.下列数据库实体联系(Entity-Relationship,E-R)模型向关系模型的转化叙述正确的是()。A、1:n的联系必须与联系的任意一端实体所对应的关系模式合并B、1:1的联系可以单独成为一个关系模式C、m:n的连续可以与任何一方实体合并D、实体联系模型中的联系可以直接被DBMS(数据库管理系统)支持和执行答案:B127.下列不属于数据标注常用的语音处理工具的选项是()。A、GoldWave编辑软件B、Nuendo编辑软件C、Protools处理软件D、PalEdit编辑器答案:D128.下列不属于Excel2019常用文本处理的函数是()。A、SUBSTITUTE函数B、TEXT函数C、MID函数D、MEDIAN函数答案:D129.以下关于Word的审阅功能的说法错误的是()。A、在Word中可以通过【视图】选项卡在文档中添加脚注B、批注内容在打印的文件中不会显示C、在Word中可以通过更改组中的“接受”与“拒绝”功能来确认接受或者拒绝修订D、在Word中使用修订功能的情况下,修订过的文字会被突出显示答案:A130.以下关于数据清洗中重复数据的处理方法,描述不正确的选项是()。A、在数据库中,对于属性值相同的记录,可以将其看作是重复记录数据,相等的记录可以合并为一条记录B、合并或消除是处理重复数据的基本方法C、重复数据检测主要分为基于字段和基于记录的重复检测D、对于属性值相同的记录一般是将它们的记录时间进行修改以进一步区分答案:D131.数据抽取的数据源不包含()。A、Web数据B、文本数据C、图层数据D、数据库数据答案:C132.下列关于语音标注的质量标准描述正确的是()。A、标注与语音数据发音的时间轴尽量保持一致,控制误差值在4个语音帧内B、标注与发音速度需要控制在每秒小于或等于3个字C、标注与发音时间轴误差在1个语音帧以内D、标注与语音发音分贝数据控制在60分贝以内答案:C133.在商用数据标注平台中,预识别引擎识别的结果最适合使用()格式存储。A、JSONB、TXTC、XLSD、RAR答案:A134.下列属于常用视频基本属性术语的选项是()。A、时基B、信噪比C、信息熵D、保真度答案:A135.关系模型中最重要的概念是关系,下列关于关系的特点描述正确的是()。A、关系中元组是有先后顺序的B、关系中属性是有先后顺序的C、关系中的每个属性可以再分D、关系中的每个属性是同质的答案:D136.以下关于客服机器人的评价维度中跳出率和异常率的说法错误的是()A、异常率衡量了客服机器人找出关键问题快速修复的能力B、跳出率=某类任务的对话中断数/某类任务的对话总数C、跳出率衡量了对话流程的健康度D、异常率=异常报错数/会话数答案:C137.数据库实体联系(Entity-Relationship,E-R)模型需要转化为()才能被数据库管理系统所支持。A、物理结构B、逻辑模型C、外模式D、关系模型答案:D138.在数据标注质量检验方法中,多重抽样检验方法辅助全样检验第一轮数据抽样检验存在不合格数据,则第二轮()。A、抽样检验中检验的标注数据量与第一轮相同B、抽样检验中检验的标注数据量较第一轮减少50%C、抽样检验中检验的标注数据量较第一轮增加75%D、抽样检验中检验的标注数据量较第一轮增加100%答案:D139.下列关于大规模结构化数据存储的描述不正确的是()。A、可实现对PB量级的存储和管理B、ERP(企业资源计划)和HIS(医院信息系统)数据库都是结构化数据存储C、MPP可以用来管理计算高质量的结构化数据D、设计时尤其要注意存储特性和规模,一旦设计完成很难进一步扩展答案:D140.下列关于数据库的备份与恢复描述正确的是()。A、一般来说备份的数据库文件可以和当前数据库文件在同一磁盘上B、数据库备份是一次性的工作C、不能利用操作系统的文件复制功能将数据库文件复制到另一个位置存储D、数据库备份和恢复可以用于保护数据库中的关键数据答案:D141.下列属于常见的数据标注结果文件格式的是()。A、xls格式B、doc格式C、ra格式D、XML格式答案:D142.数据仓库的()特征体现在数据仓库随时间变化不断增加新的数据内容,删去旧的无用的数据内容。A、面向主题B、集成C、随时间不断变化D、不可更改答案:C143.一般认为语音标注的质量标准是标注与发音时间轴误差在()语音帧以内。A、1个B、3个C、5个D、7个答案:A144.对于业务数据采集流程以下说法正确的是()。A、Hive数据仓库工具属于实时数据采集流程步骤之一B、Tensorflow机器学习框架属于实时数据采集流程步骤之一C、日志文件属于离线数据采集流程步骤之一D、Ajax异步更新网页技术离线数据采集流程步骤之一答案:C145.下列属于语义标注的检验方式的选项是()。A、针对语音数据中的音量进行检验B、针对语音数据中的语速进行检验C、针对上下文的情景环境进行检验D、针对语音数据中的声音频率进行检验答案:C146.在Excel2019中,()可以用来生成随机数且需要输入参数。A、RAND函数B、MATCH函数C、RANDBETWEEN函数D、RANK函数答案:C147.在Excel2019中,下列属于随机抽样的操作步骤是()。A、在【抽样】对话框中设置相关参数B、单击【数据】选择【数据验证】设置验证条件,之后选择【数据验证】并选择【圈释无效数据】C、单击【插入】选项卡,选择【数据透视表】D、单击【数据】选择【数据分析】按钮,打开【数据分析】对话框并选择【协方差】答案:A148.一般认为上下左右边框与标注物最边缘像素点误差均要在()是图像标框标注的合格标准。A、0像素以内B、1像素以内C、2像素以内D、3像素以内答案:B149.下列属于数据标注常用的文本标注工具是()。A、BRAT软件B、NotePad软件C、LogViewer软件D、EmEditor软件答案:A150.以下不属于Python数值分析常用软件库的选项是()。A、Websockets库B、NumPy库C、Matplotlib库D、Pandas库答案:A151.以下关于授予专利权的相关条件规定的说法不正确的是()。A、在申请专利前六个月内,在国家出现紧急状态或者非常情况时,为公共利益目的首次公开的发明不丧失新颖性B、授予专利权的发明和实用新型,应当具备新颖性、创造性和实用性C、授予专利权的外观设计不得与他人在申请日以前已经取得的合法权利相冲突D、疾病的诊断和治疗方法可以授予专利权答案:D152.对于常用的Excel函数,以下说法正确的是()。A、MOD函数用于获取最大值B、ROUND函数用于将数字四舍五入到指定位数C、SNGL函数可以直接计算众数并且当存在多个众数时可以返回多个结果D、TREND函数用于计算相关系数答案:B153.下列关于回归分析分类描述不正确的是()。A、按照涉及的变量多少,回归分析可分为一元回归分析和多元回归分析B、按照自变量的取值,回归分析可分为实数回归分析和虚数回归分析C、按照自变量和因变量之间的关系类型,回归分析可分为线性回归分析和非线性回归分析D、按照因变量的多少,回归分析可分为简单回归分析和多重回归分析答案:B154.下列属于数据标注文本处理工具的是()。A、PalEdit编辑器B、EmEditor编辑器C、GoldWave编辑器D、AdobeAudition编辑器答案:B155.在数据预处理步骤中,数据归约的作用是()。A、得到数据集的规约表示以减少数据量并且使规约前后结果几乎相同B、将数据转换为适用于数据挖掘的形式C、使数据格式标准化、清除异常数据、清除重复数据、错误纠正D、将多个数据源中的数据结合起来并统一存储答案:A156.职业道德的特征不包括()。A、职业性B、继承性C、实践性D、永久性答案:D157.图像区域标注的质量标准是根据()判定的。A、物体尺寸大小B、颜色饱和度C、像素点D、图像对比度答案:C158.下列不属于数据标注公共服务领域应用场景的是()。A、机器审核B、欺诈检测C、视频审核D、文本审核答案:B159.以下对Windows10文件资源管理器文件夹选项操作描述正确的是()。A、默认情况下文件资源管理器左侧有【用户文件夹】项目B、默认情况下文件资源管理器左侧有【回收站】项目C、在Windows10中,文件资源管理器默认打开【快速访问】窗口D、可以通过访问【文件夹选项】选项下的【搜索】选项卡设置“显示所有文件夹”答案:C160.一般的数据清洗策略分类中,通过人工直接修改“脏”数据的策略是()。A、自动清洗策略B、特定应用领域的清洗策略C、与特定应用领域无关的清洗策略D、手工清洗策略答案:D161.下列关于SQL(结构化查询语言)特点描述不正确的是()。A、所有关系数据库系统都支持SQLB、SQL运算的对象与结果都是表C、SQL既可以自主式的方式进行使用也可以嵌入在程序中进行使用D、SQL是一种面向过程的描述性语言答案:D162.下列不属于ETL(数据仓库技术)增量加载的优点的是_____。A、相比全量加载技术实现更简单B、不会影响现有业务C、不会对业务系统造成太大的压力D、能够将业务系统中的变化数据按一定的频率准确地捕获并加载到目标表中答案:A163.在Kettle(数据仓库技术)软件中,获取文本数据可采用的数据抽取方法是()。A、CSV文件抽取B、HTML网页抽取C、XML文件抽取D、JSON文件抽取答案:A164.数据清洗的基本流程一共分为5个步骤,下列不属于数据清洗步骤的是()。A、数据分析B、数据合并C、干净数据回流D、定义数据清洗策略与规则答案:B165.关系模型中最重要的概念是关系,下列关于关系的特点描述错误的是()。A、关系中的每一列属性都是同质的,即每个元组的该属性的取值都来自同一个域B、关系中的一列称为关系的一个属性,一行称为关系的一个元组C、一个关系中存放的另一个关系的主键称为外键D、元组的个数称为关系的度数或目数答案:D166.以下对于PowerPoint2019基本操作的说法正确的是()。A、可以通过【插入】选项卡调整幻灯片的纵横比B、可以通过“Ctrl+鼠标拖拉”的方式快速复制形状C、PowerPoint2019无法导入Excel工作簿D、在PowerPoint中,可以通过“SmartArt图形”功能插入表格答案:B167.早期数据标注工作是由()完成。A、研究数据标注的工程师B、研究数据统计的工程师C、研究人工智能算法的工程师D、进行数据采集的工程师答案:C168.以下对Windows10文件资源管理器文件夹选项操作描述错误的是()。A、在Windows10中,文件资源管理器默认打开【此电脑】窗口B、可以通过访问【文件夹选项】选项下的【常规】选项卡设置文件资源管理器默认打开位置C、默认情况下文件资源管理器左侧没有【控制面板】项目D、可通过【查看】选项卡设置是否显示左侧的导航窗格答案:A169.以下不属于数据清洗中的空缺值处理方法的选项是()。A、回归B、数据补齐C、不处理D、忽略元组答案:A170.()不是商用数据标注平台中语音类标注工具支持的功能。A、语义分割B、语音波形缩放C、语谱图切换D、单段落与多段落语音标注答案:A171.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法错误的是()。A、可以通过【设置】窗口下的【应用】选项卸载应用B、在【我的资料库】中可以查看已经获得的应用C、通过Windows10应用商店安装的应用无法更新D、可以通过Windows10应用商店中的【集锦】选项按照类别快速查找并安装应用答案:C172.以下不属于数据标注质量检验方法的是()。A、实时检验B、间接检验C、抽样检验D、全样检验答案:B173.下列关于大规模结构非结构化混合数据的存储方式,描述不正确的是()。A、使用MPP并行数据库集群和Hadoop集群的混合模式将是大数据存储和管理未来发展的趋势B、更适合于部署于公有云上C、采用MPP并行数据库集群与Hadoop集群的混合来实现对PB量级、EB量级数据的存储和管理D、可使用Hadoop实现对非结构化数据的处理答案:B174.以下对于数据质量问题的分类说法错误的是()。A、数据仓库中基于清洗方式的“脏”数据质量问题可分为规律型“脏”数据和随机型“脏”数据B、数据质量的问题可以分为基于数据源的“脏”数据质量问题与基于清洗方式的“脏”数据质量问题C、基于数据源的“脏”数据质量问题可分为单数据源问题和多数据源问题D、在基于数据源的“脏”数据质量问题中,单数据源情况下出现的问题在多数据源情况下会变得更严重答案:A175.以下关于SQL(结构化查询语言)的相关操作,描述错误的选项是()。A、定义SQL索引的时候关键词DESC表示升序B、SQL的追加数据操作要遵守创建表格时的完整性约束C、使用SQL进行数据表更改与删除操作时务必小心谨慎D、SQL的更新操作不增加、减少表中的记录,而是更改记录的字段值答案:A176.以下对于微软edge浏览器的收藏夹功能的说法正确的是()。A、微软edge浏览器的收藏夹功能默认是处于隐藏状态的B、微软edge浏览器无法导入IE浏览器中收藏的网页C、微软edge浏览器不能调整收藏夹栏的按钮次序D、添加到收藏夹的网页无法重命名答案:A177.以下对于Word中段落缩进方式的说法正确的是()。A、左缩进是指段落所有行均向左移动一定的距离B、右缩进是指段落所有行均向右移动一定的距离C、悬挂缩进是指除段落第一行外其余各行缩进一定的距离D、首行缩进是指段落中第一行文字从右向左缩进一定的距离答案:C178.数据集市可分为()。A、独立数据集市和从属数据集市B、串行数据集市和独立数据集市C、并行数据集市和虚拟数据集市D、虚拟数据集市和嵌入数据集市答案:A179.以下对于Excel基本操作的说法正确的是()。A、Excel单元格的缺省字体中文为“黑体”,英文为“Arial等线体”B、Excel可以通过数据分列设置单元格的数字格式C、可以右键单元格区域选择【设置单元格格式】通过【对齐】选项卡设置合并单元格D、可以右键单元格区域通过【字体】选项卡设置单元格自动换行答案:C180.以下不属于Python数据可视化或数值分析常用软件库的选项是()。A、NumPy库B、Matplotlib库C、Pandas库D、Urllib库答案:D三、判断题1.FP表示预测为正样本,实际是负样本的数量。A、正确B、错误答案:A2.BRAT软件是一个基于Web端的文本标注工具。()A、正确B、错误答案:A3.在Excel2019中,离散趋势分析可使用STDEV.P函数进行数据组的样本标准差计算,并且标准差是以均值为中心的变动幅度测量。()A、正确B、错误答案:B4.现场环境数据分析实时性要求高,合理的部署方式是云端部署。A、正确B、错误答案:B5.语音数据标注的基本标注规范中,转写的词汇必须和听到的语音完全一致,不能多字、少字、错字A、正确B、错误答案:A6.微信是Windows10系统下常用的即时通讯软件。()A、正确B、错误答案:A7.麦克风、摄像头、压力表、标尺、温度传感器等都是数据采集工具。A、正确B、错误答案:A8.在自然语言处理技术中,没有在字典中收录但确实能称为词语的专业术语被叫做未登录词。()A、正确B、错误答案:A9.在统计图中,散点图更适合比较多组数据的大小。()A、正确B、错误答案:B10.bmp、jpg、png等格式都属于采用字符编码方式的文件。()A、正确B、错误答案:B11.模型采用WEB部署方式提供服务,升级的时候需要更新服务端和客户端。A、正确B、错误答案:B12.数据标注常用的图像标注工具包含LabelImg图像标注工具和Praat图像标注工具。()A、正确B、错误答案:B13.分词标准中粗粒度切分可以应用于文本聚类和文本分类。()A、正确B、错误答案:B14.数据可视化是利用数据分析和开发工具发现数据中未知信息的处理过程。()A、正确B、错误答案:B15.保证公共利益的道德准则要求强调避免伤害或侵犯他人权利。()A、正确B、错误答案:B16.在Excel2019中,用户可以设置当数据透视表的数据源发生变化时,打开工作簿文件将自动刷新数据透视表。()A、正确B、错误答案:A17.在Word2019中可以对图片进行快速样式设置。()A、正确B、错误答案:A18.在自然语言处理技术中,分离型歧义是中文分词切分歧义的典型类型。()A、正确B、错误答案:B19.在Windows10中,可以通过【控制面板】中的【程序与功能】选项卸载应用。()A、正确B、错误答案:A20.测试指标制定是在模型测试评估阶段制定。A、正确B、错误答案:B21.在统计图中,柱状图不适合大规模数据的可视化。()A、正确B、错误答案:A22.人工智能体系由“数据”“算法”和“应用”三大底层予以支撑。()A、正确B、错误答案:A23.在Excel2019中,SUBSTITUTE函数的作用是将字符串中的指定字符替换为新的字符。()A、正确B、错误答案:A24.职业道德有助于维护企业信誉。()A、正确B、错误答案:A25.regex库是数据可视化常用的Python库。()A、正确B、错误答案:B26.Praat软件是一款跨平台的多功能文本标注工具。()A、正确B、错误答案:B27.客服机器人知识库覆盖的业务问题越多,业务覆盖率越高,客服机器人可以理解更多的用户意图()A、正确B、错误答案:A28.对应分析是一种多元相依变量统计分析技术,是一种视觉化的数据分析方法。()A、正确B、错误答案:A29.在Excel2019中,RANK函数可以用来生成随机数且需要输入参数。()A、正确B、错误答案:B30.相关分析是研究从变量群中提取共性因子的统计技术。()A、正确B、错误答案:B31.语音标注需要掌握的语音基础知识包括采样率、采样精度、信噪比、声速。()A、正确B、错误答案:A32.在计算业务识别率时不需要考虑客服机器人的非业务回复数量。()A、正确B、错误答案:B33.在数据可视化的基本概念中,数据开发是指利用一定算法和工具对数据进行定量的推演和计算。()A、正确B、错误答案:A34.聚类分析与分类不同,聚类要求划分的类是已知的。()A、正确B、错误答案:B35.数据填充是数据清洗中常见的重复数据的基本处理方法。()A、正确B、错误答案:B36.在统计学中,常用的样本统计量有样本均数、样本比例和样本方差。()A、正确B、错误答案:A37.停用词表中的每个词之间一般使用问号隔开。()A、正确B、错误答案:B38.在客服机器人了解用户问题时,如果用户表达不清楚,需要与用户确认()A、正确B、错误答案:A39.边缘端部署可以分摊算力,提高实时性,降低数据所需带宽。A、正确B、错误答案:A40.Windows10只能手动设置DNS地址。()A、正确B、错误答案:B41.语音标注的过程中的最好是使用降噪耳机。()A、正确B、错误答案:A42.在Excel中,DAYS360函数以数字形式返回指定日期为星期几。()A、正确B、错误答案:B43.相关分析通过分析由定性变量构成的交互汇总表来揭示变量之间的联系。()A、正确B、错误答案:B44.人工智能公司对数据采集的质量要求比较高,数据服务团队的项目负责人需要深刻莉姐项目的数据采集标准A、正确B、错误答案:A45.捆绑销售不属于关联分析应用场景。()A、正确B、错误答案:A46.对于同一段文本,全模式分词处理比精确模式分词要快。()A、正确B、错误答案:A47.数据标注的唯一性决定了人工智能的有效性。()A、正确B、错误答案:B48.正确率为预测正确的样本数量与所有样本数量的比值A、正确B、错误答案:A49.想要普通落地解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了AI的落地程度A、正确B、错误答案:A50.词性分析只能对分词结果中的名词、动词、形容词进行标注。()A、正确B、错误答案:B51.产品使用率反映了用户对于产品的感兴趣度()A、正确B、错误答案:A52.文本数据处理中,词性分析可应用于句法分析预处理、词汇获取预处理和信息抽取预处理。()A、正确B、错误答案:A53.图像信照比指图像噪音与图像信号之比。A、正确B、错误答案:B54.为判别他人是否对自己真心而说的谎话,但如果听的人因此发生了意外的话,也是诚实问题A、正确B、错误答案:A55.在Excel2019中,可以使用CORREL函数计算相关系数。()A、正确B、错误答案:A56.数据标注员依据数据标注规范标注即可,不需要主动提炼参考方向优化标注需求。()A、正确B、错误答案:B57.BRAT软件可用于进行命名实体识别标注。()A、正确B、错误答案:A58.平均对话轮次衡量了客服机器人产品推荐的精准度()A、正确B、错误答案:B59.Excel2019的抽样工具可以对非数值数据进行抽样。()A、正确B、错误答案:B60.模型设计是人工智能项目需求分析阶段的重要工作A、正确B、错误答案:B61.企业培训中分四类:一是公开课,二是内训;三是企业咨询;四是企业网络培训A、正确B、错误答案:A62.人工智能项目开发流程包括:①需求分析,②模型研发,③实施部署,④文档交付A、正确B、错误答案:A63.客服机器人的应答能力可以通过是否可以回答和回答是否√来评判,其中问题回答是否√是由机器人的知识范围决定的()A、正确B、错误答案:B64.科学发现不能被授予专利权。()A、正确B、错误答案:A65.在统计学中,曲线的波峰向右倾斜是由于中位数小于均值,曲线长尾在左侧,这种情况被称为左偏。()A、正确B、错误答案:A66.申请人申请发明、实用新型专利优先权的,应当在第一次提出申请之日起三个月内,提交第一次提出的专利申请文件的副本。()A、正确B、错误答案:B67.低价值密度是大数据的五大特征之一。()A、正确B、错误答案:A68.语义分割标注不属于图像数据标注的类型。()A、正确B、错误答案:B69.因子分析可以在众多变量中找出隐藏且具有代表性的因子,以减少变量的数目。()A、正确B、错误答案:A70.当正态分布的标准差变小时,曲线会变得平缓。()A、正确B、错误答案:B71.微软edge浏览器使用InPrivate窗口上网可以保护个人上网隐

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论