数据标注员-中级职业资格核心考点题库(150题)_第1页
数据标注员-中级职业资格核心考点题库(150题)_第2页
数据标注员-中级职业资格核心考点题库(150题)_第3页
数据标注员-中级职业资格核心考点题库(150题)_第4页
数据标注员-中级职业资格核心考点题库(150题)_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1一、单选题1.数据清洗是指删除、()错误数据,处理不完整、格式有误或多余的数据。A、增加B、更正C、发现D、分析答案:B2.下面不是计算机病毒的生物特征的是()A、感染性B、危害性C、变异性D、一致性答案:D3.()下列哪个不属于声音文件后缀名()A、mp3B、wavC、jpgD、mkv答案:C4.在智能系统发展早期,比较典型的综合性应用成果之一()。A、专家系统B、苹果系统C、安卓系统D、鸿蒙系统答案:A5.()数据的大小决定所考虑的数据的价值的和潜在的信息是谁的定义()A、数据容量B、数据种类C、数据速度D、数据真实性答案:A6.()是帮助程序进行快速查找的A、索引B、文本C、表格D、字典答案:A7.下面属于图片处理的是()A、视频剪辑B、动画制作C、声音合成D、裁剪电子照片答案:D8.若想要获得图片的某个位置,可以对图片进行()。A、调色B、裁剪C、合成D、拼接答案:B9.()包括数据质量控制和数据治理。A、数据采集B、数据清洗C、数据质量检查D、数据集成答案:D10.以下操作符合安全操作规范的是()。A、自行配置或更换路由器B、专人7∗24负责管理和维护C、随意乱接线路D、长时间不打系统补丁答案:B11.以下不属于容灾备份所指灾难类型的是()。A、数据缺失B、设备故障C、数据中心故障D、区域性故障答案:A12.常用的翻译工具是()A、百度网盘B、搜狗语言C、百度翻译D、网易云盘答案:C13.人工神经网络模仿(),由许多人工神经元组成。A、人类大脑B、猩猩大脑C、鲸鱼大脑D、鲨鱼大脑答案:A14.下面属于处理不一致数据的方法()。A、回归分析B、模式识别C、人工更正D、结构分析答案:C15.下面是数据变换的策略是()。A、特征构造B、数据记录C、数据分析D、模式识别答案:A16.数据需求方向供应商需要对数据来源的()和合规性进行审查。A、合法性B、合理性C、规范性D、完整性答案:A17.下面属于定比等级数据的是()A、工作种类B、工资数据C、血型D、成绩等级答案:B18.系统性分析问题通常能够()。A、预测问题的发生B、找到问题的根源C、提高员工的效率D、防止系统的崩溃答案:B19.动物种类属于()A、定序等级B、定类等级C、定比等级D、定距等级答案:B20.员工之间的团结互助包括()。A、避免竞争B、敝帚自珍,拒绝分享C、平等交流D、拒绝参与集体活动答案:C21.()是进行数据挖掘前的准备工作A、数据预处理B、模式分析C、文本分析D、预测分类答案:A22.()网络是含有卷积层的神经网络。A、卷积神经B、5GC、4GD、可视化答案:A23.数据标注员是数据标注规则的()。A、执行者B、决定者C、终结者D、起始者答案:A24.下列哪项不属于数据标注项目审核()。A、审核B、数据质检C、数据标注D、数据重复答案:D25.数据分类就是把具有()的数据归并在一起。A、共同属性B、特有属性C、固有特征D、其他属性答案:A26.()是关于客观事实的可通讯的知识()A、数字B、文字C、信息D、字符答案:C27.语言材料包括口语材料和()。A、书面材料B、图片材料C、视频资料D、数据资料答案:A28.()是通过键入文本或其他多媒体内容,如图片、短语音、短视频在两个或更多人之间进行聊天的一种方式A、即时通讯B、即时电联C、飞鸽传书D、电子邮件答案:A29.遵守法律是指国家机关、社会组织和公民个人()A、按照法律行使权利B、按照法律履行义务C、按照法律行使权利,履行义务D、按照法律行使权利,履行义务,并在某些情况下可获得特权答案:C30.经常与黑客软件配合使用的是()。A、程序B、蠕虫C、系统D、木马答案:D31.为了清除系统运行中发生的故障和错误,软、硬件维护人员要对系统进行必要的修改与完善,这些工作称为()。A、系统维护B、数据更新C、性能优化D、产品迭代答案:A32.数据提取是()的过程。A、从网络下载原始数据集B、从原始数据中抽取出目标数据C、对有问题的数据进行处理D、使用数据进行分析答案:B33.()是对自然语言文本中的实体事先打好标签。A、实体命名B、文本分类C、文本分析D、文本理解答案:A34.()能够帮助避免生产过程中潜在的风险A、爱岗敬业,勤劳肯干B、爱护设备,安全操作C、团结友爱,舍己为人D、遵纪守法,忠于职守答案:B35.()是计算机从业人员职业道德的最基本要求。A、遵守法律法规B、工作认真负责C、做事诚实守信D、勇于承担责任答案:A36.哪一个不是系统性能监控数据常用的优化策略()。A、增加磁盘B、网络优化C、内存优化D、线程优化答案:A37.数据集成涉及是数据值冲突的()A、文本分析B、视频分析C、检测与处理D、动画编辑答案:C38.语义分割是给图像每个像素一个()标签或者给点云中每个点一个语义标签。A、语义B、图片C、分类D、文本答案:A39.中文分词是其他()的基础。A、中文信息处理B、数字信息处理C、图片信息处理D、视频信息处理答案:A40.()翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。A、语言B、文本C、识别D、语句答案:B41.下面是数据处理的参考指标的是()。A、数据删除率B、数据传播率C、数据分析结果D、数据分类结果答案:A42.()以下哪项是人脸识别中的步骤。A、人脸图像采集B、数据识别C、手势识别D、文本识别答案:A43.爬虫技术支持()等形式的数据的采集。A、电脑B、图片C、硬件D、网络答案:B44.在中华人民共和国境内建设、运营、维护和使用网络,以及()的监督管理,适用本法。A、网络安全B、公众安全C、劳动安全D、食品安全答案:A45.衡量声音高低的指标是()。A、频率B、分贝C、速度D、幅度答案:B46.数据的格式不包括()。A、图片B、声音C、视频D、光纤答案:D47.194.神经网络的训练和推理受到()、内存带宽和延迟的限制。A、计算带宽B、苹果带宽C、华为带宽D、小米带宽答案:A48.视频人脸8点工具用于将每一()图片连接起来。A、帧B、分C、秒D、时答案:A49.在使用计算机时应抱着()的态度A、诚实的B、散漫的C、恶意的D、随意的答案:A50.数据一般存在()问题。A、不一致B、正确C、完整D、有效答案:A51.根据数据标注()不同,可以分为文本标注、语言标注、图像标注和视频标注。A、时间B、对象C、地点D、工程师答案:B52.可以通过()清洗网页数据,匹配有效的数据。A、正则表达式B、文本编辑C、图片裁剪D、网页裁剪答案:A53.数据表中包含单个属性的信息的组成部分叫()。A、数据类型B、列C、行D、视图答案:B54.()手势识别是计算机科学和语言技术中的一个主题,目的是通过数学算法来识别人类手势。A、数据识别B、手势识别C、文本识别D、人脸识别答案:B55.数据库系统对数据进行管理的核心是()A、数据库管理系统B、数据库C、操作系统D、数据仓库答案:A56.()语义标注检验中不包括以下哪种场景()A、针对单独词语或语句进行检验B、针对上下文的情景环境进行检验C、针对语音数据中的语音语调进行检验D、针对文本出现的地方进行检验答案:D57.()是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。A、云计算B、特征选择C、云存储D、区块链答案:B58.()指的是忠诚地对待本职工作,一丝不苟。A、勤奋进取B、团结协作C、忠于职守D、遵纪守法答案:C59.()有权依法参加和组织工会。A、劳动者B、农民C、医生D、科学家答案:A60.系统存放任何程序和数据都必须有一定的()。A、存储空间B、系统性能C、吞吐速度D、能源消耗答案:A61.()会影响数据挖掘的准确性A、准确的数据B、可信的数据C、完整数据D、噪声答案:D62.()以下哪种检验方法可以对数据集做到无遗漏检验()A、抽样检验B、全样检验C、实时检验D、多重抽样检验答案:B63.下面是数据质量的特性的是()A、不可解释性B、准确性C、不完整性D、不准确性答案:B64.数据规约指在尽可能保持元数据原貌的前提下,最大限度地()数据量A、精简B、增加C、保持不变D、保留答案:A65.在计算机系统中,操作系统是()A、一般应用软件B、核心系统软件C、用户应用软件D、系统支撑软件答案:B66.下面是数据质量的特性的是()A、准确性B、感染性C、破坏性D、不可解释性答案:A67.数据采集和()行业治理原则是离不开问责机制。A、标注B、删除C、清洗D、收集答案:D68.()为图片中出现次数最多的人。A、关键人物B、无关人物C、不完整人物D、动物答案:A69.以下哪一个不是常用的统计方法()。A、求平均B、加法C、求中位数D、求众数答案:B70.下列不属于智能模型所拥有的工具的是()。A、数据处理B、报表生成C、自动保存D、代码生成答案:C71.下面不属于变更管理流程的是()。A、记录B、识别C、审查D、归类答案:B72.下面属于数据降维的是()。A、数据主成分分析B、模式识别C、文本分析D、预测分类答案:A73.自然语言处理任务主要包括建模、标注、()、测试等步骤。A、采集B、训练C、更改D、画图答案:B74.()一经成立即具有法律效力,在双方当事人之间就发生了权利、义务关系。A、意识B、合同C、道德D、知识答案:B75.日志的作用是()。A、预测未来要发生的事件B、保留数据现场C、节约数据成本D、进行数据备份答案:B76.下列不属于计算机从业者应遵守的道德准则的是()A、工作认真负责B、维护雇主客户的利益C、维护雇主客户的利益D、发现潜在的威胁时应当站出来揭露答案:C77.唯一标识每一个用户的是()。A、系统名B、版本号C、程序名D、用户名和用户ID名答案:D78.在社会主义国家,()是守法的主体。A、个人B、组织C、部分组织和个人D、一切组织和个人答案:D79.在训练模型之前,需要把先标注好的数据进行()。A、替换B、分类C、删除D、更新答案:B80.视频数据是指连续的()。A、图像序列B、语音序列C、文字序列D、图形序列答案:A二、多选题1.?不是在开发预测模型时减少输入变量数量的过程A、云计算B、特征选择C、机械化D、区块链E、存储保护答案:ACD2.下面哪些选项是知识图谱使用的存储方式?A、RDFB、OracleC、SQLServerD、Neo4jE、KFC答案:AD3.按照学习方式的不同,可以将机器学习分为以下哪类?A、聚类B、无监督学习C、监督学习D、本地计算E、弱监督学习答案:BCE4.常见的数据标注工具的数据标注结果导出格式包括?A、CSVB、XMLC、JSOND、MP4E、内存带宽答案:ABC5.以下哪项不是人脸识别中的步骤?A、人脸图像采集B、数据识别C、系统D、文本识别E、手势识别答案:BDE6.下面哪些适合通过强化学习来实现?A、物流运输路线指定,根据天气,高速封停情况,是否堵车等情况判断能否准时到达B、个性化音乐平台,给用户推送喜欢的歌,和广告C、根据客户购买商品的情况,给指定客户发送营销推广信息D、以上都不是E、提高系统性能,增强系统的稳定性答案:BC7.知识图谱中的数据类型分哪几类?A、通用数据类型B、半结构化数据类型C、结构化数据类型D、非结构化数据类型E、防止信息系统遭受攻击答案:BCD8.不是信息从一种形式或格式转换为另一种形式的过程A、编译B、编码C、编写D、解码E、多层感知机答案:ACD9.下面哪些类型在Python中是有序的序列?A、字符串B、元组C、列表D、字典E、文本信息表达完整答案:ABC10.下面哪些运算符是逻辑运算符?A、notB、//C、orD、intE、and答案:ACE11.以下哪项不是文本关系?A、运算关系B、主谓语关系C、劳动关系D、长短关系E、自主答案:ACD12.语音识别技术,按词汇量大小进行分类,可以分为?。A、小词汇量B、中词汇量C、大词汇量D、超大词汇量E、超小词汇答案:ABC13.中文分词技术不属于?范畴A、模式识别B、数据挖掘C、自然语言处理D、物理分析E、苹果系统答案:ABD14.下面不可以下载软件的是?A、电脑管家B、画图软件C、软件管理D、文档管理器E、数据备份答案:ABD15.下面不属于文本抽取的方式的是?A、在线格式转换工具转换B、图片编辑软件C、视频剪辑软件D、神经元E、动画制作软件答案:BCE16.智慧金融的应用非常广泛,具有代表性的是?A、分期还款B、移动支付C、网银转账D、汽车高速过路无感支付E、网络搜索答案:BD17.定序等级的数据不可以进行?A、类别区分B、分类操作C、自然排序D、类别定义E、断定软件系统性能表现,预见系统负载压力承受力答案:ABD18.下列关于自然语言的说法,正确的是?A、自然语言处理可以让机器去理解人类的语言B、自然语言处理需要MFCC来提取特征C、自然语言处理主要依赖于卷积神经网络D、自然语言处理是一门融语言学、计算机科学、数学于一体的科学E、从图像中检测物体答案:AD19.以下哪种场景应用了计算机视觉?A、人脸识别B、物体检测C、辅助驾驶D、行为识别E、不识别答案:ABCD20.机器学习的一般流程包括?A、数据获取B、分析案例C、模型验证D、人机协同E、模型训练答案:ABCE三、判断题1.深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步A、正确B、错误答案:A2.为了追求效益,可以不需要爱护设备A、正确B、错误答案:B3.所有递归遍历读取文件的方法的效率一定高A、正确B、错误答案:B4.数据清洗能够提升数据质量,避免对数据使用过程产生负面影响A、正确B、错误答案:A5.每个数据等级都有不同的控制和数学操作等级A、正确B、错误答案:A6.语义词性归类实在图片标注后的工作A、正确B、错误答案:B7.python是低级语言A、正确B、错误答案:B8.用人单位不应当依法建立和完善规章制度,保障劳动者享有劳动权利和履行劳动义务A、正确B、错误答案:B9.自然语言处理是一门融语言学、计算机科学、心理学于一体的科学A、正确B、错误答案:B10.数据可视化一定不会减少数据的原始信息A、正确B、错误答案:B11.数据集成时,要注意属性匹配,而不需要注意数据的结构A、正确B、错误答案:B12.每次只能向一个人发邮件,不能群发A、正确B、错误答案:B13.语音类型的数据输出格式为JSON或者其他通用输出格式A、正确B、错误答案:B14.特征转换就是用更少的列来解释数据点,并且效果不变,甚至更好A、正确B、错误答案:A15.数据规约一定不会减少原数据的信息量A、正确B、错误答案:B16.搜索引擎就是浏览器A、正确B、错误答案:B17.数据是信息的表现形式A、正确B、错误答案:A18.多音字标注的质量标准只需要标注出一个字的某个读音A、正确B、错误答案:B19.一个高效的数据预料没有具有经济价值A、正确B、错误答案:B20.所有网页数据都不用清洗可以直接使用A、正确B、错误答案:B21.数据分析与挖掘技术是机器学习算法和数据存取技术的结合A、正确B、错误答案:A22.yield生成器是高效的遍历读取文件的方法A、正确B、错误答案:A23.数据归类和定义规则对工程师的沟通毫无帮助A、正确B、错误答案:B24.可以用文本、图形、图像、动画、声音、影视片段等多媒体来表示信息A、正确B、错误答案:A25.智能模型也称为基于知识的软件开发模型,它将瀑布系统与专家系统结合在一起A、正确B、错误答案:A26.离散化是指把数值属性的原始值用区间标签或者概念标签替换A、正确B、错误答案:A27.噪声数据只能自然产生不能人工形成A、正确B、错误答案:B28.数字是对客观事物的符号表示A、正确B、错误答案:B29.数据构建是为了原有数据集中减少多余特征A、正确B、错误答案:B30.劳动效率定编法是根据生产任务和员工的劳动效率以及出勤等因素来计算岗位人数的方法A、正确B、错误答案:A31.文本数据不能可视化A、正确B、错误答案:B32.任何单位和个人不得自行建立或者使用其他

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论