下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023年商业经济行业技能考试-数据挖掘工程师考试历年高频考题附答案(图片大小可自由调整)答案解析附后第1卷1.简述数据挖掘的过程。2.分类方法的常用评估度量都有哪些?3.数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化()结构来提高数据存取性能。A、目标市场分析B、购物篮分析C、模式识别A、构造网络费时费力C、贝叶斯网络不适合处理不完整的数据D、网络结构确定后,添加变量相当麻烦7.评估分类模型的性能的方法有哪些?A、特征提取B、特征修改C、映射数据到新的空间D、特征构造9.一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A、概率B、邻近度C、密度10.非频繁模式()。A、其支持度小于阈值B、都是不让人感兴趣的C、包含负模式和负相关模式D、对异常数据项敏感第1卷参考答案一.参考题库1.正确答案:数据清洗,数据集成(考虑数据一致性和冗余),数据选择,数据转换,数据挖掘,模式评估,知识表示。 精度(precision):标记为正类的元组实际为正类所占的百分比。召回率:正元组标记为正的百分比。F量度:精度和召回率的调和评估指标。准确率,识别率:测试数据中正被正确分类的元组所占的百分比。 灵敏度:真正例(识别)率。特效性:真负例率。3.正确答案:索引4.正确答案:D5.正确答案:A,B 关联规则的分类: (1)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。 (2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。 (3)基于规则中处理的变量的类型不同,关联规则可以分为布尔型和数值型。 关联规则挖掘的步骤: (1)找出交易数据库中所有大于或等于用户指定的最小支持度的频繁项集; (2)利用频繁项集生成所需要的关联规则,根据用户设定的最小可信度进行取舍,产生强关联规则。7.正确答案:(1)保持方法:以无放回抽样方式把数据集分为两个相互独立的子集,训练集(2/3)和测试集(1/3); (2)随机子抽样:保持方法的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- LY-255262-生命科学试剂-MCE
- Liposomal-curcumin-生命科学试剂-MCE
- Levomepromazine-hydrochloride-Methotrimeprazine-hydrochloride-生命科学试剂-MCE
- 中华医学会肿瘤学分会肺癌临床诊疗指南
- 2026年金华市教育局直属学校教师招聘备考题库及参考答案详解一套
- 2026年南昌高投检测科技有限公司派遣制试验检测人员招聘备考题库及完整答案详解
- 2026年北京经济技术开发区第一小学公开招聘聘任制教师17人备考题库带答案详解
- 2025年老年病科年终工作总结
- 2025金华浦江县银龄讲学计划教师招募5人(公共基础知识)测试题附答案
- 2025天津滨海新区建设投资集团招聘27人考试题库附答案
- 江苏省2025年普通高中学业水平合格性考试试卷英语试卷(含答案详解)
- 2025云南省人民检察院招聘22人笔试考试备考题库及答案解析
- 2026年安全生产管理培训课件与事故预防与应急处理方案
- 2026年长沙民政职业技术学院单招职业技能考试题库及答案详解一套
- 医学检验质控课件
- 人教鄂教版(2017秋)小学科学四年级上册期末综合质量检测卷(含答案)
- 湘教版八年级地理上册 第三章《中国的自然资源》单元测试卷及答案
- 腭裂喂养护理:新生儿与婴儿喂养技巧
- 2025湘教版八年级地理上册期末复习全册知识点提纲
- DB63∕T 1917-2021 森林防火隔离带建设技术规程
- 呼吸机管路护理与VAP预防的关键措施
评论
0/150
提交评论