下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023年商业经济行业技能考试-数据挖掘工程师考试历年高频考题附答案(图片大小可自由调整)答案解析附后第1卷1.简述数据挖掘的过程。2.分类方法的常用评估度量都有哪些?3.数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化()结构来提高数据存取性能。A、目标市场分析B、购物篮分析C、模式识别A、构造网络费时费力C、贝叶斯网络不适合处理不完整的数据D、网络结构确定后,添加变量相当麻烦7.评估分类模型的性能的方法有哪些?A、特征提取B、特征修改C、映射数据到新的空间D、特征构造9.一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A、概率B、邻近度C、密度10.非频繁模式()。A、其支持度小于阈值B、都是不让人感兴趣的C、包含负模式和负相关模式D、对异常数据项敏感第1卷参考答案一.参考题库1.正确答案:数据清洗,数据集成(考虑数据一致性和冗余),数据选择,数据转换,数据挖掘,模式评估,知识表示。 精度(precision):标记为正类的元组实际为正类所占的百分比。召回率:正元组标记为正的百分比。F量度:精度和召回率的调和评估指标。准确率,识别率:测试数据中正被正确分类的元组所占的百分比。 灵敏度:真正例(识别)率。特效性:真负例率。3.正确答案:索引4.正确答案:D5.正确答案:A,B 关联规则的分类: (1)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。 (2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。 (3)基于规则中处理的变量的类型不同,关联规则可以分为布尔型和数值型。 关联规则挖掘的步骤: (1)找出交易数据库中所有大于或等于用户指定的最小支持度的频繁项集; (2)利用频繁项集生成所需要的关联规则,根据用户设定的最小可信度进行取舍,产生强关联规则。7.正确答案:(1)保持方法:以无放回抽样方式把数据集分为两个相互独立的子集,训练集(2/3)和测试集(1/3); (2)随机子抽样:保持方法的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 东师考研生物题库及答案
- 教师用课件模板-职业报告
- 2025-2030中国服装鞋帽加工业市场供需分析及投资评估规划分析研究报告
- 2025-2030中国服装品牌设计行业市场需求调研及投资发展前景规划报告
- 2025-2030中国服装出口行业现状供需分析投资评估规划分析研究报告
- 2025-2030中国广告画面设计行业市场竞争发展前景投资评估分析规划报告
- 红警3协议书源代码
- 2026年中国洁身器市场全景调查与投资战略研究报告
- 基于大数据的防火墙风险评估
- 小时达家政保洁合同协议
- 流转土地合同(2篇)
- 2024年生态环境执法大练兵比武竞赛理论考试题库-上(单选题)
- 俄罗斯进口冻肉合同范本
- 奇异的仿生学智慧树知到期末考试答案2024年
- 中心静脉导管堵塞原因及预防 护理讲课比赛
- 人教版-数学五年级上册 数的运算、式与方程 全套
- ERAS理念在肝切除治疗肝癌中的应用
- 【超星尔雅学习通】日本近现代文学选读网课章节答案
- GB/T 40047-2021个体防护装备运动眼面部防护滑雪镜
- 2020年新编市场营销16版复习重点全书名师精品资料
- 兽药营销课程资源库兽药产品策略课件
评论
0/150
提交评论