大数据数据挖掘历年真题考试题库(附答案)_第1页
大数据数据挖掘历年真题考试题库(附答案)_第2页
大数据数据挖掘历年真题考试题库(附答案)_第3页
大数据数据挖掘历年真题考试题库(附答案)_第4页
大数据数据挖掘历年真题考试题库(附答案)_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据数据挖掘历年真题考试题库(附答案)单选题1.下列哪项不是数据挖掘的挑战?A、数据规模大B、数据质量差C、数据结构复杂D、数据存储成本低参考答案:D2.下列哪项是数据挖掘中的分类任务?A、将客户分成不同群体B、预测销售额C、判断邮件是否为垃圾邮件D、识别异常数据参考答案:C3.数据挖掘的主要目标是?A、存储大量数据B、从数据中发现隐含模式C、提高数据存储速度D、减少数据量参考答案:B4.下列哪项是数据挖掘中“混淆矩阵”的作用?A、展示分类结果B、展示聚类结果C、展示降维结果D、展示回归结果参考答案:A5.下列哪项是数据挖掘中“KNN(K近邻)”的特点?A、需要大量内存B、计算复杂度低C、适用于分类和回归D、对噪声不敏感参考答案:C6.数据挖掘的主要目标是?A、存储数据B、分析数据并发现隐藏模式C、提高数据安全性D、增加数据存储容量参考答案:B7.下列哪项是数据挖掘中“精确率”的定义?A、正确预测为正例的比例B、实际为正例中被正确预测的比例C、正确预测为负例的比例D、实际为负例中被正确预测的比例参考答案:A8.下列哪项是数据挖掘中“正则化”的作用?A、提高模型复杂度B、防止过拟合C、增加数据量D、提高计算速度参考答案:B9.数据挖掘流程的第一步通常是?A、模型评估B、数据采集C、特征工程D、结果解释参考答案:B10.下列哪项是数据挖掘中“SVM(支持向量机)”的特点?A、仅适用于线性数据B、适用于高维数据C、不需要核函数D、对噪声不敏感参考答案:B11.下列哪项是数据挖掘中“梯度下降”算法的作用?A、优化模型参数B、进行分类C、进行聚类D、进行降维参考答案:A12.下列哪项是数据挖掘中常用的评估指标?A、准确率B、置信度C、支持度D、所有以上选项参考答案:D13.下列哪项是数据挖掘中“欠拟合”的表现?A、在训练数据上表现好,测试数据上表现差B、在训练数据和测试数据上都表现差C、在训练数据上表现差,测试数据上表现好D、在训练数据和测试数据上都表现好参考答案:B14.下列哪项是数据挖掘中“主成分分析(PCA)”的作用?A、降维B、分类C、聚类D、回归参考答案:A15.下列哪种算法属于集成学习?A、决策树B、支持向量机C、随机森林D、K近邻参考答案:C16.数据挖掘中,"混淆矩阵"用于?A、评估分类模型B、评估回归模型C、数据可视化D、特征选择参考答案:A17.下列哪项是数据挖掘中“分类”任务的特点?A、预测类别标签B、发现数据之间的联系C、将数据分成组D、降低数据维度参考答案:A18.数据挖掘中,"特征构造"是指?A、从现有特征中选择重要特征B、创建新的特征C、删除冗余特征D、对数据进行标准化参考答案:B19.下列哪项是数据挖掘中“特征工程”的作用?A、提高数据质量B、提取有效特征C、降低数据维度D、所有以上选项参考答案:D20.大数据的核心特征不包括?A、数据量大B、价值密度高C、处理速度快D、数据类型多样参考答案:B21.下列哪项是数据挖掘中“交叉验证”的作用?A、评估模型性能B、提高数据量C、降低计算复杂度D、增加模型复杂度参考答案:A22.数据挖掘中,"过拟合"指的是?A、模型在训练数据上表现好,在测试数据上表现差B、模型在所有数据上表现都差C、模型过于简单D、模型没有使用足够的特征参考答案:A23.下列哪种算法适合处理高维数据?A、K近邻B、决策树C、支持向量机D、朴素贝叶斯参考答案:C24.下列哪项是数据挖掘中“Apriori”算法的特点?A、用于分类B、用于聚类C、用于关联规则挖掘D、用于回归参考答案:C25.数据挖掘中,"数据可视化"的作用是?A、提高数据存储效率B、便于理解数据分布C、降低数据维度D、增加数据量参考答案:B26.下列哪种算法适合处理大规模数据?A、线性回归B、决策树C、随机森林D、MapReduce参考答案:D27.下列哪项是数据挖掘中“置信度”的定义?A、项集A出现时项集B也出现的概率B、项集B出现时项集A也出现的概率C、项集A和B同时出现的概率D、项集A和B分别出现的概率参考答案:A28.下列哪项是数据挖掘中“决策树”的优点?A、易于解释B、计算复杂度高C、对噪声敏感D、需要大量训练数据参考答案:A29.数据挖掘中,"数据采样"的主要目的是?A、增加数据量B、提高模型精度C、降低计算成本D、B和C参考答案:D30.在数据预处理阶段,以下哪项不属于数据清洗的范畴?A、处理缺失值B、去除重复数据C、特征选择D、格式标准化参考答案:C31.下列哪种方法用于处理类别不平衡问题?A、重采样B、使用特定评估指标C、调整类别权重D、A、B和C参考答案:D32.决策树属于哪种数据挖掘技术?A、分类B、聚类C、关联规则D、回归参考答案:A33.在数据挖掘中,聚类分析属于哪种类型的算法?A、监督学习B、无监督学习C、半监督学习D、强化学习参考答案:B34.下列哪项是数据挖掘中“数据立方体”的主要作用?A、存储数据B、多维数据分析C、数据加密D、数据压缩参考答案:B35.下列哪项是数据挖掘的典型应用?A、网络流量监控B、人脸识别C、购物篮分析D、数据库索引优化参考答案:C36.下列哪种算法属于无监督学习?A、逻辑回归B、支持向量机C、K均值D、决策树参考答案:C37.下列哪种方法用于处理不平衡数据?A、增加样本B、重采样C、使用特定评估指标D、B和C参考答案:D38.下列哪项是数据挖掘中“回归”任务的特点?A、预测连续数值B、预测类别标签C、发现数据之间的联系D、将数据分成组参考答案:A39.数据挖掘中,"离群点"指的是?A、正常数据B、与大多数数据差异较大的数据C、重复数据D、缺失数据参考答案:B40.下列哪项是数据挖掘中“关联规则”的典型应用?A、客户细分B、推荐系统C、分类D、聚类参考答案:B41.下列哪项是数据挖掘中“离群点”的识别方法?A、标准差法B、K近邻法C、二分法D、所有以上选项参考答案:D42.数据挖掘中,"数据转换"的目的是?A、提高数据存储效率B、使数据更适合建模C、减少数据量D、提高数据安全性参考答案:B43.在数据挖掘中,"噪声"指的是?A、有效数据B、与目标无关的数据C、正确的数据D、重复的数据参考答案:B44.关联规则挖掘中,支持度(Support)的定义是?A、两个项同时出现的概率B、一个项出现的概率C、一个项在另一个项出现时的条件概率D、项集的总频率参考答案:A45.数据挖掘中,"数据探索"的目标是?A、提高数据存储效率B、发现数据中的模式C、降低数据维度D、提高数据安全性参考答案:B46.下列哪项是数据挖掘中“支持度”的定义?A、某个项集在事务中的出现频率B、某个项集在事务中的出现概率C、某个项集的总交易数D、某个项集的平均值参考答案:A47.下列哪项是数据挖掘中“随机森林”的特点?A、单一决策树B、多个决策树的集成C、仅用于分类D、仅用于回归参考答案:B48.下列哪项是数据挖掘中“降维”的目的?A、提高计算效率B、增加数据维度C、增加数据复杂性D、降低数据准确性参考答案:A49.下列哪种算法用于时间序列预测?A、K近邻B、随机森林C、ARIMAD、决策树参考答案:C50.下列哪项是数据挖掘中的预测任务?A、客户分群B、销售额预测C、电子邮件分类D、异常检测参考答案:B51.下列哪项是数据挖掘中“召回率”的定义?A、正确预测为正例的比例B、实际为正例中被正确预测的比例C、正确预测为负例的比例D、实际为负例中被正确预测的比例参考答案:B52.下列哪项是数据挖掘中“F1分数”的定义?A、精确率和召回率的调和平均B、精确率和召回率的几何平均C、精确率和召回率的算术平均D、精确率和召回率的乘积参考答案:A53.在数据挖掘中,"特征选择"的目的是?A、增加数据维度B、提高模型精度C、降低计算复杂度D、B和C参考答案:D54.下列哪种方法用于评估回归模型的性能?A、准确率B、误判率C、均方误差D、F1分数参考答案:C55.下列哪项是数据挖掘中“神经网络”的特点?A、易于解释B、需要大量数据C、计算速度慢D、不能处理非线性问题参考答案:B56.在数据挖掘中,"特征工程"包括?A、数据清洗B、特征缩放C、特征选择D、B和C参考答案:D57.下列哪种算法适合处理非结构化数据?A、线性回归B、决策树C、神经网络D、K近邻参考答案:C58.下列哪项是数据挖掘中的“噪声”?A、正确的数据B、重复的数据C、与实际无关的数据D、缺失的数据参考答案:C59.下列哪项是数据挖掘中“DBSCAN”算法的特点?A、需要预先设定聚类数目B、适用于任意形状的聚类C、对噪声敏感D、只能用于分类任务参考答案:B60.下列哪种方法用于数据挖掘中的特征选择?A、递归特征消除B、随机采样C、数据归一化D、数据填充参考答案:A61.下列哪项是数据挖掘中“过拟合”的表现?A、在训练数据上表现好,测试数据上表现差B、在训练数据和测试数据上都表现差C、在训练数据上表现差,测试数据上表现好D、在训练数据和测试数据上都表现好参考答案:A62.下列哪项是数据挖掘中“提升度(Lift)”的含义?A、项集A和B同时出现的概率B、项集A和B独立出现的概率C、项集A和B相关性的度量D、项集A和B的总交易数参考答案:C63.下列哪种方法用于防止模型过拟合?A、增加训练数据B、减少模型复杂度C、使用正则化D、A、B和C参考答案:D64.下列哪项是数据挖掘中“K-means”算法的特点?A、适用于非球形数据B、需要预先设定聚类数目C、不需要初始中心点D、只能用于分类任务参考答案:B65.下列哪项是数据挖掘中“缺失值”的处理方式?A、忽略该数据B、使用平均值填补C、使用中位数填补D、所有以上选项参考答案:D66.数据挖掘中,"召回率"的定义是?A、正确识别的正例占实际正例的比例B、正确识别的正例占预测正例的比例C、所有预测正确的比例D、所有预测错误的比例参考答案:A67.在数据挖掘中,"模型调优"通常涉及?A、数据清洗B、特征选择C、超参数调整D、数据存储参考答案:C68.下列哪项不属于数据预处理的步骤?A、数据清洗B、数据集成C、数据可视化D、数据转换参考答案:C69.下列哪种算法属于深度学习?A、逻辑回归B、支持向量机C、神经网络D、决策树参考答案:C70.数据挖掘中,"数据预处理"包括?A、数据清洗B、数据转换C、数据集成D、A、B和C参考答案:D71.下列哪项是数据挖掘中“特征选择”的目的?A、增加特征数量B、提高模型性能C、降低计算复杂度D、所有以上选项参考答案:D72.下列哪种方法用于减少数据维度?A、分类B、聚类C、回归D、主成分分析参考答案:D73.下列哪种方法用于评估分类模型的性能?A、均方误差B、准确率C、交叉验证D、主成分分析参考答案:B74.下列哪项是数据挖掘中“ROC曲线”的作用?A、评估分类器性能B、评估聚类效果C、评估降维效果D、评估回归精度参考答案:A75.下列哪种算法适用于无监督学习?A、支持向量机B、K均值C、逻辑回归D、决策树参考答案:B76.下列哪种方法用于评估聚类效果?A、准确率B、F1分数C、轮廓系数D、ROC曲线参考答案:C77.下列哪种算法属于监督学习?A、K-meansB、决策树C、层次聚类D、PCA参考答案:B78.下列哪项是数据挖掘中“朴素贝叶斯”的特点?A、依赖于特征之间的独立性假设B、不需要训练数据C、适用于大规模数据D、不能处理连续数据参考答案:A79.数据挖掘中,"交叉验证"的主要目的是?A、提高数据存储效率B、评估模型的泛化能力C、增加数据量D、降低计算成本参考答案:B80.下列哪项是数据挖掘中“FP-Growth”算法的特点?A、用于分类B、用于聚类C、用于关联规则挖掘D、用于回归参考答案:C多选题1.下列属于数据挖掘中数据抽取的步骤的是?A、从多个数据源获取数据B、清洗数据C、转换数据D、存储数据参考答案:AC2.下列属于数据挖掘中数据预处理的目的是?A、提高数据质量B、增加数据量C、提高数据可用性D、降低数据复杂度参考答案:ACD3.下列属于数据挖掘过程中的评估指标的是?A、准确率B、噪声C、召回率D、离群值参考答案:AC4.下列哪些是数据挖掘的应用领域?A、市场分析B、医疗诊断C、图像识别D、网络安全参考答案:ABCD5.下列属于数据挖掘中常见的数据类型的是?A、数值型B、字符串C、二进制D、结构化参考答案:ABCD6.下列哪些是数据挖掘的典型流程?A、数据采集B、数据预处理C、模型构建D、模型评估参考答案:ABCD7.下列哪些是常见的聚类算法?A、K-MeansB、层次聚类C、决策树D、支持向量机参考答案:AB8.下列属于数据挖掘中数据变换的步骤的是?A、归一化B、降维C、填充缺失值D、去除异常值参考答案:AB9.下列哪些是大数据的特征?A、数据量大B、处理速度快C、数据类型单一D、价值密度低参考答案:ABD10.下列属于大数据分析的挑战的是?A、数据规模大B、数据类型单一C、数据质量差D、数据更新快参考答案:ACD11.下列哪些是数据挖掘中的过拟合问题?A、模型在训练数据上表现好,但在测试数据上差B、模型无法捕捉数据中的模式C、模型过于复杂D、模型泛化能力弱参考答案:ACD12.下列属于数据挖掘中数据清洗的步骤的是?A、去除重复数据B、填充缺失值C、转换数据格式D、增加数据量参考答案:ABC13.下列属于数据挖掘中特征工程的作用的是?A、提高模型性能B、增加数据量C、降低模型复杂度D、提高计算效率参考答案:ACD14.下列属于非结构化数据的是?A、电子表格B、图像C、文本文档D、数据库表参考答案:BC15.下列哪些是数据挖掘与传统数据分析的区别?A、数据挖掘更注重发现未知模式B、传统数据分析更注重描述性分析C、数据挖掘依赖于数据库查询D、传统数据分析使用复杂的算法参考答案:AB16.下列属于大数据处理特点的是?A、数据量大B、数据类型单一C、处理速度快D、数据价值密度高参考答案:AC17.下列属于数据挖掘中模型调优的方法的是?A、网格搜索B、随机搜索C、人工调整D、自动搜索参考答案:ABD18.下列属于数据挖掘中过拟合现象的表现的是?A、在训练集上表现好B、在测试集上表现差C、训练时间短D、模型复杂度高参考答案:ABD19.下列属于数据仓库组成部分的是?A、数据源B、ETL工具C、数据集市D、数据库参考答案:ABC20.下列哪些是数据挖掘中的评价指标?A、准确率B、AUC-ROC曲线C、交叉验证D、F1分数参考答案:ABD21.下列哪些是数据仓库的特征?A、面向主题B、集成性C、随机性D、时变性参考答案:ABD22.下列哪些是数据挖掘中的交叉验证方法?A、K折交叉验证B、留一法C、逻辑回归D、置换检验参考答案:AB23.下列属于数据挖掘中特征工程的步骤的是?A、特征提取B、特征缩放C、特征选择D、特征存储参考答案:ABC24.下列哪些是数据挖掘的特点?A、从大量数据中发现模式B、依赖人工经验C、采用统计学和机器学习方法D、仅适用于小规模数据参考答案:AC25.下列哪些是数据挖掘中的回归问题?A、预测房价B、识别欺诈交易C、预测股票价格D、分类用户类型参考答案:AC26.下列属于数据挖掘中的特征选择方法的是?A、方差选择法B、相关系数法C、信息增益法D、随机选择法参考答案:ABC27.下列属于数据挖掘中数据预处理的目的的是?A、提高数据质量B、降低数据量C、提高数据可用性D、增加数据多样性参考答案:AC28.下列属于数据挖掘中欠拟合现象的表现的是?A、在训练集上表现差B、在测试集上表现差C、模型复杂度高D、训练时间长参考答案:AB29.下列属于大数据处理平台的是?A、HadoopB、MySQLC、SparkD、Oracle参考答案:AC30.下列哪些是数据挖掘中的聚类问题?A、将客户分为不同群体B、预测销售额C、识别欺诈行为D、将文档分为不同主题参考答案:AD31.下列属于数据挖掘的目标的是?A、发现模式B、存储数据C、预测趋势D、统计数据参考答案:AC32.下列属于数据挖掘中模型评估的方法的是?A、交叉验证B、数据采样C、混淆矩阵D、数据清洗参考答案:AC33.下列属于监督学习的是?A、K-MeansB、支持向量机C、层次聚类D、逻辑回归参考答案:BD34.下列属于数据挖掘的典型应用的是?A、客户细分B、数据备份C、市场篮子分析D、数据加密参考答案:AC35.下列属于数据挖掘中数据集成的步骤的是?A、合并不同来源数据B、清洗数据C、转换数据D、存储数据参考答案:AC36.下列属于聚类算法的是?A、K-MeansB、决策树C、层次聚类D、逻辑回归参考答案:AC37.下列属于数据挖掘中数据探索的目的是?A、发现潜在模式B、提高数据质量C、生成数据报告D、优化模型性能参考答案:AC38.下列属于数据挖掘工具的是?A、ExcelB、HadoopC、SPSSD、SQL参考答案:ABC39.下列属于数据挖掘的步骤的是?A、数据清洗B、数据可视化C、模型构建D、数据存储参考答案:AC40.下列属于数据挖掘中数据可视化的工具的是?A、TableauB、PythonC、ExcelD、R参考答案:AC41.下列属于分类算法的是?A、K-MeansB、支持向量机C、层次聚类D、逻辑回归参考答案:BD42.下列属于数据挖掘中交叉验证的目的的是?A、评估模型性能B、提高数据量C、选择最佳参数D、减少计算成本参考答案:AC43.下列哪些是数据挖掘中的正则化方法?A、L1正则化B、L2正则化C、交叉验证D、Dropout参考答案:AB44.下列属于数据仓库特征的是?A、面向主题B、随机性C、集成性D、动态性参考答案:AC45.下列哪些是数据挖掘中的分类问题?A、预测客户流失B、客户分群C、推荐系统D、判断邮件是否为垃圾邮件参考答案:AD46.下列属于数据挖掘中正则化的目的是?A、防止过拟合B、提高计算速度C、降低模型复杂度D、增加数据量参考答案:AC47.下列哪些是数据挖掘中的特征选择方法?A、卡方检验B、信息增益C、交叉验证D、递归特征消除参考答案:ABD48.下列哪些是数据挖掘中的关联规则问题?A、发现购物篮中的商品组合B、预测用户行为C、识别异常数据D、分析用户购买路径参考答案:AD49.下列属于数据挖掘中数据存储的类型的是?A、关系型数据库B、文件系统C、NoSQL数据库D、云存储参考答案:AC50.下列哪些是数据挖掘中的降维技术?A、主成分分析(PCA)B、线性回归C、交叉验证D、t-SNE参考答案:AD51.下列属于数据挖掘的主要任务的是?A、分类B、聚类C、回归D、关联规则参考答案:ABCD52.下列属于数据挖掘中模型评估指标的是?A、准确率B、混淆矩阵C、噪声D、离群值参考答案:AB53.数据预处理的主要步骤包括?A、数据清洗B、数据集成C、数据转换D、数据选择参考答案:ABCD54.下列属于数据挖掘的常见任务的是?A、分类B、聚类C、回归D、编程参考答案:ABC55.下列属于数据预处理步骤的是?A、数据清洗B、数据转换C、数据可视化D、数据建模参考答案:AB56.下列属于关联规则挖掘的应用场景的是?A、购物篮分析B、图像识别C、推荐系统D、文本分类参考答案:AC57.下列属于数据挖掘中数据探索的步骤的是?A、描述性统计B、数据可视化C、数据分类D、数据聚类参考答案:AB58.下列属于数据挖掘中数据转换的步骤的是?A、标准化B、填充缺失值C、降维D、去除异常值参考答案:AC59.下列哪些是数据挖掘中常用的评估指标?A、准确率B、召回率C、F1分数D、均方误差参考答案:ABCD60.下列属于数据挖掘技术的是?A、神经网络B、数据库查询C、决策树D、机器学习参考答案:ACD判断题1.数据挖掘的模型可以自动优化。A、正确B、错误参考答案:A2.离群点(异常值)总是需要被删除。A、正确B、错误参考答案:B3.数据挖掘的最终目的是生成报表。A、正确B、错误参考答案:B4.数据挖掘的模型评估指标包括准确率和召回率。A、正确B、错误参考答案:A5.聚类分析是一种监督学习方法。A、正确B、错误参考答案:B6.数据挖掘的复杂度与数据量成正比。A、正确B、错误参考答案:A7.数据仓库与数据挖掘是同一概念。A、正确B、错误参考答案:B8.数据挖掘可以用于预测未来趋势。A、正确B、错误参考答案:A9.分类是数据挖掘的一种任务类型。A、正确B、错误参考答案:A10.朴素贝叶斯分类器假设特征之间相互独立。A、正确B、错误参考答案:A11.深度学习是数据挖掘的一种常用方法。A、正确B、错误参考答案:A12.支持向量机(SVM)主要用于回归问题。A、正确B、错误参考答案:B13.数据挖掘只能应用于结构化数据。A、正确B、错误参考答案:B14.主成分分析(PCA)是一种降维技术。A、正确B、错误参考答案:A15.数据挖掘的模型一旦建立就无需更新。A、正确B、错误参考答案:B16.数据挖掘是从大量数据中发现隐含模式和知识的过程。A、正确B、错误参考答案:A17.数据挖掘可以用于欺诈检测。答案:正确A、正确B、错误参考答案:A18.决策树是一种非参数方法。A、正确B、错误参考答案:A19.数据挖掘的应用范围非常有限。A、正确B、错误参考答案:B20.数据挖掘的任务包括分类、聚类、回归等。A、正确B、错误参考答案:A21.信息增益是决策树算法中选择最优划分属性的指标。A、正确B、错误参考答案:A22.数据挖掘过程中不需要考虑数据的隐私问题。A、正确B、错误参考答案:B23.数据挖掘的结果必须具有可解释性。A、正确B、错误参考答案:A24.聚类分析是一种无监督学习方法。A、正确B、错误参考答案:A25.分类和聚类都是有监督学习方法。A、正确B、错误参考答案:B26.数据挖掘的准确性不受数据噪声影响。A、正确B、错误参考答案:B27.数据挖掘的结果可能因数据质量而变化。A、正确B、错误参考答案:A28.数据挖掘的最终目标是生成可解释的模型。A、正确B、错误参考答案:A29.关联规则挖掘用于发现数据中的频繁项集。A、正确B、错误参考答案:A30.交叉验证是一种评估模型性能的方法。A、正确B、错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论