2025 年大学人工智能(特征工程基础)上学期期末测试卷_第1页
2025 年大学人工智能(特征工程基础)上学期期末测试卷_第2页
2025 年大学人工智能(特征工程基础)上学期期末测试卷_第3页
2025 年大学人工智能(特征工程基础)上学期期末测试卷_第4页
2025 年大学人工智能(特征工程基础)上学期期末测试卷_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学人工智能(特征工程基础)上学期期末测试卷

(考试时间:90分钟满分100分)班级______姓名______一、选择题(总共10题,每题4分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.以下关于特征工程的说法,错误的是()A.特征工程是将原始数据转换为更能代表预测模型的潜在问题的特征的过程B.好的特征工程能提升模型的性能和效果C.特征工程只需要关注数据的准确性,无需考虑数据的规模D.特征工程包括特征提取、特征选择、特征构建等环节2.在特征选择中,以下哪种方法不属于基于模型的方法()A.决策树B.支持向量机C.信息增益D.随机森林3.对于高维稀疏数据,以下哪种特征提取方法比较合适()A.主成分分析B.奇异值分解C.线性判别分析D.局部线性嵌入4.特征构建的目的是()A.从原始数据中提取新的特征B.去除无关特征C.选择最重要的特征D.对特征进行归一化处理5.以下关于特征缩放的说法,正确的是()A.特征缩放能使模型更快收敛B.所有特征都需要进行相同的缩放方式C.特征缩放会改变数据的分布D.特征缩放只对数值型特征有效6.在处理文本数据时,常用的特征提取方法不包括()A.词袋模型B.TF-IDFC.词向量模型D.线性回归7.对于类别型特征,以下哪种编码方式是最常用的()A.独热编码B.序数编码C.二进制编码D.哈希编码8.特征工程中,数据清洗的主要目的不包括()A.去除重复数据B.处理缺失值C.增加数据维度D.纠正错误数据9.以下哪种情况适合使用特征选择()A.数据维度较低B.模型性能已经很好C.存在大量冗余特征D.数据量很少10.在特征工程中,以下哪种方法可以用于特征降维()A.增加特征数量B.特征交叉C.聚类算法D.以上都不对二、多项选择题(总共5题,每题6分,在每小题给出的四个选项中,有多项是符合题目要求的,错选、多选、少选均不得分)1.特征工程的主要步骤包括()A.数据收集B.特征提取C.特征选择D.模型评估2.以下属于特征选择的方法有()A.方差选择法B.相关系数法C.决策树重要性D.LASSO回归3.对于特征提取,以下说法正确的是()A.可以将原始数据转换为更有意义的特征B.能降低数据的维度C.不同的特征提取方法适用于不同类型的数据D.特征提取后的数据更易于模型处理4.特征工程中,处理缺失值的方法有()A.删除含有缺失值的样本B.用均值填充C.用中位数填充D.用模型预测值填充5.以下哪些属于类别型特征的编码方式()A.独热编码B.标签编码C.频率编码D.目标编码三、判断题(总共10题,每题3分,判断下列说法的正误)1.特征工程对模型的性能没有太大影响。()2.基于统计的特征选择方法比基于模型的方法更准确。()3.主成分分析可以用于特征提取和降维。()4.特征构建只能基于现有特征进行简单组合。()5.特征缩放会影响模型的预测结果。()6.文本数据不需要进行特征工程。()7.独热编码适用于所有类别型特征。()8.数据清洗是特征工程的重要环节之一。()9.特征选择可以去除所有无关特征。()10.特征工程只在模型训练前进行,训练后不需要再考虑。()四、简答题(总共3题,每题10分,简要回答问题)1.简述特征工程中特征提取的常用方法及适用场景。2.说明特征选择的重要性以及常用的特征选择方法。3.举例说明如何进行特征构建,并阐述其意义。五、综合题(总共1题,每题20分,结合实际案例进行分析)假设你正在处理一个预测客户是否会购买某种产品的数据集,其中包含客户的年龄、性别、收入、购买历史等特征。请描述你将如何进行特征工程,包括数据清洗、特征提取、特征选择、特征构建等步骤,并说明理由。答案:一、选择题1.C2.C3.B4.A5.A6.D7.A8.C9.C10.C二、多项选择题1.ABC2.ABCD3.ABCD4.ABCD5.ABCD三、判断题1.×2.×3.√4.×5.√6.×7.×8.√9.×10.×四、简答题1.常用方法:主成分分析适用于数据维度高且存在相关性的情况,可提取主成分降维;奇异值分解用于高维数据处理;线性判别分析用于数据分类且有监督的情况。适用场景:根据数据特点和分析目的选择,如降维选主成分分析,处理高维稀疏数据选奇异值分解等。2.重要性:去除无关特征,减少噪声,提高模型训练效率和准确性,降低计算成本。常用方法:方差选择法、相关系数法、决策树重要性、LASSO回归等。3.例如将客户购买频率和平均购买金额构建为新特征“购买活跃度”。意义:能更全面反映客户购买行为,为模型提供更有价值信息,有助于提升模型对客户购买倾向的预测能力。五、综合题数据清洗:检查缺失值,用均值或中位数填充年龄、收入的缺失值;检查异常值,对年龄等特征进行截断处理。特征提取:对年龄、收入进行标准化处理;将性别进行独热编码。特征选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论