版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
长风破浪会有时,直挂云帆济沧海。南开大学23春“物联网工程”《数据科学导论》考试高频考点参考题库带答案(图片大小可自由调整)第I卷一.综合考核(共15题)1.具有双隐层的感知机足以用于解决任何复杂的分类问题。()A.正确B.错误2.子集产生本质上是一个搜索过程,该过程可以从空集、随机产生的一个特征子集或者整个特征集开始。()A.正确B.错误3.增加神经元的个数,无法提高神经网络的训练精度。()A.正确B.错误4.在数据预处理时,无论什么情况,都可以直接将异常值删除。()A.正确B.错误5.下面不是分类的常用方法的有()A.K近邻法B.朴素贝叶斯C.决策树D.条件随机场6.以下哪一项不是特征工程的子问题?()A.特征创建B.特征提取C.特征选择D.特征识别7.给定关联规则A→B,意味着:若A发生,B也会发生。()A.正确B.错误8.EDA可以最大化数据分析者对数据集和数据集底层结构的洞察力,并且为分析者提供数据集中包含的各类信息。()A.正确B.错误9.标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。()A.正确B.错误10.一般而言,信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升越大”,因此我们可用信息增益来进行决策树的最优特征选择。()A.正确B.错误11.对于多层感知机,()层拥有激活函数的功能神经元。A.输入层B.隐含层C.输出层12.单层感知机是由()层神经元组成。A.一B.二C.三D.四13.决策树分类时将该结点的实例强行分到条件概率大的那一类去。()A.正确B.错误14.具有偏差和至少()个S型隐含层加上一个()输出层的网络能够逼近任何有理数。A.1,线性B.2,线性C.1,非线性D.2,非线性15.当训练集较大的时候,标准BP算法通常会更快的获得更好的解。()A.正确B.错误第II卷一.综合考核(共15题)1.实体识别属于以下哪个过程()A.数据清洗B.数据集成C.数据规约D.数据变换2.为了解决任何复杂的分类问题,使用的感知机结构应至少包含()个隐含层。A.1B.2C.3D.43.Apriori算法的加速过程依赖于以下哪个策略()A.抽样B.剪枝C.缓冲D.并行4.剪枝是决策树学习算法对付“过拟合”的主要手段。()A.正确B.错误5.层次聚类适合规模较()的数据集。A.大B.中C.小D.所有6.通过构造新的指标-线损率,当超出线损率的正常范围,则可以判断这条线路的用户可能存在窃漏电等异常行为属于数据变换中的()。A.简单函数变换B.规范化C.属性构造D.连续属性离散化7.uBFR算法所使用数据中的簇在不同坐标下的标准差有所不同。()A.正确B.错误8.以下属于关联分析的是()A.CPU性能预测B.购物篮分析C.自动判断鸢尾花类别D.股票趋势建模9.阶跃函数具有不光滑、不连续的特点。()A.正确B.错误10.一元回归参数估计的参数求解方法有()。A.最大似然法B.距估计法C.最小二乘法D.欧式距离法11.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,512.聚类的主要方法有()A.划分聚类B.层次聚类C.密度聚类D.距离聚类13.可信度是对关联规则的准确度的衡量。()A.正确B.错误14.实体识别的常见形式()A.同名异义B.异名同义C.单位不统一D.属性不同15.对于项集来说,置信度没有意义。()A.正确B.错误第III卷一.综合考核(共15题)1.距离度量中的距离可以是()。A.欧式距离B.曼哈顿距离C.Lp距离D.Minkowski距离2.手肘法的核心指标是()A.SESB.SSEC.RMSED.MSE3.相关性的分类,按照相关的方向可以分为()。A.正相关B.负相关C.左相关D.右相关4.当特征为离散型时,可以使用信息增益作为评价统计量。()A.正确B.错误5.单层感知机对于线性不可分的数据,学习过程也可以收敛。()A.正确B.错误6.以下哪一项不属于数据变换?()A.简单函数变换B.规范化C.属性合并D.连续属性离散化7.相关性的分类,按照相关的方向可以分为()A.正相关B.负相关C.左相关D.右相关8.K-means算法采用贪心策略,通过迭代优化来近似求解。()A.正确B.错误9.一元线性回归中,真实值与预测值的差称为样本的()。A.误差B.方差C.测差D.残差10.决策树内部结点表示一个类,叶结点表示一个特征或属性。()A.正确B.错误11.Apriori算法的计算复杂度受()影响。A.支持度阈值B.项数C.事务数D.事务平均宽度12.相关性分析主要是分析个别独立变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过程。()A.正确B.错误13.数据科学运用科学方法分析数据,位于几个学科的交叉点并利用领域特定的知识,使大数据的分析成为可能。()A.正确B.错误14.使用SVD方法进行图像压缩不可以保留图像的重要特征。()A.正确B.错误15.k近邻法的基本要素包括()。A.距离度量B.k值的选择C.样本大小D.分类决策规则第I卷参考答案一.综合考核1.参考答案:A2.参考答案:A3.参考答案:B4.参考答案:B5.参考答案:D6.参考答案:D7.参考答案:B8.参考答案:A9.参考答案:B10.参考答案:A11.参考答案:BC12.参考答案:B13.参考答案:A14.参考答案:A15.参考答案:A第II卷参考答案一.综合考核1.参考答案:B2.参考答案:B3.参考答案:B4.参考答案:A5.参考答案:C6.参考答案:C7.参考答案:A8.参考答案:B9.参考答案:A10.参考答案:ABC11.参考答案:C12.参考答案:ABC13.参考答案:A14.参考答案:D15.参考答案:A第III卷参考答案一.综
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (新教材)2026人教版三年级下册数学 4 小讲堂 教学课件
- 2026年专利买卖合同(1篇)
- 2025 网络基础之能源网络的电网故障快速恢复网络案例课件
- 2026年农地租用合同(1篇)
- 文旅设备更新可行性研究报告
- 干燥设备生产项目可行性研究报告
- 行政处罚的种类和适用条件
- 高中信息技术信息系统在水产育苗场水质调控与鱼苗生长跟踪中的应用课件
- 2025 高中信息技术数据与计算之算法的模拟进化算法课件
- 2025 高中信息技术数据与计算之数据在智能医疗远程监护系统优化中的应用课件
- 水利工程鱼类保护监理实施细则
- 小学二年级下册《人与社会》教案
- 第一单元 一方水土一方情跟着课文探民风 整体公开课一等奖创新教学设计
- 网络安全培训教材与教学大纲(标准版)
- (一模)东北三省三校2026年高三第一次联合模拟考试英语试卷(含答案)+听力音频+听力原文
- 2025-2030中国对叔丁基苯甲酸市场竞争格局展望与营销创新发展趋势研究报告
- (2026春新版)苏教版二年级数学下册全册教学设计1
- 2026年春季人教版小学数学三年级下册教学计划(含进度表)
- 口腔正畸考核制度
- ARM Cortex-A9多核嵌入式系统开发教程
- 2026年《必背60题》通信工程专业26届考研复试高频面试题包含详细解答
评论
0/150
提交评论