版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试题说明
本套试题共包括1套试卷
答案和解析在每套试卷后
大数据挖掘技术练习练习题及答案1(500题)
大数据挖掘技术练习练习题及答案1
L[单选题]在无线数据端到端指标体系中,4G网络HTTP下载速率的指标定义是?
A)HTTP话单的上传下载数据总量除以上传下载总传输时长(限制500KB以上文件大小)
B)HTTP话单的总下载数据量除以总下载传输时长(限制1024KB以上文件大小)
OHTTP话单的总下载数据量除以总下载传输时长(限制500KB以上文件大小)
2.[单选题]数据预处理目前常用的异常数据识别方法包括业务判别法、()、箱线图判别法、统计判
别法
A)聚类判别法;
B)回归判别法
C)抽样判别法
3.[单选题]在无线数据端到端指标体系中,即时通信首包响应时延的指标定义是?
A)即时通信业务第一个HTTP响应包时延的平均值
B)即时通信业务最后一个HTTP数据包时延的平均值
0即时通信业务所有HTTP数据包时延的平均值
4.[单选题]在VoLTE质量评估体系中,VoLTE-VoLTE呼叫接通时长定义是?
A)双端VOLTE情况下,主叫VOLTE呼叫接通时长总和/主叫接通次数总和,VOLTE呼叫接通时长为主叫
上发invite到收到180ring的时间间隔
B)双端VOLTE情况下,被叫VOLTE呼叫接通时长总和/被叫接通次数总和,VOLTE呼叫接通时长为主叫
上发invite到收到180ring的时间间隔
C)双端VOLTE情况下,主被叫VOLTE呼叫接通时长总和/主被叫叫接通次数总和,VOLTE呼叫接通时长
为主叫上发invite到收到180ring的时间间隔
5.[单选题]简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚
类类型称作()
A)层次聚类
B)划分聚类
0非互斥聚类
D)模糊聚类
6.[单选题]通过代码"fromskiearnimportlinear_modelw引入线性模型模块,并通过代码“reg
=linearmodel.LinearRegression()v构造回归器对象后,在训练时要调用的方法是()。
A)reg.learn()
B)reg.predict()
C)reg.train()
D)reg.fit()
7.[单选题]人工智能在医疗上的使用不包括()
A)医疗大数据
B)回收废弃医疗设备
C)智能医疗
D)生物制药
8.[单选题]在Numpy包中,计算标准差的函数为()。
A)numpy.mean()
B)numpy.median()
C)numpy.std()
D)numpy.var()
9.[单选题]已知x=[1,2,3],执行语句x.append(4)之后,x的值是什么?
A)[1,2,3,4]
B)[4]
0[1,2,3]
D)4
10.[单选题]已知:
importpandasaspd
,,
data={a:[2,l/5,6],•c,:[6,54,6]}
df=pd.DataFrame(data)
dfl=df.sort_values('a'rascending=False)
print(dfl.iloc[2,1])
A)kl
B)d
01
D)6
11.[单选题]关于SQL量词叙述正确的是—
A)ANY和ALL是同义词
B)ANY和SOME是同义词
C)ALL和SOME是同义词
D)ALL和EXISTS是同义词
12.[单选题]下列属于数据挖掘的预测建模任务的是()。
A)分类
B)模式发现
C)模式匹配
D)聚类
13.[单选题]假设{BCE}为一频繁项目集(FrequentItemset),则根据AprioriPrinciple以下
何者不是子频繁项目?
A)BC
B)CE
C)C
D)CD
14.[单选题]根据性能管理应用落地手册,在DNS解析环节中,问题定界为终端原因的Resultcode为
()
A)0
B)1
C)2
D)5
15.[单选题]查找某个字段中以字母A开头且以字母Z结尾的所有记录,则条件表达式应设置为
A)LIKE"A$Z"
B)LIKE"A#Z"
OLIKE"A%Z"
D)LIKE"A_Z"
16.[单选题]执行以下操作后,list_two的值是:
List_one-[4,5,6]listtwo=list_onelistone[2]=3
A)[4,5,6]
B)[4,3,6]
C)[4,5,3]
D)都不对
17.[单选题]TCP/IP协议按照从底层到高层的顺序,除了应用层之外,每一层都有与其相对应的
PDU(ProtocolDataUnit,协议数据单元),依次为。
A)Bit、Segment,Packet,Frame
B)Bit、Frame>Packet、Segment
C)Packet,Bit、Frame,Segment
D)Bit>Packet、Frame、Segment
18.[单选题]当新业务、行为出现或目标跟踪业务出现新版本时,DPI设备应能在()周之内具备新
业务或新版本的识别能力。
A)1
B)2
03
D)4
19.[单选题]设X={1,2,3}是频繁项集,则可由X产生()个关联规则。
A)4
B)5
06
D)7
20.[单选题]从研究现状上看,下面不属于云计算特点的是()
A)超大规模
B)虚拟化
C)私有化
D)高可靠性
21.[单选题]requests库发送请求的get方法中,()参数来设置超时时间
A)timeout
B)headers
C)user_agent
D)add
22.[单选题]卡方检验?
A)是一种假设检验
B)是一种T检验
C)SAS有专门卡方检验过程
D)样本含量小于40也可以使用
23.[单选题]下面哪个是用来定义类的关键字?
A)continue
B)class
Odef
D)yield
24.[单选题]苹果的FacelD基于3D结构光技术,硬件上不需要()
A)点发射器
B)红外发射器
C)红外摄像头
D)数据线
25.[单选题]MySQL是()
A)操作系统;
B)数据库
C)聊天软件
D)浏览器
26.[单选题]Lasso回归与传统的线性回归方程区别是()
A)增加L1范数惩罚因子
B)增加L2范数惩罚因子
C)无区别
D)Lasso回归是线性方程在sigmoid函数上的嵌套
27.[单选题]下列代码作用为()Net_in=np.array([0,0,-1])Outin=np.array([0,0,0,0,-1])
A)输出层权值变化量
B)中间层权值变化量
C)中间层神经元输入和输出层神经元输入
D)输出连接权值和阈值
28.[单选题]推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求
,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。
A)客户的朋友
B)客户的个人信息
C)客户的兴趣爱好
D)客户过去的购买行为和购买记录
29.[单选题]检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。
A)统计方法
B)邻近度
C)密度
D)聚类技术
30.[单选题]以下哪个不是构造直方图的数据集划分方式
A)组距分组
B)分位数分组
C)多变量分组
D)均值-标准差分组
31.[单选题]神经元模型输出节点有()个
A)1
B)2
03
D)可自己设定
32.[单选题]下列对学生相关属性描述中,不是标称属性的是()
A)学号
B)婚姻状况
C)身高
D)衣服颜色
33.[单选题]关于决策树算法,以下的叙述错误的是
A)决策树修剪技术有预修剪和后修剪
B)决策树层数越多,预测结果准确性越高
OC5.0.CHAID、CART都属于决策树算法
D)修剪技术是为了防止过拟合的问题
34.[单选题]JSON中的中括号一般来表示()。
A)数组;
B)标点符号
C)对象
D)注释
35.[单选题]对于双路的室分系统来说,影响性能的因素有那些。
A)双路功率的平衡度
B)双路天线间距
OA&B
D)以上都不影响
36.[单选题]以下哪个聚类算法不是属于基于原型的聚类()。
A)模糊c均值
B)EM算法
OS0M
D)CLIQUE
37.[单选题]下列哪项不是TD-SCDMA系统的无线接口协议层()
A)物理层Physicallayer
B)数据链路层Datalinklayer
C)网络层Networklayer
D)媒体层Medialayer
38.[单选题]下列方法中,用于获取当前路径的是()
A)open
B)write
C)getcwd
D)read
39.[单选题]下列四项中,不属于数据库特点的是()
A)数据共享
B)数据完整性
C)数据冗余很高
D)数据独立性高
40.[单选题]下列哪些选项能表示序数属性的数据集中趋势度量()。
A)四分位数
B)标准差
C)众数
D)均值
41.[单选题]以下关于0LAP的叙述中错误的是0
A)一个多维数组可以表示为(维1,维2,…,维n)
B)维的一个取值称为该维的一个维成员
C)OLAP是联机分析处理
D)OLAP是数据仓库进行分析决策的基础
42.[单选题]下面哪个说明了JSON信息标记方法的缺陷或不足?
A)JSON标记仅用于JavaScript语言
B)JSON标记的信息存在类型,处理繁琐。
0JSON应用领域十分有限
D)JSON标记不能书写注释。
43.[单选题]假设文件不存在,如果使用open方法打开文件会报错,那么该文件的打开方式是下列哪
种模
式?()
A)r
B)w
C)a
D)w+
44.[单选题]在有关数据仓库测试,下列说法不正确的是:
A)在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统
测试.
B)当数据仓库的每个单独组件完成后,就需要对他们进行单元测试.
C)系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试.
D)在测试之前没必要制定详细的测试计划.
45.[单选题]描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是()
A)极差
B)标准差
C)均值
D)变异系数
46.[单选题]研究顾客购买手机价格与年龄,性别,收入和工作地点的关系可以使用()
A)回归方法
B)分类方法
C)聚类方法
D)关联分析
47.[单选题]在skiearn中,下面哪个类或方法,位于preprocessing模块()
A)train_test_split
B)LabelEncoder
C)accuracy_score
D)DecisionTreeClassifier
48.[单选题]若I={a,b,c,d},D中含有10个事务,{a,b,c}是一个频繁项集,则以下叙述中错误
的是()
A){a,b,c,d}一定是频繁项集
B){a,b}一定是频繁项集
C){a,c}一定是频繁项集
D){b}一定是频繁项集
49.[单选题]下列哪些数据不可以直接作为网络结构评估的数据源。
A)仿真栅格电平预测值
B)ATU数据
OMR数据
D)话统
50.[单选题]以下哪些分类方法可以较好地避免样本的不平衡问题,
A)KNN
B)SVM
C)Bayes
D)神经网络
51.[单选题]正则表达式字符集中,()表示单词字符。
A)\d
B)\D
C)\s
D)\w
52.[单选题]《客户满意度画像分析》应用落地手册中采用的核心算法是()
A)聚类算法
B)C4.5决策树
C)随机森林
D)梯度提升树
53.[单选题]RFM方法中的F说明客户的()
A)兴趣度
B)粘性
C)当前价值
D)未来价值
54.[单选题]终端用户感知优化与网络性能KPI优化中以下哪个指标是考核接入性能()
A)掉话率
B)切换成功率
C)PS速率
D)呼叫建立成功率
55.[单选题]以下关于字典操作的描述,错误的是()
A)del用于删除字典或者元素
B)clear用于清空字典中的数据
Olen方法可以计算字典中键值对的个数
D)keys方法可以获取字典的值视图
56.[单选题]下列选项中,属于非结构化数据的是:
A)图像
B)HTML
OXML
D)JSON
57.[单选题]数据库系统是由()组成的
A)数据库、数据库管理系统和用户
B)数据文件、命令文件和报表
C)数据库文件结构和数据
D)常量、变量和函数
58.[单选题]上题中,等宽划分时(宽度为50),15又在哪个箱子里?
A)第一个
B)第二个
C)第三个
D)第四个
59.[单选题]度量作为一种测度,满足以下哪些条件:
A)同一性
B)三角不等式
C)以上均是
D)对称性
60.[单选题]以下哪些分类方法可以较好地避免样本的不平衡问题()
A)KNN
B)SVM
C)Bayes
D)神经网络
61.[单选题]如果MS没有一个有效的P-TMSI(如新上网的MS)在附着时需要自己提供一个TLLL称为
A)randomTLLI
B)ruxiliaryTLLI
C)localTLLI
D)foreignTLLI
62.[单选题]以下关于文件的描述错误的选项是。
A)readlines()函数读入文件内容后返回一个列表,元素划分依据是文本文件中的换行符
B)read()一次性读入文本文件的全部内容后,返回一个字符串
OreadlineO函数读入文本文件的一行,返回一个字符串
D)二进制文件和文本文件都是可以用文本编辑器编辑的文件
63.[单选题]下列不属于关联分析的关键要素的是0
A)支持度
B)置信度
C)满意度
D)提升度
64.[单选题]下列四项中,不属于数据库特点的是()
A)数据共享
B)数据完整性
C)数据冗余很高
D)数据独立性高
65.[单选题]如何检查Namenode是否正常运行
A)jps
B)java-version
C)jpsstatus
D)namenodestatus
66.[单选题]下面关于聚类分析说法错误的是()
A)一定存在一个最优的分类
B)聚类分析是无监督学习
C)聚类分析可以用于判断异常值
D)聚类分析即:物以类聚,人以群分
67.[单选题]selectreplace('长江长城黄山黄河‘,'长','黄')返回的是。
A)长江长城黄山黄河
B)黄江长城黄山黄河
C)黄江黄城黄山黄河
D)长江长城长山长河
68.[单选题]谷歌浏览器开发者模式打开方式不正确的为()
A)F12
B)F11
C)鼠标右击,点“检查”
D)Ctrl+Shift+I
69.[单选题]有关数据仓库的开发特点,不正确的描述是:()
A)数据仓库开发要从数据出发
B)数据仓库使用的需求在开发出去就要明确
C)数据仓库的开发是一个不断循环的过程,是启发式的开发
D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析
和处理更灵活,且没有固定的模式
70.[单选题]如下哪些不是最近邻分类器的特点。()
A)它使用具体的训练实例进行预测,不必维护源自数据的模型
B)分类一个测试样例开销很大
C)最近邻分类器基于全局信息进行预测
D)可以生产任意形状的决策边界
71.[单选题]考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个
对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
A)平方欧几里德距离
B)余弦距离
C)直接相似度
D)共享最近邻
72.[单选题]当时间序列的环比增长速度大体相同时,适宜拟合()
A)指数曲线
B)抛物线
C)直线
D)对数曲线
73.[单选题]假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,
204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?
A)第一个
B)第二个
C)第三个
D)第四个
74.[单选题]关于0LAP和OLTP的区别描述,不正确的是:()
A)OLAP
B)与
O0LAP
D)OLAP
75.[单选题]在有关数据仓库测试,下列说法不正确的是()
A)在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系
统测试
B)当数据仓库的每个单独组件完成后,就需要对他们进行单元测试
C)系统的集成测试需要对数据仓库的所有组件进行大量的
功能测试和回归测试
D)在测试之前没必要制定详细的测试计划
76.[单选题]如下表所示,X={butter,cheese},则支持度support(X)=()。
交易号(TID)
商品(Items)
Ibeer,diaper,nuts
2beer,biscuit,diaper
3bread,butter,cheese
4beer,cheese,diaper,nuts
5beer,butter,cheese,nuts
A)2/5
B)4/5
01/5
D)3/5
77.[单选题]下列哪项活动属于数据挖掘
A)根据性别划分公司的顾客
B)使用历史记录预测公司未来的股票价格
C)预测骰子的结果
D)计算公司的总销售额
78.[单选题]下列()不是将主观信息加入到模式发现任务中的方法。
A)与同一时期其他数据对比
B)可视化
C)基于模板的方法
D)主观兴趣度量
79.[单选题]关于OLAP和OLTP的说法,下列不正确的是:
A)OLAP事务量大,但事务内容比较简单且重复率高.
B)OLAP的最终数据来源与OLTP不一样.
OOLTP面对的是决策人员和高层管理人员.
D)OLTP以应用为核心,是应用驱动的.
80.[单选题]SGSN与GGSN相连时使用哪种协议进行通信()
A)GTP
B)NTP
OPPP
D)GRE
81.[单选题]利用tree.DecisionTreeClassifier()训练模型时调用.fit()方法需要传递的第二个参
数是()o
A)样本特征X
B)样本标签Y
0判断标准
D)设置结点的最小样本数量
82.[单选题]下列关于人工智能叙述不正确的有()
A)人工智能是科学技术发展趋势
B)人工智能有力的促进了社会发展
C)AI没有真的到来
D)人工智能技术与其他科学技术相结合极大提高应用技术的智能化水平
83.[单选题]以下属于关联分析的是
A)CPU性能预测
B)购物篮分析
C)自动判断莺尾花类别
D)股票趋势建模
84.[单选题]概念分层图是—图。
A)无向无环
B)有向无环
C)有向有环
D)无向有环
85.[单选题]、当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的
数据相分离?
A)分类
B)聚类
C)关联分析
D)隐马尔可夫链
86.[单选题]有关数据仓库的开发特点,不正确的描述是
A)数据仓库开发要从数据出发
B)数据仓库使用的需求在开发出去就要明确
C)数据仓库的开发是一个不断循环的过程,是启发式的开发
D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处
理更灵活,且没有固定的模式
87.[单选题]下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。
A)JP
B)JP
C)JP
D)JP
88.[单选题]用于分类与回归应用的主要算法有()。
A)RBF神经网络、K均值法、决策树
B)Apriori算法、HotSpot算法
C)K均值法、S0M神经网络
D)决策树、BP神经网络、贝叶斯
89.[单选题]一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级
110人。则年级属性的众数是:
A)一年级
B)二年级
C)三年级
D)四年级
90.[单选题]已知某企业第20期的模型参数a=91856T05,用二次指数平滑法预测第25期的
销售量是()。
A)1023.5
B)1443.5
04697.5
D)5117.5
91.[单选题]bootstrap数据是什么意思?()
A)有放回地从总共M个特征中抽样m个特征
B)无放回地从总共M个特征中抽样m个特征
C)有放回地从总共N个样本中抽样n个样本
D)无放回地从总共N个样本中抽样n个样本
92.[单选题]假设Python中data=pd.Series(["1","2","3","4"]),则data,loc[2:]的职是
A)3
B)234
034
D)12
93.[单选题]运行以下代码
Fromsklearn.datasetsimportload_iris
Iris_data=load_iris()
Iris_data.data,shape
输出结果为(150,4)0则表示iris数据集包括样本个数为()。
A)150
B)154
0600
D)4
94.[单选题]MapReduce的Map函数产生很多的()
A)Key
B)Value
C)<key,value>
D)Hash
95.[单选题]对于企业来说,数据使用的关键是()
A)数据收集
B)数据存储
C)数据分析
D)数据再利用
96.[单选题]附着流程中若创建默认承载流程失败给终端的错误码是
A)Nosuitablecellsintrackingarea#15
B)EPSservicesnotallowed#7
C)Implicitlydetached#10
D)ESMfailure#19
97.[单选题]有关数据仓库的开发特点,不正确的描述是:
A)数据仓库开发要从数据出发;
B)数据仓库使用的需求在开发出去就要明确;
C)数据仓库的开发是一个不断循环的过程,是启发式的开发;
D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处
理更灵活,且没有固定的模式
98.[单选题]如果允许一条记录触发多条分类规则,把每条被触发规则的后件看作是对相应类的一次
投票,然后计票确定测试记录的类标号,称为
A)无序规则
B)穷举规则
C)互斥规则
D)有序规则
99.[单选题]()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次
聚类技术。
A)MIN(单链)
B)MAX(全链)
C)组平均
D)Ward
100.[单选题]在数据分析和处理方面具有分析方法丰富、分析模型扩展强、数据挖掘能力强等特点
的分析工具是()o
A)Weka
B)SPSS
OSAS
D)R
101.[单选题]Zookeeper是
A)集群协调服务
B)分布式应用
C)AB都不对
D)AB都对
102.[单选题]打开一个已有文件,然后在文件末尾添加信息,正确的打开方式为()
A)r
B)w
C)a
D)w+
103.[单选题]KNN算法可以用于。
A)分类
B)回归
C)测试
D)分类和回归
104.[单选题]d={)
d.setdefault('a',0)
d.setdefault('b',[1,2,3])
d.setdefault('b',[1,2])
print(d)
A){'a':0,'b':[1,2,3])
B){'a':0,'b':[1,2]}
C){'b':[1,2,3])
D){'a':0}
105.[单选题]全网通双卡槽营销支撑分析中,全网通双卡槽双IMEI在网终端数指标来源为
A)LTE/Mc信令监测统计在网去重终端数
B)GbAttach识别移动数据功能关闭用户数
C)基于开户数据排出移动卡4G功能未开通
D)信令监测语音在网且数据不在网
106.[单选题]已知x=[1,2,3],那么x*3的值为?
A)6
B)18
0[3,6,9]
D)[1,2,3,1,2,3,1,2,3]
107.[单选题]以下不属于开源的数据挖掘工具是()
A)RapidMiner
B)NLTK
C)KNIME
D)WEKA
108.[单选题]对MOLAP和ROLAP的比较中错误的是()
A)MOLAP的查询能力一般较好,而在ROLPA中进行查询,往往很难预料查询结果
B)MOLAP所需要的数据加载时间较长,而ROLAP的数据加载时间比MOLAP短
0ROLAP比MOLAP的分析速度要快很多
D)MOLAP在分析过程中精度较高,具有分析的优势
109.[单选题]用户使用小包传输的数据业务时,哪项指标对用户感知的影响较明显?
A)首包时延
B)响应成功率
C)下载速率
D)登陆成功率
110.[单选题]根据《居民区4G&宽带网络能力全景分析》中的建议,优先考虑4G深度覆盖建设居民区
标签为
A)4G弱覆盖居民区&用户感知差居民区&高价值居民区&常驻用户多居民区
B)4G弱覆盖居民区&高价值居民区&常驻用户多居民区
C)4G弱覆盖居民区&用户感知差居民区&高价值居民区
D)用户感知差居民区&高价值居民区&常驻用户多居民区
111.[单选题]从目前技术角度来讲,下面说法不正确的是()
A)人工智能还属于弱人工智能范畴
B)AI依然没有常识、没有自我意识
C)AI没有真正的情感,不具备抽象能力
D)人工智能已无所不能
112.[单选题]在人工智能研究领域中,主要研究计算机如何自动获取知识和技能,实现自我完善的
研究分支学科叫O
A)专家系统
B)机器学习
C)神经网络
D)模式识别
113.[单选题]使用最小-最大法进行数据规范化,需要映射的目标区间为[0,100],原来的取值范围是
[70,10]。根据等比映射的原理,一个值8映射到新区间后的值是()。
A)95
B)90
085
D)80
114.[单选题]通过代码"fromsklearnimportmetrics”引入评价指标模块后,面对真实标签
true」abel和模型预测标签predicted_label,混淆矩阵可通过调用()代码得到。
A)metrics.confusion_matrix(predicted_label,true_labe)
B)metrics.confusionmatrix(true_labe,predicted_label)
C)confusion_matrix(true_labe,predicted_label)
D)confusion_matrix(predictedlabel,true_labe)
115.[单选题]咪咕视频业务的端到端感知评价指标中感知最相关且DPI可以精准建模的指标是
A)初缓时长
B)下载速率
C)卡顿时长
D)播放成功率
116.[单选题]下列哪个协议可提供“ping”和“traceroute”这样的故障诊断功能
A)ICMP
B)IGMP
C)ARP
D)RARP
117.[单选题]考虑值集{1、2、3、4、5、90},其截断均值(p=20/是
A)2
B)3
C)3.5
D)5
118.[单选题]IP地址127.0.0.1表示什么
A)本地broadcast
B)直接multicast
C)本地network
D)本地loopback
119.[单选题]下列说法错误的是()
A)相关系数矩阵是一个对称矩阵,其中对角线上的元素都是1,表示自相关系数
B)非对角线元素表示互相关系数,每个元素的绝对值都小于等于0,反应变量变化趋势的相似程度
C)相关系数的绝对值越大,表示两个信号互相影响的程度越大
D)如果相关系数矩阵中非对角线元素大于0,表示两个信号正相关,其中一个信号变大时另一个信号
也变大,变化方向一致
120.[单选题]Hadoop2.6的核心参数文件是
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)hadoop-env.sh
121.[单选题]数据挖掘的英文简写是()
A)DKD
B)KDD
ODM
D)DA
122.[单选题]已知:
则t的取值是()
A)1
B)2
03
D)4
123.[单选题]云计算是对()技术的发展与运用
t=0
foriinrange(2):
forjinrange⑵:
It=t+1
print(t)
A)并行计算
B)网格计算
C)分布式计算
D)三个选项都是
124.[单选题]以下是哪一个聚类算法的算法流程:①构造k-最近邻图。②使用多层图划分算法划分图
o③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。④until:不再
有可以合并的簇。()。
A)MST
B)OPOSSUM
C)Chameleon
D)Jarvis-Patrick(JP)
125.[单选题]关于数据仓库设计,下列说法中正确的是0。
A)不可能从用户的需求出发来进行数据仓库的设计
B)只能从各部门业务应用的方式来设计数据模型
C)在进行数据仓库主题数据模型设计时要强调数据的集成性
D)在进行数据仓库概念模型设计时,必须要设计实体关系图
126.[单选题]下列哪一个TCP层指标不反应S1口以下的质差问题?
A)RTT上行时延
B)RTT下行时延
C)TCP下行重传率
D)TCP上行重传率
127.[单选题]下列对学生相关属性描述中,不是标称属性的是()
A)身高
B)头发颜色
C)学号
D)婚姻状况
128.[单选题]关于主成分数目的选取,正确的是()
A)保留多少个主成分取决于累计方差在方差总和中所占百分比
B)一般选择50%以上
C)选择前两个就可以
D)选择的数目和变量的个数一致
129.[单选题]下面哪个不属于数据的属性类型:()
A)标称
B)序数
C)区间
D)相异
130.[单选题]在SELECT语句中,DISTINCT子句的作用是。
A)对查询结果进行分组
B)消除重复出现的查询记录
C)按条件显示部分查询记录
D)删除查询结果中符合条件的记录
131.[单选题]分类变量使用以下哪个统计量进行缺失值填补较合适
A)均值
B)最大值
C)众数
D)中位数
132.[单选题]EPC不包括以下网元()
A)MME
B)HSS
C)PCRF
D)M-MGW
133.[单选题]感知器以一个()作为输入,计算这些输入的线性组合,然后如果结果大于某个阈值
就输出1,否则输出T
A)实数
B)线性组合
C)实数值向量
D)实例
134.[单选题]sklearn库中提供。实现KNN算法
A)k-NearerNeighborClassifier
B)KNeighborsClassifier
C)KNeighborClassifier
D)k-NearestNeighborsClassifier
135.[单选题]已知:
则s的取值是
t=5
s=0
whilet:
s=s+t
t=t-l
print('s=',s)
A)10
B)12
013
D)15
136.[单选题]以下哪些学科和数据挖掘没有密切联系?()
A)统计学
B)计算机组成原理
C)机器学习
D)人工智能
137.[单选题]服务器返回某个响应报头的取值如下:
Content-Type:text/html;charset=utf-8
对于上述报头所表示的含义,描述正确的是()。
A)客户端使用utf-8格式对资源进行解码,然后对资源进行HTML解析
B)客户端使用HTML格式对资源进行解码,然后对资源进行utf-8解析
C)客户端使用utf-8格式对资源进行编码,然后对资源进行HTML解析
D)客户端使用HIML格式对资源进行编码,然后对资源进行utf-8解析
138.[单选题]下列说明错误的是()
A)性别="男”=>职业="司机”,是布尔型关联规则
B)性别="女”=>avg(收入)=2300,是一个数值型
关联规则
C)肝炎=>ALT(丙氨酸转氨酶)升高,是一个单层关联规则
D)性别="女”=>职业="秘书”,是多维关联规则
139.[单选题]对于下图,一个比较好的主成分选择是多少?
A)7
B)30
035
D)不能确定
140.[单选题]朴素贝叶斯分类算法是基于()假设的。
u0
L
x0。00。。。。00。。。。。
t
e0
d6
x
w
~9
。0
ou
og
cq
xko
l0
jc0
Ao
nN
leo
un
nJ
oI—I
O
3040
PnnapalComponent
A)使用的描述属性是相关的
B)使用的描述属性是独立的
C)描述属性和类别属性是独立的
D)以上都不对
141.[单选题]一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义
A)概率
B)邻近度
C)密度
D)聚类
142.[单选题]是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的
A)边界点
B)质心
C)离群点
D)核心点
143.[单选题]为支撑市场营销,除下述哪个用户终端特征识别外,均能用于提高批开用户的VoLTE转
化成功率
A)软件版本
B)软开关状态识别
C)VoLTE版本
D)芯片版本
144.[单选题]以下哪项关于决策树的说法是错误的()
A)冗余属性不会对决策树的准确率造成不利的影响
B)子树可能在决策树中重复多次
C)决策树算法对于噪声的干扰非常敏感
D)寻找最佳决策树是
145.[单选题]()是关于随机事件A和B的条件概率(或边缘概率)的一则定理
A)全概率定理
B)大数定律
C)高斯定理
D)贝叶斯定理
146.[单选题]下列selenium库的方法中,通过元素名称进行多元素定位的是()
A)find_element_by_name
B)find_elements_by_name
C)find_elements_by_id
D)find_e1ements_by_c1ass_name
147.[单选题]以下哪些分类方法可以较好地避免样本的不平衡问题?
()
A)KNN
B)SVM
C)Bayes
D)神经网络
148.[单选题]在FP-GR0WTH算法中,已构造FP-Tree如图
则项13的条件模式基为
A)〈(H,I2:2)〉、12:2、Il:2
B)<(I2,I1:2)>.I2:hII:1
C)〈(I2,I1:2)〉、12:2、Il:2
D)<(I2,I1:1)>.12:2、11:2
149.[单选题]贝叶斯信念网络由两部分组成,分别是网络结构和()。
A)条件概率
B)先验概率
C)后验概率
D)条件概率表
150.[单选题]下列不属于分类算法的是()
A)C4.5算法
B)逻辑回归
OKNN算法
D)TF-TDF算法
151.[单选题]一般,k-NN最近邻方法在()的情况下效果较好
A)样本较多但典型性不好
B)样本较少但典型性好
C)样本呈团状分布
D)样本呈链状分布
152.[单选题]属于定量的属性类型是()。
A)标称
B)序数
C)区间
D)相异
153.[单选题]将复杂的地址简化成北、中、南、东四区,是在进行?
A)数据正规化
B)数据一般化
C)数据离散化
D)数据整合
154.[单选题]一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四
年级110人。则年级属性的众数是:()
A)一年级
B)二年级
C)三年级
D)四年级
155.[单选题]下列哪种调制方式效率最高
A)BPSK
B)QPSK
C)16QAM
D)64QAM
156.[单选题]下面哪个不是信息提取的思路?
A)结合部分格式解析和搜索的方式提取所需要的信息。
B)按照信息格式完全解析,解析后找到所需提取的信息。
C)无视格式,直接搜索找到所需提取的信息。
D)通过自然语言处理方式找到所需提取的信息。
157.[单选题]打开文件进行读写,操作完成后应该调用()方法关闭文件,以释放资源
A)close
B)open
C)write
D)read
158.[单选题]燧是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的病是:
A)1比特
B)2.6比特
03.2比特
D)3.8比特
159.[单选题]importpandasaspd
data={,al:[2,1,5,6],*6*:['klf,Tdf,1,*kl1],1cr:[6,5,1,6]}
df二pd.DataFrame(data)
dl=df.iloc[0:2,2]
d2=df.loc[df['b']二二'kl','c']
print(dl)
print(d2)
A)0,61,5Name:c,dtype:int64
B)0,63,6Name:c,dtype:int64
C)1,52,1Name:c,dtype:int64
D)1,53,6Name:c,dtype:int64
160.[单选题]在比较模型的拟合效果时,甲、乙、丙、丁四个模型的决定系数夕2的值分别约为
0.96.0.85、0.80和0.7,则拟合效果好的模型是()。
A)T
B)乙
C)甲
D)丙
161.[单选题]决策树中不包含一下哪种结点()
A)根结点(rootnode)
B)内部结点(internalnode)
C)外部结点(externalnode)
D)叶结点(leafnode)
162.[单选题]下列哪种()算法不能从现有数据中挖掘类似群体
A)指数平滑法
B)K-means算法
C)K-medoids算法
D)CLARANS算法
163.[单选题]假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序
):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45
,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值
为:
A)18.3
B)22.6
026.8
D)27.9
164.[单选题]迈克尔•波特的“五力模型”中,五种竞争力量中不包括()
A)新进入者
B)供应商议价能力
C)其他利益相关者力量
D)行业中现有竞争者
165.[单选题]hadoop关闭分布式计算框架命令是?
A)stop-yarn,sh
B)stop-yan.sh
C)stop-hbase.sh
D)stop-dfs.sh
166.[单选题]sklearn.lineajmodel中的()可实现线性回归
A)LinearAlgebra
B)LinearActuator
C)LinearRegression
D)LinearCausation
167.[单选题]评估完模型之后,发现模型存在高偏差(highbias),应该如何解决?()
A)减少模型的特征数量
B)增加模型的特征数量
C)增加样本数量
D)以上说法都正确
168.[单选题]求“学生成绩”数据表中的平均分,正确的SQL语句是_
A)SELECTMAX(成绩)FROM学生成绩;
B)SELECTMIN(成绩)FROM学生成绩;
C)SELECTAVG(成绩)FROM学生成绩;
D)SELECTSUM(成绩)FROM学生成绩;
169.[单选题]访问网页成功,返回的结果为:url="rq=requests.get(url)
print(rq.status_code)
A)200
B)304
0403
D)500
170.[单选题]关于K均值和DBSCAN的比较,以下说法不正确的是()。
A)K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类
所有对象
B)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
OK均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
D)K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇
171.[单选题]SELECT语句中的JOIN用来实现多个表的连接查询,JOIN应放在下列哪个短语之后
________________O
A)FROM
B)WHERE
C)ON
D)GROUPBY
172.[单选题]()是一种松散耦合的服务和应用之间标准的集成方式。
A)E.SB;
B)D.M
OODS
D)E.TL
173.[单选题]以下哪些指标可以通过网优平台获取?()
A)无线接通率
B)eSRVCC切换成功率
C)TCH话务量
D)E-RAB建立成功率
174.[单选题]最小最大规范化方法MinMaxScaler属于python中的哪个包()。
A)numpy
B)scipy
C)pandas
D)skiearn
175.[单选题]AttachRequest消息在Sl-MME接口中被封装在什么消息中
A)RRCConnectionSetupRequest
B)InitialUEMessage
C)SecurityModeCommand
D)SecurityModeComplete
176.[单选题]OLAP的核心是0
A)对用户的快速响应
B)互操作性
C)多维数据分析
D)以上都不是
177.[单选题]数据仓库的模式中,最基本的是()。
A)事实星座模型
B)雪花模型
C)星形模型
D)以上都不对
178.[单选题]要求满足连接条件的记录,以及连接条件左侧表中的记录都包含在结果中,应使用
________________O
A)左连接
B)右连接
C)内部连接
D)完全连接
179.[单选题]下面哪个不属于数据的属性类型
A)标称
B)序数
C)区间
D)相异
180.[单选题]数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算法的结果
集成起来进行
最后的预测(集成学习),以下对集成学习说法正确的是
A)单个模型之间有高相关性
B)单个模型之间有低相关性
C)在集成学习中使用“平均权重”而不是“投票”会比较好
D)单个模型都是用的一个算法
181.[单选题]考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获
胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果
下一场比赛在队1的主场进行队1获胜的概率为()
A)0.75
B)0.35
00.4678
D)0.5738
182.[单选题]以下不可以用来分类的模型是
A)线性回归模型
B)神经网络模型
C)逻辑回归模型
D)支持向量机
183.[单选题]有一组数据其均值是20,对其中的每一个数据都加上
10,那么得到的这组新数据的均值是()。
A)20
B)10
015
D)30
184.[单选题]如果性能报表中没有KPI数据,不可能是以下哪种情况()
A)采集周期内没有进行相关的业务
B)采集周期内性能统计计划处于挂起状态
C)pc进程挂死
D)FTP服务器与eNB之间ping不通
185.[单选题]下列哪个不是专门用于可视化时间空间数据的技术:()
A)等高线图
B)饼图
C)曲面图
D)矢量场图
186.[单选题]以下关于Python语言中“缩进”说法正确的是:
A)缩进统一为4个空格
B)缩进在程序中长度统一且强制使用
C)缩进是非强制的,仅为了提高代码可读性
D)缩进可以用在任何语句之后,表示语句间的包含关系
187.[单选题]来自集中性能管理系统的指标是
A)4G最差小区占比(%)
B)交通枢纽VoLTE接通率(盼
C)高利用率MGCF占比(%)
D)网络安全重大事件次数(次)
188.[单选题]神经网络就是模拟人的大脑的神经单元的工作方式,但进行了很大的简化,神经网络
由很多神经网络层构成,而每一层又由许多单元组成,第一层叫输入层,最后一层叫输出层,中间
的各层叫()
A)中间层
B)简略层
C)过渡层
D)隐藏层
189.[单选题]以下哪项不是集团要求各省集中性能平台必须包含的VOLTE指标?。
A)注册成功率
B)VoLTE呼叫接通率
C)VoLTE掉话率
D)M0S3.0以上占比
190.[单选题]数据仓库的最终目的是()
A)收集业务需求
B)建立数据仓库逻辑模型
C)开发数据仓库的应用分析
D)为用户和业务部门提供决策支持
191.[单选题]Pandas处理缺失值的函数有()
A)fillna
B)iloc
Ofit
D)transform
192.[单选题]三层神经网络中,()可以有一层或多层。
A)输入层
B)输出层
C)隐藏层
D)前馈层
193.[单选题]运行以下代码"importmatplotlib.pyplotaspit”引入pit后,要绘制折线图,需要
利用的函数为()。
A)plt.pie()
B)pit.hist()
Oplt.plot()
D)pit.bar()
194.[单选题]源业务系统接入数据中心的方式主要有:JDBCESB和()。
A)D.XP;
B)E.SP
C)0GG
D)E.TL
195.[单选题]以下哪项关于决策树的说法是错误的
A)冗余属性不会对决策树的准确率造成不利的影响
B)子树可能在决策树中重复多次
C)决策树算法对于噪声的干扰非常敏感k-neans最敏感
D)寻找最佳决策树是NP完全问题
196.[单选题]利用linear.model.LinearRegression()训练模型时调用.fit()方法需要传递的第二个
参数是()。
A)样本特征X
B)样本标签Y
C)是否考虑计算截距
D)样本权重
197.[单选题]以下关于人工神经网络(ANN)的描述错误的有()
A)神经网络对训练数据中的噪声非常鲁棒
B)可以处理冗余特征
C)训练
D)至少含有一个隐藏层的多层神经网络
198.[单选题]朴素贝叶斯分类中得到条件概率的方法错误的是()。
A)对于定量属性,假设变量服从某种概率分布,通过训练数据集估计分布的参数
B)对于定性属性,计算某一类别的样本中某种属性取该值的样本所占比例来近似
C)对于定量属性,将取值离散化变为区间,再当做定性属性处理
D)对于定性属性,将转化为定量属性,再计算相应的概率
199.[单选题]使用pip工具升级科学计算扩展库numpy的完整命令是()
A)pipinstall-upgradenumpy
B)piplist-upgradenumpy
C)upgradenumpy
D)upgnumpy-pipinstall
200.[单选题]以下是哪一个聚类算法的算法流程:①构造k—最近邻图。②使用多层图划分算法划分
图。③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。
©until:不再有可以合并的簇。()。
A)MST
B)OPOSSUM
C)Chameleon
D)Jarvis—Patrick(JP)
201.[单选题]字典对象的方法返回字典的“值”列表
A)keys()
B)key()
C)values()
D)items()
202.[单选题]在Bigtable中,()主要用来存储子表数据以及一些日志文件
A)GFS
B)Chubby
OSSTable
D)MapReduce
二、(共40题)
203.[单选题]模型树的叶子结点对应()。
A)一个数值
B)以上都可以
C)一个线性回归方程
D)某个类别
204.[单选题]给定numpy.ndarray类型的数X,在以下代码中,eps参数的含义是()。
Fromsklearn.clusterimportDBSCAN
Clustering=DBSCAN(=3,min_samples=2).fit()
A)簇的个数
B)邻域半径
C)每个簇的最小样本数
D)收敛条件阈值
205.[单选题]用户能正常使用VOLTE终端,打VOLTE电话,然后用户VOLTE终端关机,将SIM卡放入
2G终端,并且拨打电话后,再关机,将SIM卡放回原VOLTE终端,开机后,这时用户拨打电话会出现
以下哪个现象
A)用户通话CSFB回落
B)用户能正常打通VOLTE高清电话
C)用户通话失败,终端话筒无声
D)VOLTE终端出现脱网
206.[单选题]使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?
A)探索性数据分析
B)建模描述
C)预测建模
D)寻找模式和规则
207.[单选题]以下哪个算法是无监督学习算法:()
A)朴素贝叶斯
B)LinearRegression
C)K-Means
D)支持向量机
208.[单选题]MDX是一种0
A)数据仓库建模语言
B)创建数据库的语言
C)数据仓库开发语言
D)0LAP和数据仓库应用中使用最广泛的多维数据查询语言
209.[单选题]DPI技术主要应用在ISO分层的哪一层?
A)网络层
B)会话层
C)应用层
D)数据链路层
210.[单选题]以下影响HTTP速率的因素中哪一个直接与终端相关()
A)TCP通告窗口大小
B)TCP上行乱序比例
C)TCP下行RTT
D)TCP下行乱序比例
211.[单选题]IP报头的最大长度是多少个字节
A)20
B)60
C)64
D)256
212.[单选题]在MySQL中,对于字段值为空值(NULL)叙述正确的是
A)空值等同于空字符串
B)空值表示字段还没有确定值
C)不支持字段值为空值
D)空值等同于数值0
213.[单选题]DHCP支持哪种类型的地址分配()
A)自动分配
B)动态分配
C)手工分配
D)以上
214.[单选题]连接控制、流控制、报文分段等属于哪一层的功能
A)物理层
B)数据链路层
C)网络层
D)传输层
215.[单选题]因业务需要进行客户敏感数据查询操作时,必须确保所有查询操作行为经过()授权
,并留存授权记录,禁止在未经授权的情况下进行查询操作。
A)上级主管部门
B)用户
C)金库审批员
D)部门级以上领导
216.[单选题]支持向量机是一种二分类模型,其基本模型定义为特征空间上的间隔最大的线性分类
器,其学习策略便是(),最终可转化为一个凸二次规划问题的求解。
A)间隔最小化
B)间隔最大化
C)间隔不变化
D)分类最大化z
217.[单选题]在FP-growth构建频繁模式树中,每个()(除根结点外)代表一个单项,树中的每条()
代表原数据中每一个条目的各个项。如果把条目内的项组合在一起看成一个字符串,则字符串前缀相
同时共享相同的()。
A)结点;路径;结点
B)结点;路径;路径
C)路径;路径;结点
D)路径;路径;路径
218.[单选题]在多层次关联规则分析中,如果将商品进行归类,每一商品类别的支持度会()其包含的
每个商品的支持度,从而有利于发现一些有意义的频繁模式或关联规则。
A)大于
B)小于
C)不确定
D)等于
219.[单选题]以下哪些算法是基于规则的分类器
A)C4.5
B)KNN
C)NaiveBayes
D)ANN
220.[单选题]OLAP的含义是()
A)面向对象分析处理
B)面向过程分析处理
C)联机事务处理
D)联机分析处理
221.[单选题]以下哪项关于决策树的说法是错误的()
A)冗余属性不会对决策树的准确率造成不利的影响
B)子树可能在决策树中重复多次
C)决策树算法对于噪声的干扰非常敏感
D)寻找最佳决策树是NP完全问题
222.[单选题]SQL语句中删除表的命令是()
A)DROPTABLE
B)DELETETABLE
C)ERASETABLE
D)DELETEDBF
223.[单选题]自动化高级分析实验室,实现与统一数据资源库互联,实现数据的自助组表、自助分析
功能,满足不同层级、不同水平的用户需求的是()
A)初级分析;
B)综合分析
C)典型分析
D)高级分析
224.[单选题]OLAP系统按照其数据在存储器中的存储格式可以分为()三种类型。
A)关系OLAP、对象OLAP、混合型OLAP
B)关系OLAP、混合型OLAP、多维OLAP
C)对象OLAP、混合型OLAP、多维OLAP
D)关系OLAP、对象OLAP、多维OLAP
225.[单选题]P(22,1,42,10),Q(20,0,36,8)为两个向量对象,这两个对象的切比雪夫距离是O。
A)6
B)V45
0233
D)ll
226.[单选题]下列关于DPI规则识别中业务大类的说法错误的是?
A)业务大类为1的是即时通信类业务
B)数据流量业务大类分类除了其他业务外一共有15类
C)视频大类不包括传统意义上基于P2P技术的视频业务
D)彩信单独属于一类业务大类
227.[单选题]大数据背景下,数据支撑业务的目的是0
A)建立数据科学
B)完成数据应用
C)配备数据硬件
D)吸纳数据人才
228.[单选题]当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的
数据相分离?
A)分类
B)聚类
C)关联分析
D)隐马尔可夫链
229.[单选题]P(22,1,42,10),Q(20,0,36,8)为两个向量对象,这两个对象的曼哈顿距离是()。
A)6
B)三次根号下233
C)根号下45
D)ll
230.[单选题]()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层
次聚类技术。
A)MIN(单链)
B)MAX(全链)
C)组平均
D)Ward方法
231.[单选题]下述方法不属于聚类方法的是()
A)K-均值
B)K-中心性
ODBSCAN算法
D)神经网络
232.[单选题]在FP-GR0WTH算法中,已构造FP-Tree如图
>则项15的条件模式基为()
A)〈(H,I2:1)〉、<I1,I3:1>
B)〈(I2,H:1)>、<12,11,13:1>
C)<(I2,I1:1)>,<11,13,12:1>
D)<(I1,I2:1)>,<12,11,13:1>
233.[单选题]list=['a','b','c','d','e']
下列操作会正常输出结果的是:
A)1ist[-4:-1:-11
B)list[:3:2]
C)list[l:3:0]
D)list['a':'d':2]
null()
Support
234.[单选题]在字符串打印中,哪个是出现中文字符对不齐问题的原因?
A)英文字体没有与中文字体设为相同。
B)没有对Python源代码作编码约束,应该在文件首行表示源代码为UTF-8编码
0Python3输出对中文支持不好。
D)中文字符占两个位置,而英文字符只占一个位置。
235.[单选题]有关数据仓库物理模型设计的叙述中正确的是()。
A)存储结构中不能存在任何数据冗余
B)尽可能多地建立索引
C)尽可能把在逻辑上关联的数据放在一个表中
D)以上都不对
236.[单选题]在进行数据挖掘任务的时候,通常面临样本数据特征过多的情况,我们可以通过
Filter过滤法选择
那些对我们分析任务更有帮助的特征,下列方法哪个不是用来做特征过滤的()
A)卡方检验
B)F检验
C)互信息法
D)奇异值分解
237.[单选题]AlphaGo使用。彻底解决了围棋游戏搜索空间巨大的问题
A)深度神经网络和蒙特卡罗树搜索
B)狂暴算力和穷举法
C)总结新的围棋范式
D)收集大量棋局数据
238.[单选题]下列不属于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考复习修辞手法与语言表达
- 中考语文复习考点拉长集中时间
- 中考复习语文表达的社会意义
- 中考复习形容词和量词的用法
- 2024年手术器械制造项目资金筹措计划书
- 现代电气控制及PLC应用技术
- 《关于禁止组织有偿补课及违规收受礼金礼品的管理制度》
- 2024年大规格石英玻璃扩散管项目建议书
- 2024年工程地震观测设备合作协议书
- 2024年地热用耐热潜水电泵合作协议书
- 应征入伍报名登记表
- 校长经济责任审计述职报告.
- 《经济学基础》课程标准
- 五原县第五中学科普小组组织机构
- 教学综合楼脚手架施工方案
- TCQ-B型油罐全自动切水器说明书
- 小学美术新课程标准(全人教版)
- 血管活性药物的应用和护理
- 《电工技术》电子教案.ppt
- 产品研发流程图
- GB 2099.2-2012 家用和类似用途插头插座 器具插座的特殊要求
评论
0/150
提交评论