数据分析及应用习题库(含答案)_第1页
数据分析及应用习题库(含答案)_第2页
数据分析及应用习题库(含答案)_第3页
数据分析及应用习题库(含答案)_第4页
数据分析及应用习题库(含答案)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析及应用习题库(含答案)

一、单选题(共40题,每题1分,共40分)

1、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构

成新的序列

A、Alambda

Bmap

C、Cfilter

D、Dzip

正确答案:B

2、python语言open函数默认以()方式打开文件。

A、A读写

B、B只写

C、C只读

D、D追加

正确答案:C

3、允许多个联机用户同时使用一台计算机系统进行计算的操作系统属于

A、A分时操作系统

B、B实时操作系统

C、C批处理操作系统

D、D分布式操作系统

正确答案:A

4、小明连续投掷骰子,首次投出6点的次数期望值为(?)。

A、A3

B、B4

C、C3.5

D、D6

正确答案:D

5、python源程序执行的方式

A、A编译执行

B、B解析执行

C、C直接执行

D、D边编译边执行

正确答案:B

6、matpltlib中绘制图形,可以通过传递参数设置当前绘图区的标题及位

置。若标题是〃〃s〃〃,以下设置绘图区标题写法对的是:()

A、A[[012][345]]

B、B[[015][234]]

C、C[[234][015]]

D、D[012345]

正确答案:C

7、一个问题可用动态规划算法求解的关键特征是问题的()

A、A其他三项都不时

B、BC(C#,Cn,P#)

C、CSC(S#,C#,G)

D、DS(S#,Sn,Sd,De,Sa)

正确答案:D

8、pow(2,2,3)返回值为()o

A、A64

B、B64.0

C、C1

D、D1.0

正确答案:C

9、np.arange(2,11,3)的数组长度为()。

A、A9

B、B10

C、C3

I)、D4

正确答案:C

10、下列关于栈的叙述正确的是。

A、A栈按先进先出〃组织数据〃

B、B栈按先进后出〃组织数据〃

C、C只能在栈底插入数据

D、D不能删除数据

正确答案:B

11>下列选项中,不属于groupbyO方法分组方式的是

A、A[[234][789]]

B、B[[123][678]]

C、C[234789]

D.D[123678]

正确答案:A

12、以下哪些选项为真?

A、AO(log(n))

B、B0(n)

C、CO(nlog(n))

D、D0(rT2)

正确答案:B

13、在绘制图形是需要使用()对x轴数据范围进行限制。

A^Axlim()

Bxticke()

C^Clegend()

DNDshow()

正确答案:A

14、循环队列的存储空间为Q(l:50)。经过一系列正常的入队与退队操作

后,front=rear=25。后又成功地将一个元素入队,此时队列中的元素个

数为o

A、A50

B、B1

C、C26

D、D2

正确答案:B

15、以下两种描述分别对应哪两种时分类算法的评价标准?()(a)警察

抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例

的小偷给警察抓了的标准。

A^APrecision,Recall

B、BRecall,Precision

C、CPrecision,ROC

D^DRecall,ROC

正确答案:A

16、如果某系统12*5=61成立,则系统采用的是()进制

A、A7

B、B8

C、C9

D、D10

正确答案:C

17、在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方

法是:()

A、A有放回的简单随机抽样

B、B无放回的简单随机抽样

C、C分层抽样

D、D渐进抽样

正确答案:D

18、下列选项中,正确定义了一个字典的是

A^Anp.save(data_txt.txt,datal,fmt=%d)

B、Bdatal=np.load(data_txt.txt)

C>Cnp.savotxt(datatxt.txt,datal,fmt=%d)

D、Ddatal=np.loadtxt(data_txt.txt)

正确答案:D

19、列表奸[1,2,[3,4]],以下运算结果为True的是

A、Alen(a)==3

B、Blen(a)==4

C、Clength(a)二二3

D、Dlength(a)==4

正确答案:A

20、定义学生关系模式如下:

Student(S#,Sn,Ssex,class,monitors#)(其属性分别为学号、学生名、

性别、班级和班长学号),则该关系的主键是O

A、AS#

B、B(S#,class)

C、C(S#,monitors#)

Dmonitors#

正确答案:A

21、下面属于良好程序设计风格的是。

A、A源程序文档化

B、B程序效率第一

C、C随意使用无条件转移语句

D、D程序输入输出的随意性

正确答案:A

22、关于链表,正确的是()

A、A无需实现估计空间

B、B支持随机访问

C、C增删不必挪动元素

D、D所需空间与线性表长度成正比,并且地址连续

正确答案:C

23、以下不能作为字典得key得是哪一个选项?

A、A嵌入

B、B过滤

C、C包装

D、D抽样

正确答案:D

24、模糊判决可以采用不同的方法,其中包括重心法、最大隶属度方法、

加权平均法。若得到的模糊输出为F=0.1/2+0.9/3+0.3/7+0.4/9,

当采用最大隶属度方法时,应该取结论为()。

A、A3

B、B7

C、C9

D、D2

正确答案:A

25、x=np.aranged,10,1).reshape([3,3])

y=np.arange(10,19,1).reshape(3,3)np.r[x,y].shape==()

A、A(6,3)

B、B(3,6)

C、C(3,3)

D、D(6,6)

正确答案:A

26、以下哪个不是python的关键字

A、A.python

B、Bpy

C、Cpt

D、Dpg

正确答案:B

27>np.vstack(a,b)和np.hstack(a,b)分别表示(?)。

A、A数组水平叠加、数组垂直叠加

B、B数组垂直叠加、数组水平叠加

C、C数组a,b向量化为一维数组后垂直叠加、数组a,b向量化为一维数

组后水平叠加

D、D数组a,b向量化为一维数组后水平叠加、数组a,b向量化为一维数

组后垂直叠加

正确答案:B

28、下面代码的输出结果是()df=pd.DataFrame({/z,,A,,z,:[12,4,

5,44,1],2,54,3,2],〃〃C〃〃:[20,16,7,3,8],

3,17,2,6]})print(df.median(axis=l))

A.A013.013.5212.033.044.0

B、BA5.0B3.0C8.0D6.0

C.CA13.2B13.2C10.8D8.4

DsD012.7516.25220.75313.0044.25

正确答案:A

29、大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行

采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()

A、A新一代技术平台

B、B新一代信息技大和服务业态

C、C新一代服务业态.

D、D新一代信息技犬

正确答案:B

30、建立表示学生选修课程活动的实体联系模型,其中的两个实体分别

是。

A、A学生和课程

B、B课程和课程号

C、C学生和学号

D、D课程和成绩

正确答案:A

31、对jieba.cut(s)函数分词功能描述对的是0

AsA0

B、B6

C、C7

D、D8

正确答案:B

32、以下代码执行的结果为:()arr=np.array([[3,2,4],[5,0,

1]])print(np.sort(arr))

A、A[[012][345]]

B、B[[015][234]]

C、C[[234][015]]

D、D[012345]

正确答案:C

33、Python使用函数()接收用输入的数据

A、Aaccept()

B、Binput()

C>Croadlinc()

D、Dprint()

正确答案:B

34、数据清洗的方法不包括()

A、ASeries是一个类似于二维数组的对象

B、BSeries由一组数据和与之相关的索引两部分构成

C、CSeries只能保存整数和字符串类型的数据

D、DSeries的索引默认是从1开始

正确答案:B

35、下面描述错误的是o

A、A类中包含数据(属性)和方法(或操作)

B、B类是对象的实例

C、C类中包含对数据的操作(方法)

D、D类具有抽象性

正确答案:B

36、若实体A和B是一对多的联系,实体B和C是一对一的联系,则实

体A和C的联系是o

A、A一对一

B、B一对多

C、C多对一

D、D多对多

正确答案:B

37、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度

为。

A、A4

B、B3

C、C2

D、D不确定

正确答案:A

38、执行以下代码,x和arr分别是:()importnumpyasnparr=

np.array([1,2,3,4,5])x=arr.view()arr[4]=10

A、Ax=[l,2,3,4,5];arr=[l,2,3,4,10]

B、Bx=[l,2,3,4,10];arr=[l,2,3,4,10]

C^Cx=[l,2,3,10,5];arr=[l,2,3,10,5]

D、Dx=[l,2,3,4,5];arr=[l,2,3,10,5]

正确答案:B

39、求最短路径的FLOYD算法的时间复杂度为()

A、A0(n)

B、B0(n+e)

C、C0(1/2)

D、D0(if3)

正确答案:D

40、对于DataFramo对象,以下说法错误的是

A、A[1101215]

B、B[1512101]

C、C[[101][1215]]

D、D[[1215][110]]

正确答案:A

二、多选题(共30题,每题1分,共30分)

1>Jupyternotebook中运行单元格的方法有哪几种?()纠错收藏

A^AEnter

B、BShift+Enter

C、CCtrl+Enter

D、DF5

正确答案:BCD

2、下列哪些属于算法的复杂度

A、A时间复杂度

B、B空间复杂度

C、C对数复杂度

D、D指数复杂度

正确答案:ABC

3、下而叙述错误的是()

A、A算法的执行效或与数据的存储结构无关

B、B算法的空间复杂度是指算法程序中指令(或语句)的条数

C、C算法的有穷性是指算法必须能在执行有限个步骤之后终止

D、D以上三种描述都不对

正确答案:ABD

4、Numpy中不能统计数组元素个数的方法是()

A、Andim

B、Bshape

C^Csize

D>Ditemsize

正确答案:ABC

5、人工智能研究的对象是()纠错收藏

A、A人

B、B机器

C、C计算机

D、D阿尔法狗

正确答案:AB

6、下列关于apply方法说法不正确的是()。纠错收臧

A、Aapply方法是本DataFrame每一个元素应用某个函数的方法

Bapply方法能够实现所有aggregate方法的功能

C、Capply方法和map方法都能够进行聚合操作

D、Dapply方法只能够对行列进行操作

正确答案:ABC

7、下列参数中调整后不能显示中文的是()。

A、Alines,linestyle

B、Blines,linewidth

C、Cfont,sans-serif

D、Daxes,unicodeminus

正确答案:ABD

8、Numpy库中生成泊松分布的随机数组,1行10个元素,不正确的代码

是:()

A、Ax=random,multinomial(n=10,pvals=[l/6,1/6,1/6,1/6,

1/6,1/6])

B、Bx=random.poisson(lam=3,size=10)

C、Cx=random.chisquare(df=2,size=10))

Dx=random.logistic(loc=l,scale=2,size=10)

正确答案:ACD

9、Jupyternotebook中运行单元格的方法有哪几种?()

A、AEnter

B、BShift+Enter

C>CCtrl+Entcr

D、DF5

正确答案:BCD

10、UNIX/Linux系统中的Apache服务器的主要安全缺陷表现在攻击者

可以O纠错收藏

A、A利用HTTP协议进行的拒绝服务攻击

B、B发动缓冲区溢H攻击

C、C获得root权限

D、D利用MDAC组件存在一个漏洞,可以导致攻击者远程执行目标系统

的命令

正确答案:ABC

11、下面对count(),index(),find()方法描述错误的是()

纠错收藏

A、Acount()方法用于统计字符串里某个字符出现的次数

B、Bfind()方法检测字符串中是否包含子字符串str如果包含子

字符串返回开始的索引值,否则会报一个异常

C、Cindex()方法检测字符串中是否包含子字符串str,如果str

不在返回T

D、D以上都错误

正确答案:BC

12、下列关于模型评价与优化的说法错误的是()

A、A模型构建完成就可以使用

B、B模型评价的目的是为了确认模型的有效性

C、C模型评价结果良好,模型一定可用,不需要重构

D、D所有的模型评价方法相同

正确答案:ACD

13、使用python语言编程时可以通过(?)添加注释。

A、Aooo

B、B#

C、C//

D^D/*…*/

正确答案:AB

14、以下属于梯度下降的是()纠错收藏

A、ABGD

B、BSGD

C^CMini-Batch

D、Ddropout

正确答案:ABC

15、关于Python字符串,下列说法正确的是?()

A、APython字符串属于不可变类型

B、BPython字符串属于Python序列类型

C、CPython字符串索引不能为负

D、DPython字符串支持切片操作

正确答案:ABD

16、Numpy库中生成瑞利分布的随机数组,2行3歹lj,以下代码不正确的

是:()

AsAx=random,normal(size=(2,3))

Bx=random.zipf(a=2,size=(2,3))

C、Cx=random.chisquare(df=2,size=(2,3))

Dx=random,rayleigh(scale=2,size=(2,3))

正确答案:ABCD

17、以下是正确的字符串()纠错收藏

A、A'abc”ab”

B、B'abc"ab'

C、C“abc”ab”

D、D“abc\"ab”

正确答案:BD

18、Numpy库中生成帕累托分布的随机数组,2行3歹U,以下代码不王确

的是:()纠错收藏

A、Ax=random.pareto(a=2,size=(2,3))

B>Bx=random,uniform(size=(2,3))

C、Cx=random.chisquare(df=2,size=(2,3))

D、Dx=random.rayleigh(scale=2,size=(2,3))

正确答案:BCD

19、下列说法正确的是()纠错收藏

A、Aunion用于计算索引的交集

B、Bisin用于数据是否包含在其中

C、Cinsert函数可以插入索引

D、Duniquo用于计算索引中的唯一数组

正确答案:ACD

20、下列属于Anaconda主要特点的是()纠错收藏

A、A包含了众多流行的科学、数学、工程、数据分析的Python包

B、B完全开源和免费

C、C支持Python2.6、2.7、3.4、3.5、3.6,可自由切换

D、D额外的加速和优化是免费的

正确答案:ABC

21、下列选项中,人工智能的基础实现有?纠错收藏

A、A机器学习

B、B深度学习

C、CBP神经网络

D、D卷积神经网络

正确答案:ABCD

22、传统机器学习的应用领域有()。

A、A信用风险检测

B、B销售预测

C、C语音合成

D、D商品推荐

正确答案:ABD

23、Pandas函数包含下面那几种?

A^AMemoryusage

B、BInfer_objects

C、CExplode

D、DMelt

正确答案:ABCD

24、衡量一个算法好坏的标准不包含()

A、A运行速度快

B、B占用空间少

C、C时间复杂度低

D、D代码短

正确答案:ABD

25、以下不属于Python循环结构的是()纠错收藏

A、Aif

BNBloop

C、Cdo...for

DsDwhi1e

正确答案:ABC

26、下面对count(),index(),find()方法描述错误的是()

A、Acount()方法用于统计字符串里某个字符出现的次数

B、Bfind()方法检测字符串中是否包含子字符串str如果包含子

字符串返回开始的索引值,否则会报一个异常

C、Cindex()方法检测字符串中是否包含子字符串str,如果str

不在返回T

IKD以上都错误

正确答案:BC

27、以下说法正确的是():

A、A实例方法只能月实例来调用

B、B类方法用实例和类都可以调用

C、C静态方法只能月类来调用

D、D静态方法用实例和类都可以调用

正确答案:BD

28、下列关于apply方法说法不正确的是()。

A、Aapply方法是末*DataFrame每一个元素应用某个函数的方法

B、Bapply方法能够实现所有aggregate方法的功能

C^Capply方法和map方法都能够进行聚合操作

D、Dapply方法只能够对行列进行操作

正确答案:ABC

29、Numpy库中生成正态分布的随机数组,2行3歹U,以下代码不正确的

是:()

AsAx=random,normal(size=(2,3))

B、Bx=random,exponential(scale=2,size=(2,3))

C、Cx二random,uniform(size=(2,3))

D、Dx=random.rayleigh(scale=2,size=(2,3))

正确答案:BCD

30、下列关于数据分析流程的说法正确的是()纠错收藏

A、A需求分析是数据分析最重要的一部分

B、B数据预处理是能够建模的前提

C、C分析与建模时只能够使用数值型数据

D、D模型评价能够评价模型的优劣

正确答案:ABD

三、判断题(共20题,每题1分,共20分)

1、pandassort_index()函数根据index的值进行排序,如果是按行排

序,可以认为是根据index的值排序,如果是按列排序,可以认为是根

据columns的值进行排序

A、正确

B、错误

正确答案:A

2、文本文件对象的read。方法将返回文本文件的首行(?)。

A、正确

B、错误

正确答案:B

3、函数中的return语句一定能够得到执行。

A、正确

B、错误

正确答案:B

4、算法(Algorithm)是指解题方案的准确而完整的描述

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论