数据分析技术习题(含参考答案)_第1页
数据分析技术习题(含参考答案)_第2页
数据分析技术习题(含参考答案)_第3页
数据分析技术习题(含参考答案)_第4页
数据分析技术习题(含参考答案)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析技术习题(含参考答案)一、单选题(共90题,每题1分,共90分)1.关于哑变量的说法中,下列选项描述错误的是()。A、哑变量是人为虚设的变量B、哑变量在转换成指标矩阵后,其值通常为0或1C、Pnadas中get_dummies()函数可以对类别进行哑变量处理D、哑变量的使用没有实际意义正确答案:D2.当使用resample()方法重新采样时,下列哪个参数可以确定采样的闭合区间?()A、closedB、fill_methodC、labelD、how正确答案:A3.下列选项中,用于绘制单变量分布的函数是()。A、displot()B、joinplot()C、pairplot()D、boxplot()正确答案:A4.下列选项中,用来表示时间序列中的频率为每小时的是(),A、SB、BC、DD、H正确答案:D5.下列pyplot模块的函数中,可以绘制散点图的是()。A、scatter()B、bar()C、hist()D、pie()正确答案:A6.下列选项中,用来表示时间序列中的频率为每周六的是(),A、WOM-2MONB、W-FRIC、W-SUND、W-SAT正确答案:D7.在创建Figure对象时,可以指定哪个参数来给画布添加背景颜色?()A、dpiB、numC、figsizeD、facecolor正确答案:D8.关于时间序列的移动,下列说法错误的是()。A、时间序列移动后,索引也会发生变化B、数据移动后会出现边界情况C、移动是指沿着时间轴方向将数据进行前移或后移D、无论时间序列的数据怎么移动,索引是不会发生任何变化的正确答案:A9.下列函数中,可以用于创建等差数组的函数是()。A、ones()B、empty()C、zeros()D、arange()正确答案:D10.在创建ndarray对象时,可以使用()参数来指定元素类型。A、typeB、typesC、dtypesD、dtype正确答案:D11.通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定终止日期?()A、freqB、periodsC、endD、start正确答案:C12.下列函数中,用于保存当前生成的图表的是()。A、savefig()B、hist()C、figure()D、show()正确答案:A13.关于agg()方法的用法中,下列描述错误的是()。A、可以对一列数据应用不同的函数B、每列的数据只能使用相同的函数C、可以对不同的列使用不同的函数D、可以对每列数据应用同一个函数正确答案:B14.Matplotlib主要是用哪种语言编写的?()A、PythonB、javaC、C++D、C正确答案:A15.关于Pandas中数据排序,下列说法正确的是()。A、默认情况下,sort_index()方法按照降序排列B、如果Web容器找不到欢迎文件则报404错误C、sort_values()方法表示按照索引进行排序D、即可以按照行索引排序,也可以按照列索引排序E、sort_index()方法表示按照值进行排序正确答案:D16.下列函数中,用于计算整数的绝对值的是()。A、square()B、sqrt()C、abs()D、floor()E、Abstract正确答案:C17.下列图表中,可以清晰地反映出数据变化趋势的是()。A、饼图B、散点图C、折线图D、直方图正确答案:C18.下列选项中,不属于groupby()方法分组方式的是()。A、列表或数组B、DataFrame中某列的名称C、字典或SeriesD、集合正确答案:D19.请看如下代码:importnumpyasnparr=np.array([[6,2,7],[3,6,2],[4,3,2]]arr.sort()arr对代码中的NumPy数组执行sort()方法结果正确的是()。A、[[762][632]]B、[[267][632]]C、[[267][236]]D、[[762][236]]正确答案:C20.关于数据分析的说法,下列描述错误的是()。A、数据分析可以通过计算机工具和数学知识处理数据B、可以做出具有针对性的决策C、数据分析没有实际的使用意义D、在大数据环境下,数据分析能够挖掘出更有价值的信息正确答案:C21.关于预处理的说法中,下列选项中描述不正确是()。A、concat()函数可以沿着一条轴将多个对象进行堆叠B、merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、可以使用rename()方法对索引进行重命名操作D、unstack()方法可以将列索引旋转为行索引正确答案:D22.下列图表中,能够识别异常值的是()。A、饼图B、箱形图C、折线图D、散点图正确答案:B23.下列的数组统计计算中,用于计算数组中最大值的方法是()。A、maximumB、minC、maxD、maximal正确答案:C24.通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期,则还需要用()参数指定产生多少个时间戳。A、freqB、endC、periodsD、start正确答案:C25.请阅读下面一段程序:roll_window=ser_obj.rolling(window=10)有关上述程序,下面描述错误的是()。A、roll_window是一个Period类对象B、窗口的大小为10C、窗口的标签为非居中D、默认对一列的数据进行计算正确答案:A26.下列选项中,关于fillna()方法描述正确的是()。A、fillna()方法可以填充替换值为NaN和None的数据B、fillna()方法只能填充替换值为NaN的数据C、只支持前向填充方式D、默认可支持填充的最大数量为1正确答案:A27.请阅读下面一段程序:importnumpyasnpnp.arange(1,10,3)运行程序,最终执行的结果是()。A、array([1,4,7])B、array([3,6,9])C、array([1,4,7,10])D、array([2,5,8])正确答案:A28.在创建Figure对象时,可以指定哪个参数来设置画布的尺寸?()A、dpiB、numC、facecolorD、figsize正确答案:D29.关于ndarray对象属性,下列描述错误的是()。A、dtype属性表示数组中元素类型的对象B、ndim属性表示数组轴的个数C、shape属性表示每个维度上数组的大小D、size属性表示数组元素的总个数,等于shape属性元组元素的和正确答案:D30.关于分组聚合过程的说法中,下列描述不正确的是()。A、合并是指将产生的新值整合到结果对象中B、只能对纵轴方向上的数据进行分组C、应用是指将某个函数或方法应用到每个分组D、拆分是指将数据集按照一些标准拆分为若干个组正确答案:B31.下列函数中,可以为图表设置标题的是()。A、title()B、xlim()C、legend()D、xlabel()正确答案:A32.下列选项中,()是基于Web的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程。A、JupyterNotebookB、AncondaNavigatorC、AncondaPromptD、Spyder正确答案:A33.请阅读下面一段程序:importpandasaspdprint(pd.DataFrame([[2,3],]*3,columns=['A','B']).apply(lambdax:x+1))执行上述程序后,最终输出的结果为()。A、AB032132232B、AB023123223C、AB034134234D、AB043143243正确答案:D34.下列方法中,用来创建一个滑动窗口的是()。A、rolling()B、asfreq()C、shift()D、resample()正确答案:A35.关于异常值的说法,下列选项中描述错误的是()。A、异常值是指样本中明显偏离其余观测值的个别值B、可以使用3σ原则检测异常值C、可以使用Pandas中的箱线图检测异常值D、异常值可以使用其它的值来替换正确答案:A36.关于Series结构,下列描述正确的是()。A、Series是一个类似于二维数组的对象B、Series由一组数据和与之相关的索引两部分构成C、Series只能保存整数和字符串类型的数据D、Series的索引默认是从1开始正确答案:B37.在NumPy通用函数中,用于计算元素级最大值的函数是()。A、minB、maxC、maximalD、maximum正确答案:D38.通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定产生多少个时间戳索引值?()A、freqB、periodsC、endD、start正确答案:B39.已知,有如下一个二维数组:arr2d=np.array([[1,2,3],[4,5,6],[7,8,9]])如果希望获取元素5,则可以使用()实现。A、arr2d[1,1]B、arr2d[1,0]C、arr2d[2]D、隔离性E、arr2d[1]正确答案:A40.下列pyplot模块的函数中,可以绘制直方图的是()。A、bar()B、scatter()C、pie()D、hist()正确答案:D41.下列关于groupby()方法的说法中,描述正确的是()。A、用于将数据集实现分组与聚合操作B、调用groupby()方法返回一个DataFrameBy对象C、调用groupby()方法返回一个GroupBy对象D、groupby()方法只能将数据集按照纵轴方向进行分组正确答案:C42.下列选项中,不能创建一个Series对象的是()。A、ser_obj=pd.Series((1,2,3,4))B、ser_obj=pd.Series([1,2,3,4,5])C、ser_obj=pd.Series({2001:17.8,2002:20.1,2003:16.5})D、ser_obj=pd.Series(1,2)正确答案:D43.请阅读下列一段示例程序:arr2d=np.array([[11,20,5],[21,15,26],[17,8,19]])arr2d[0:2,0:2]运行上述程序,它最终执行的结果为()。A、array([21,15])B、array([11,21])C、array([[11,20],[21,15]])D、array([11,20])正确答案:C44.下列关于ndarray对象描述正确的是()。A、ndarray对象中存储元素的类型必须是相同的B、ndarray对象不支持广播操作C、ndarray对象中可以存储不同类型的元素D、ndarray对象不具备矢量运算能力正确答案:A45.下列函数中,可以为图表设置图例的是()。A、xlim()B、legend()C、xlabel()D、title()正确答案:B46.通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定起始日期?()A、freqB、periodsC、endD、start正确答案:D47.下列选项中,不属于ndarray对象属性的是()。A、shapeB、ndimC、mapD、dtype正确答案:C48.关于Anconda组件的说法中,下列描述错误的是()。A、AnacondaPrompt是Anaconda自带的命令行B、JupyterNotebook是基于客户端的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程C、Spyder是一个使用Python语言、跨平台的、科学运算集成开发环境D、AnacondaNavigator是用于管理工具包和环境的图形用户界面,后续涉及的众多管理命令也可以在Navigator中手动实现正确答案:B49.请阅读下面一段程序:period=pd.Period(""2011-01"")other_period=pd.Period(""2012/06"")print(period-other_period)运行上述程序,它最终输出的结果为()。A、18B、17C、-17D、-18正确答案:C50.创建DatetimeIndex对象的代码如下:pd.date_range(start='2018/2/1',end='2018/2/28',freq=________)如果希望生成的时间戳为每周日,则下列选项中可以填写到横线处的是()。A、WOM-2MONB、W-FRIC、W-SUND、W-SAT正确答案:C51.请阅读下面一段程序:period=pd.Period(2010)print(period+5)运行上述程序,它最终输出的结果为()。A、2013B、2014C、2012D、2015正确答案:D52.关于数据重塑的说法中,下列选项描述错误的是()。A、数据重塑可以将DataFrame转换为SeriesB、stack()方法可以将列索引转换为行索引C、对一个DataFrame使用stack()方法后返回的一定是一个SeriesD、unstack()方法可以将行索引转换为列索引正确答案:C53.请阅读下面一段程序:importpandasaspddf_obj=pd.DataFrame([[4,-1,-3,0],[2,6,-1,-7],[8,6,-5,1]])print(df_obj.sort_values(by=1))执行上述程序后,最终输出的结果为()。A、012304-1-30126-1-7286-51B、012304-1-30126-1-7286-51C、0123286-51126-1-704-1-30D、321000-3-141-7-16221-568正确答案:B54.下列关于ndarray对象索引的描述错误的是()。A、花式索引是将整数数组或列表进行索引,然后将数组或列表中的每个元素作为下标进行取值B、ndarray对象中的元素可以通过索引和切片来访问和修改C、布尔索引是将一个布尔数组做为数组索引,返回的数据是布尔数组中True对应位置的值D、ndarray对象的多维数组索引和切片的使用方式与列表的使用方式完全相同正确答案:D55.关于创建ndarray对象。下列描述错误的是()。A、通过zeros()函数创建元素值都是0的数组B、使用list()函数可以创建一个ndarray对象C、通过ones()函数创建元素值都为1的数组D、ndarray对象可以使用array()函数创建正确答案:B56.下列函数中,用于沿着轴方向堆叠Pandas对象的是()。A、merge()B、combine_first()C、concat()D、join()正确答案:C57.关于agg()方法的使用中,下列描述错误的是()。A、agg()方法不能对产生的标量值进行广播B、agg()方法中func参数只能传入一个函数C、agg()方法中func参数可以传入多个函数D、agg()方法中func参数可以传入自定义函数正确答案:B58.下列pyplot模块的函数中,可以绘制饼图的是()。A、pie()B、bar()C、scatter()D、hist()正确答案:A59.下列图表中,适用于比较跨类别数据的是()。A、散点图B、直方图C、折线图D、饼图正确答案:A60.关于Matplotlib的说法中,下列描述正确的是()。A、Matplotlib是一个Python3D绘图库B、它使用简单,仅用几行代码就能生成各种图表C、仅仅适用于IPython平台D、只能输出PNG或PDF格式正确答案:B61.创建一个DatetimeIndex对象的代码如下:pd.date_range('2018/08/10','2018/08/15')默认情况下,该对象中时间戳的频率为()。A、HB、DC、SD、T正确答案:B62.下列图表中,可以清晰地反映出各数据系列的百分比情况的是()。A、散点图B、折线图C、饼图D、直方图正确答案:C63.下列选项中,关于drop_duplicates()方法描述错误的是()。A、仅支持单一特征数据的去重B、仅对Series和DataFrame对象有效C、数据去重时默认保留第一个数据D、该方法不会改变原始数据排列正确答案:A64.下列关于Pandas库的说法中正确的是()。A、Pandas中只有两种数据结构B、Pandas不支持读取文本数据C、Pandas是在NumPy基础上建立的新程序库D、Pandas中Series和DataFrame可以解决数据分析中一切的问题正确答案:C65.请阅读下面的程序:frompandasimportSeriesimportpandasaspdfromnumpyimportNaNseries_obj=Series([2,1,NaN])print(pd.isnull(series_obj))执行上述程序后,最终输出的结果为()。A、0True1True2FalseB、0True1True2TrueC、0False1False2FalseD、0False1False2True正确答案:D66.关于Anaconda的组件中,可以编辑文档且展示数据分析过程的是()。A、AnacondaNavigatorB、AnacondaPromptC、SpyderD、JupyterNotebook正确答案:D67.下列pyplot模块的函数中,可以绘制条形图的是()。A、bar()B、hist()C、scatter()D、pie()正确答案:A68.通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数来改变计时单位?()A、freqB、periodsC、endD、start正确答案:A69.下列关于数据预处理的说法中,描述不正确的是()。A、数据清洗的目的是为了提高数据质量B、异常值不一定要删除C、通过drop_duplicates()方法可以删除重复数据D、concat()函数可以根据一个或多个键将不同的DataFrame进行合并正确答案:D70.关于apply()方法的说法中,下列描述正确的是()。A、apply()方法是对DataFrameB、apply()方法能够实现所有agg方法的功能C、apply()方法和map方法都能够进聚合操作D、apply()方法只能够对行列进行操作正确答案:A71.请阅读下面一段程序:importpandasaspdser_obj=pd.Series([1,2,3,],index=['c','d','a'])ser_obj2=ser_obj.reindex(['a','b','c','d'])print(ser_obj2)执行上述程序后,最终的结果为()。A、aNaNb1.0c2.0d3.0B、a1.0b2.0c3.0dNaNC、a3.0bNaNc1.0d2.0D、c1.0d2.0a3.0正确答案:C72.下列方法中,能够对常规时间序列数据重新采样的是()。A、resample()B、shift()C、asfreq()D、rolling()正确答案:A73.下列选项中,关于dropna()方法描述正确的是()。A、dropna()方法只会检测缺失数据和空值B、dropna()方法只会删除值为NaN的数据C、dropna()方法不会删除值为None的数据D、dropna()方法会删除值为None和NaN的数据正确答案:D74.下列关于Bokeh库描述不正确的是()。A、针对浏览器使用的交互式可视化库B、提供优雅、简洁的通用图形构建C、不适用于大量的数据集D、能够快速地、轻松地创建交互图正确答案:C75.下列函数中,可以设置当前图形x轴范围的是()。A、legend()B、xlabel()C、xlim()D、title()正确答案:C76.下列选项中,用来表示矢量化三元表达式的是()。A、where()B、unique()C、cumsum()D、sort()正确答案:A77.下列方法中,能够转换时期频率的是()。A、resample()B、rolling()C、asfreq()D、shift()正确答案:C78.下列选项中,用于绘制双变量分布的函数是()A、joinplot()B、pairplot()C、displot()D、boxplot()正确答案:A79.关于Pandas数据读写的说法中,下列描述错误的是()。A、read_csv()能够读取所有文本数据B、read_sql()可以读取数据库中的数据C、to_csv()能够将结构化数据写入到csv文件中D、to_excel()能够将结构化数据写入到excel文件中正确答案:A80.关于transform()方法的说法中,下列描述错误的是()。A、transform()方法可以使用广播B、使用transform()方法可以返回一个与分组大小相等的数组C、transform()方法只能使用内置方法对数据进行转换操作D、transform()方法对DataFrame和Series都适用正确答案:C81.关于groupby()方法的返回值,下列说法错误的是()。A、groupby()方法返回的是一个GroupBy对象B、返回的GroupBy对象采用的是惰性计算C、使用for循环可以遍历该对象中的分组信息D、groupby()方法没有返回值正确答案:D82.下列方法中,可以将元组转换为MultiIndex对象的是()。A、from_tuples()B、from_arrays()C、from_product()D、from_list()正确答案:A83.下列选项中,可以一次性创建多个子图的是()。A、figure()B、subplot()C、add_subplot()D、subplots()正确答案:D84.请阅读下列一段程序:arr=np.arange(12).reshape(3,4)arr.shape运行上述程序,它最终执行的结果为()。A、(1,2)B、4C、(3,4)D、3正确答案:C85.下列函数中,用于计算对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论