




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、 填空题1、已知vec = 1,2, 3,4,则表达式 rowi for row in vec for i in range(len(vec0) 的值为_。2、已知 x = list(range(10),则表达式 x-4: 的值为_。3、已知 path = rc:test.html,那么表达式 path:-4+htm 的值为_。4、已知 x = 3, 5, 7,那么执行语句 x1: = 2之后,x的值为_。5、已知 x = 3, 5, 7,那么执行语句 x:3 = 2之后,x的值为_。6、已知x为非空列表,那么执行语句y = x:之后,id(x0) = id(y0)的值为_。7、已知 x = 1, 2, 3, 2, 3,执行语句x.remove(2) 之后,x的值为_。8、表达式 3 1 的值为_。10、表达式chr(ord(a)32) 的值为_。11、表达式chr(ord(a)-32) 的值为_。12、表达式 abs(3+4j) 的值为_。13、表达式 callable(int) 的值为_。14、表达式 list(str(1,2,3) = 1,2,3 的值为_。15、表达式str(1, 2, 3) 的值为_。16、已知 x = 123 和 y = 456,那么表达式 x + y 的值为_。17、已知 x = a234b123c,并且re模块已导入,则表达式re.split(d+, x) 的值为_。18、已知 x = 3, 5, 7,那么执行语句 x:3 = 2之后,x的值为_。19、表达式 Hello world.lower().upper() 的值为_。20、表达式 abcab.strip(ab) 的值为_。21、表达式 str(i) for i in range(3) 的值为_。22、表达式 abc.txt.endswith(.txt, .doc, .jpg) 的值为_。23、表达式 list(filter(None, 0,1,2,3,0,0) 的值为_。24、表达式 list(filter(lambda x:x2, 0,1,2,3,0,0) 的值为_。25、表达式 list(range(50, 60, 3) 的值为_。26、表达式 list(filter(lambda x: x%2=0, range(10) 的值为_。27、表达式 list(filter(lambda x: len(x)3, a, b, abcd) 的值为_。28、Python使用_关键字来定义类。29、表达式 isinstance(abc, str) 的值为_。30、表达式 isinstance(abc, int) 的值为_。31、表达式 isinstance(4j, (int, float, complex) 的值为_。32、表达式 isinstance(4, (int, float, complex) 的值为_。33、代码 print(1,2,3,sep=:) 的执行结果为_。34、代码 for i in range(3):print(i, end=,) 的执行结果为_。35、表达式 eval(_import_(math).sqrt(9) 的值为_。36、表达式 eval(_import_(math).sqrt(3*2+4*2) 的值为_。37、表达式 eval(3+5) 的值为_8_。38、大数据最具潜能的三大应用领域分别为 商业智能 、 公共服务 和 市场营销 。39、HDFS对元数据和实际数据采取分别存储的方法,元数据存储在 Namenode ,实际数据储存在 Datanode 。40、列表、元组、字符串是Python的_有序_(有序?无序)序列。41、写出range(2,10,2)的值 2,4,6,8 。42、数据仓库的主要特征是 面向主题 、 集成 时变 、 和 非易失 。参考答案:1、1, 3, 2, 4 2、6, 7, 8, 9 3、c:test.htm 4、3, 2 5、2 6、True7、1, 3, 2, 3 8、12 9、32 10、A 11、A 12、5.0 13、True 14、False15、1, 2, 3 16、123456 17、a,b,c18、 2 19、HELLO WORLD 20、c 21、0, 1, 2 22、True23、1, 2, 3 24、325、50, 53, 56, 59 26、0, 2, 4, 6, 827、abcd28、class29、True30、False31、True32、False33、1:2:334、0,1,2,35、3.036、5.037、838、商业智能 公共服务 市场营销39、Namenode Datanode 40、有序 41、2,4,6,842、面向主题 集成 时变 非易失二、简答题1、叙述大数据的概念,并指明大数据的4V特征。答:大数据是指无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理数据。大数据4V特征为:大量化 多样化 快速化 价值密度低 2、列举身边获取大数据的例子。(1)QQ,微博等社交软件产生的数据 (2)天猫,京东等电子商务产生的数据 (3)互联网上的各种数据 3、简述数据预处理方法和内容。数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。2、简述大数据的数据管理方式。答:对于图像、视频 、URL、地理位置等类型多样的数据,难以用传统的结构化方式描述,因此需要使用由多维表组成的面向列存储的数据管理系统来组织和管理数据。也就是说,将数据按行排序,按列存储,将相同字段的数据作为一个列族来聚合存储。不同的列族对应数据的不同属性,这些属性可以根据需求动态增加,通过这样的分布式实时列式数据库对数据统一进行结构化存储和管理,避免了传统数据存储方式下的关联查询。3、 画出,在上的曲线,如图: 4、画出,在上的曲线,画在三个子图中,如图:三、编程题1、利用给定的数据,创建分裂式饼图。Labels=Nokia,Samsu,Apple,LumiaValues=10,30,45,152、利用fill.between函数填充多边形区域。数据给定为: x = np.arange(0.0, 2, 0.01)y1 = np.sin(np.pi*x)y2 = 1.7*np.sin(4*np.pi*x)3、绘制等值线图。颜色设置先由黑色过渡到红色,再过渡到黄色,最后最大值使用白色。这种彩图中,cmp参数的值为plt.cm.hot。数据为: x=np.arange(-2.0,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民爆企业安全培训课件
- 初中物理会考试卷及答案
- 财务制度考试题目及答案
- 2025年精神科常见心理疾病干预技巧考试答案及解析
- 2025年康复医学康复训练操作规范性考核答案及解析
- 2025年遗传病学科遗传性疾病新基因发现研究综述题答案及解析
- 2025年体育医学运动创伤急救处理流程考核答案及解析
- 2025年神经外科脑血管疾病手术常规操作考察答案及解析
- 2025年康复评定评估系统操作练习试卷答案及解析
- 2025年口腔科常见口腔疾病诊断治疗技能考核模拟考卷答案及解析
- 企业安全生产“百日攻坚”行动实施方案
- 饮料感官评价体系
- 信息技术项目工程概预算评审方案
- 期货入门基础知识解读(共45张课件)
- 中国成人急性淋巴细胞白血病诊断与治疗指南2024
- 农业产业链风险管理
- 第一单元第3课时 长方体和正方体的展开图 (教学课件)-六年级数学上册同步课件(苏教版)
- 血管活性药物静脉输注护理
- 食品安全与质量检测技能大赛考试题库400题(含答案)
- 主要粮食作物机收减损技术-农业农机技术培训课件
- YD-T 2664-2024 公用电信设施保护安全等级要求
评论
0/150
提交评论