[置顶] 大数据处理之道(十分钟学会Python)_第1页
[置顶] 大数据处理之道(十分钟学会Python)_第2页
[置顶] 大数据处理之道(十分钟学会Python)_第3页
[置顶] 大数据处理之道(十分钟学会Python)_第4页
[置顶] 大数据处理之道(十分钟学会Python)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 置顶 大数据处理之道(十分钟学会Python)标签: Python入门大数据处理Python文件处理2014-12-19 11:15 2062人阅读 评论(8) 收藏 举报 分类: 数据挖掘&机器学习(15)  algorithm(19) 版权声明:本文为博主原创文章,未经博主允许不得转载。(0)目录快速学Python 和 易犯错误(文本处理)Python文本处理和Java/C比对十分钟学会Python的基本类型快速学会Python(实战)大数据处理之道(

2、十分钟学会Python)一:python 简介(1)Python的由来Python(英语发音:/pan/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C+)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比 如3D游戏中的图形渲染模块,性能要求特别高,就可以用C+重写。(2)Python

3、 语法简介 - 类型转化int(x ,base )         将x转换为一个整数long(x ,base )        将x转换为一个长整数float(x )               将x转换到一个浮点数complex(real ,imag )  创建一个复数str(x )                 将对象 x 转换为字符串repr(x

4、)                将对象 x 转换为表达式字符串eval(str )              用来计算在字符串中的有效Python表达式,并返回一个对象tuple(s )               将序列 s 转换为一个元组list(s )                将序列

5、s 转换为一个列表chr(x )                 将一个整数转换为一个字符unichr(x )              将一个整数转换为Unicode字符ord(x )                 将一个字符转换为它的整数值hex(x )                

6、; 将一个整数转换为一个十六进制字符串oct(x )             将一个整数转换为一个八进制字符串(3)Python 语法简介 - 类型转化s + r                   序列连接s * n , n * s           s的 n 次拷贝,n为整数s % d             &

7、#160;     字符串格式化(仅字符串)si                    索引si :j                切片x in s , x not in s     从属关系for x in s :            迭代len(s)         &#

8、160;        长度min(s)                  最小元素max(s)                  最大元素si = x               为si重新赋值si :j = r            将列表片段重

9、新赋值del si               删除列表中一个元素del si :j            删除列表中一个片段(4)(3)Python 语法简介 - 类型转化x >> y                  右移x & y                  

10、; 按位与x | y                   按位或x y                   按位异或 (exclusive or)x                      按位翻转x + y              

11、    加x - y                   减x * y                   乘x / y                   常规除x / y                  地板除x

12、* y                  乘方 (xy )x % y                   取模 (x mod y )-x                      改变操作数的符号位+x               

13、0;      什么也不做x                      x=-(x+1)abs(x )                 绝对值divmod(x ,y )           返回 (int(x / y ), x % y )pow(x ,y ,modulo )    返回 (x * y ) x

14、% moduloround(x ,n)           四舍五入,n为小数点位数x < y                   小于x > y                   大于x = y                  等于x != y   &

15、#160;              不等于(与<>相同)x >= y                  大于等于x <= y                  小于等于 二:python应用(1) 文件处理python view plain copy 1. filename =

16、60;raw_input('Enter your file name')  #输入要遍历读取的文件路径及文件名  2. file = open(filename,'r')  3. done = 0  4. while not  done:  5.         aLine =

17、 file.readline()  6.         if(aLine != ''):  7.             print aLine,  8.         else: 

18、0;9.             done = 1  10. file.close()   #关闭文件   解释: .readline() 和 .readlines() 之间的差异是后者一次读取整个文件,.readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for . in . 结构进行处理。另一方面,.readline() 每次只读取一行

19、,通常比 .readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 .readline()。如果Python文件读到了文件尾,则会返回一个空字符串,而如果是读到一个空行的话,则会返回一个nPython的readline()方法,每行最后都会加上一个换行字符n。有时候有的文件最后一行没有以'n'结尾时,不返回n。readlines()方法返回的是一个列表,而readline()返回一个字符串。(2)错误处理Python报错TypeError: 'str' object is not callable当一般内部函数被用作变量名后可能出现此

20、错误。比如:range=1for i in range(0,1):就会报这样的错误这样的错会报在for行,但是时间引起的原因却是在range=1这行,如果两行相距较远,怎很难被发现。所以要特别注意不要用内部已有的变量和函数名作自定义变量名。或者str被预先定义了str=10for i in range(1,10):  print str(i)(3) 综合应用,文件读取,控制台读取,时间转化,编码转换python view plain copy 1. import time  2. from time im

21、port strftime  3. import sys  4. reload(sys)  5. sys.setdefaultencoding('utf8')  6. # -*- coding: cp936 -*-  7. print ("Hello, Python!")  8. #!/usr/bin/python  9. a =&

22、#160;21  10. b = 10  11. c = 0  12.   13. c = a + b  14. print "Line 1 - Value of c is ", c  15.   16. c = a - b

23、60; 17. print "Line 2 - Value of c is ", c   18.   19. c = a * b  20. print "Line 3 - Value of c is ", c   21. 

24、0; 22. c = a / b  23. print "Line 4 - Value of c is ", c   24.   25. c = a % b  26. print "Line 5 - Value of c is&#

25、160;", c  27.   28. a = 2  29. b = 3  30. c = a*b   31. print "Line 6 - Value of c is ", c  32.   33. a = 10  

26、34. b = 5  35. c = a/b   36. print "Line 7 - Value of c is ", c  37. # for repeat its  38. list = 2, 4, 6, 8  39. sum = 

27、0  40. for num in list:  41.     sum = sum + num  42. print("The sum is:", sum)  43. # print and Input, assignment  44. print("Hello, I'

28、m Python!")  45.   46. name = input('What is your name?n')  47. print('Hi, %s.' % name)  48.   49. # test for  50. fruits = 'Banana', 'Ap

29、ple', 'Lime'  51. loud_fruits = fruit.upper() for fruit in fruits  52. print(loud_fruits)  53.   54. # open, write and read file  55. fo = open("./tmp/foo.txt"

30、;,"w+")  56. fo.write("Python is a gerat language.nYeah its great!nI am zhang yapeng, who are you?n")  57. t_str = u'我是张燕鹏,您是什么货色?'  58. print(t_str)  59. fo.writ

31、e(t_str)  60. fo.close()  61.   62. #read and write  63. fr = open("./tmp/foo1.txt","r+")  64. fw = open("foo_rw.txt","wb")  65. done = 0;  66. localt

32、ime = time.asctime(time.localtime(time.time()  67. print "Local current time : ", localtime  68. fw.write(localtime + "n")  69. while not done:  70.     t_str&#

33、160;= fr.readline()  71.     if(t_str != ''):  72.         print "Read String is : ", t_str  73.         fw

34、.write(t_str)  74.     else:  75.         done = 1  76. fr.close()  77. fw.close()  78.   79. # test time (import)  80. localtime = tim

35、e.localtime(time.time()  81. print "Local current time : ", localtime  82. # format the time from time import strftime  83. t_time = strftime( '%Y-%m-%d %H:%M:%S',

36、0;localtime)  84. print "formatting local current time : ", t_time  85. # design the time by yourself  86. year = str(localtime.tm_year)  87. mon = str(localtime.tm_mon)&

37、#160; 88. day = str(localtime.tm_mday)  89. hour = str(localtime.tm_hour)  90. mins = str(localtime.tm_min)  91. sec = str(localtime.tm_sec)  92. newtime = u"时间是: " + year +&#

38、160;"年" + mon + "月" + day + "日 " + hour + ":" + mins + ":" + sec  93. print "Local current time : ", newt

39、ime  (4)运行图:(5) 总结:(1)Python是一门入手非常快的语言,处理大数据的好语言,一些规范非常类似于c+语言,例如语法和一些函数命名,文件的打开和读写,以及读写方式,非常类似于c+(2)正如,开头所写的 “python是胶水语言,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C+重写。”(3)分享一下非常基础的系统的学习网站   (4)W3CSchool.cc (3)中提到的学习网站是非常基础的人们课程,要是想深入,具体的内容可以百度顶4踩1  · 上一篇大数据处理之道(实验方法<二>)· 下一篇JavaWeb错误处理集锦我的同类文章数据挖掘&机器学习(15) algorithm(19)· 数据挖掘 与 Web开发何去何从2015-12-26阅读794· 大数据之道 BitMap (按位存取)20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论