(整理)python操作excel._第1页
(整理)python操作excel._第2页
(整理)python操作excel._第3页
(整理)python操作excel._第4页
(整理)python操作excel._第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选文档You are here: Home » 计算机 » 编程 » Python操作Excel Python操作Excel2012-09-01 老婆单位有时候有一些很大的 Excel 统计报表需要处理,其中最恶心的是跨表的 JOIN 查询。他们通常实行的做法是,把多个 Excel 工作簿合成一个工作簿的多个表格,然后再跑函数(VLOOKUP之类)去查。由于用的函数效率很低,在 CPU 打满的状况下还要跑几个小时。然后我就看不过去了,我也不懂 Excel,不知道如何优化,但我想用 Python+SQLite 总归是能够实现的。于是就尝试了一把,效果还不错,一分钟

2、以内完成统计很轻松,其中大部分时间主要花在读 Excel 内容上。1. Python 操作 Excel 的函数库我主要尝试了 3 种读写 Excel 的方法:1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都可以使用。xlrd 可以读取 .xls, .xlsx 文件,格外好用;但由于 xlwt 不能直接修改 Excel 文档,必需得复制一份然后另存为其它文件,而且据说写简单格式的 Excel 文件会消灭问题,所以我没有选它来写 Excel 文件。2> openpyxl: 这个库也是不需要其它支持的,而且据说对 Office 2007

3、格式支持得更好。圆满地是,我经过测试,发觉它加载 Excel 文件的效率比 xlrd 慢 3 倍以上,内存使用在 10 倍以上,于是就放弃了。3> win32com: Python Win32 扩展,这个库需要运行环境为 Windows+Office 对应版本。由于 Python Win32 扩展只是把 COM 接口包装了一下,可以视为与 VBA 完全相同,不会有读写格式上的问题。尝试了一下用 win32com 读取 Excel 文件,效率还是比 xlrd 慢一些。由于读取效率上 xlrd > win32com > openpyxl,所以我自然选择了 xlrd 用来读取统计报

4、表;而最终输出的报表格式较简单,所以选择了 win32com 直接操作 Excel 文件。2. Python 里的关系型数据库SQLite 是一个格外轻量级的关系型数据库,很多语言和平台都内置 SQLite 支持,也是 iOS 和 Android 上的默认数据库。Python 的标准库里也包含了 sqlite3 库,用起来格外便利。3. 用 xlrd 读取 Excel 并插入数据库样例假如数据量不大,直接用 Python 内部数据结构如 dict, list 就够了。但假如读取的几张表数据量都较大,增加个将数据插入数据库的预处理过程就有很大好处。一是避开每次调试都要进行耗时较长的 Excel

5、文件载入过程;二是能充分利用数据库的索引和 SQL 语句强大功能进行快速数据分析。#!/usr/bin/python# -*- coding: gbk -*-import xlrdimport sqlite3# 打开数据库文件device_city_db = sqlite3.connect('device_city.db')cursor = device_city_db.cursor()# 建表cursor.execute('DROP TABLE IF EXISTS device_city')cursor.execute('CREATE TABLE de

6、vice_city (device_id char(16) PRIMARY KEY, city varchar(16)') # 打开 device 相关输入 Excel 文件device_workbook = xlrd.open_workbook('输入.xlsx')device_sheet = device_workbook.sheet_by_name('设备表')# 逐行读取 device-城市 映射文件,并将指定的列插入数据库for row in range(1, device_sheet.nrows):   devi

7、ce_id = device_sheet.cell(row, 6).value   if len(device_id) > 16:       device_id = device_id0:16   if len(device_id) = 0:       continue   city = device_sheet.cell(row, 10).value   # 避开插入重复记录   cursor.execu

8、te('SELECT * FROM device_city WHERE device_id=?', (device_id,)   res = cursor.fetchone()   if res = None:       cursor.execute('INSERT INTO device_city (device_id, city) VALUES (?, ?)',                

9、60;     (device_id, city)   else:       if res1 != city:           print '%s, %s, %s, %s' % (device_id, city, res0, res1)device_city_mit()4. 将结果写入 Excel 文件样例使用 win32com 写入 Excel 的时候要留意,肯定要记得退出 Excel,否则下次运行会出错。这需要增加特别处理语句,我

10、这里偷了个懒,出了特别后要手动杀死任务管理器中的 excel 进程。至于 win32com 中类的接口,可以从 MSDN 网站查阅。import win32com.client as win32import osexcel = win32.gencache.EnsureDispatch('Excel.Application')excel.Visible = False# 貌似这里只能接受全路径workbook = excel.Workbooks.Open(os.path.join(os.getcwd(), '输出.xlsx')month_sheet = work

11、book.Worksheets(1)# 计算文件中实际有内容的行数nrows = month_sheet.Range('A65536').End(win32.constants.xlUp).Row# 操作 Excel 单元格的值 for row in range(5, nrows-4):   month_sheet.Cells(row, 1).Value += something# 保存工作簿workbook.Save()# 退出 Excelexcel.Application.Quit()python操作Excel读写-使用xlrd一、安装xlrd模块

12、60;  到python官网下载/pypi/xlrd模块安装,前提是已经安装了python 环境。二、使用介绍  1、导入模块       import xlrd   2、打开Excel文件读取数据       data = xlrd.open_workbook('excelFile.xls')   3、使用技巧     

13、;   猎取一个工作表         table = data.sheets()0          #通过索引挨次猎取         table = data.sheet_by_index(0) #通过索引挨次猎取         table

14、= data.sheet_by_name(u'Sheet1')#通过名称猎取         猎取整行和整列的值(数组)           table.row_values(i)          table.col_values(i)       &

15、#160; 猎取行数和列数         nrows = table.nrows         ncols = table.ncols                循环行列表数据        for i in range(nrows

16、 ):      print table.row_values(i) 单元格cell_A1 = table.cell(0,0).value cell_C4 = table.cell(2,3).value 使用行列索引cell_A1 = table.row(0)0.value cell_A2 = table.col(1)0.value 简洁的写入row = 0 col = 0 (2)规划实施中所实行的预防或者减轻不良环境影响的对策和措施有效性的分析和评估;# 类型 0 empt

17、y,1 string, 2 number, 3 date, 4 boolean, 5 errorctype = 1 value = '单元格的值' 2.间接市场评估法xf = 0 # 扩展的格式化 环境的两个特点:table.put_cell(row, col, ctype, value, xf) 三、平安预评价报告的基本内容table.cell(0,0)  #单元格的值'(3)是否符合区域、流域规划和城市总体规划。 table.cell(0,0).value #单元格的值'2.辨识与分析危急

18、、有害因素 环境敏感区,是指依法设立的各级各类自然、文化爱护地,以及对建设项目的某类污染因子或者生态影响因子特殊敏感的区域。 1.依法评价原则;三、Demo代码(四)环境价值评价方法   Demo代码其实很简洁,就是读取Excel数据。    1 # -*- coding: utf-8 -*- 2 import xdrlib ,sys 3 import xlrd 4 def open_excel(file= 'file.xls'): 5 try: 6 data = xlrd.open_workbook(fil

19、e) 7 return data 8 except Exception,e: 9 print str(e)10 #依据索引猎取Excel表格中的数据 参数:file:Excel文件路径 colnameindex:表头列名所在行的所以 ,by_index:表的索引11 def excel_table_byindex(file= 'file.xls',colnameindex=0,by_index=0):12 data = open_excel(file)13 table = data.sheets()by_index14 nrows = table.nrows #行数15 ncols = table.ncols #列数16 colnames = table.row_values(colnameindex) #某一行数据 17 list =18 for rownum in range(1,nrows):19 20 row = table.row_values(rownum)21 if row:22 app = 23 for i in range(len(colnames):24 appcolnamesi = rowi 25 list.append(app)26 return list27 28 #依据名称猎取Excel表格中的数据 参数:fil

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论