




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python读写worddocx和docx2txt包示例,python,使用,实例简介doc是微软的专有的文件格式,docx是MicrosoftOffice2007之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,比doc文件所占用空间更小。docx格式的文件本质上是一个ZIP文件,所以其实也可以把.docx文件直接改成.zip,解压后,里面的word/document.xml包含了Word文档的大部分内容,图片文件则保存在word/media里面。docx包python-docx不支持.doc文件,间接解决方法是在代码里面先把doc转为.docxopython-docx,对象
2、,处理对象。模块会把word文档中的段落、文本、字体等看作?Document对象:一个word文档?Paragraph对象:word文档中的一个段落?Paragraph对象的text属性:段落的义本内容安装pipinstallpython-docx使用实例1:读fromdocximportDocumentdefreadDocx(fileName):doc=Document(fileName)# pythonUnicodeEncodeError:gbkcodeccantencodecharacterxefinposioutFile=open(a.+fileName+.txt,”wencoding
3、=utf-8)#forparaindoc.paragraphs:#print(para.txt)#每一段的编号、内容foriinrange(len(doc.paragraphs):outFile.write(str(i)+doc.paragraphsi.text+n)#表格tbs=doc.tablesfortbintbs:#行forrowintb.rows#列inrow.cells:.write(cell.text+t)forcelloutFile.write(n)#也可以用下面方法# text=# forpincell.paragraphs:#text+=p.text# print(text
4、)写fromdocximportDocumentfromdocx.sharedimportInchesdefcreateDocx():document=Document()#添加标题并设置级别,范围0-9,默认1document.add_heading(Title,0)p=document.add_paragraph(aplainparagraphlalalal)#在段落后面追加文本,并设置样式#直接追加哦outFilep.add_run(boldp.add_run(testp.add_run(italic.foriindocumentstr(i),level).bold=True).ital
5、ic=Truerange(10):.add_heading(heading,level=i)一document.add_paragraph(intensequotestyle=IntenseQuote)#添加带计数的list#添加图片(3,101,Spam),(7,422,Eggs),(4,631,Spam,spam,eggs,andspam)添加表格:一行二列表格样式参数可选:#NormalTable#TableGridShadingAccent6Accent6#添加list(原点)documentlist,style.add_paragraph=LisfBullet(firstitemin
6、unordered)documentlist,style.add_paragraph=LisfBullet(seconditeminunordered)documentlist,styledocumentlist,style.add_paragraph=ListNumber.add_paragraph=ListNumber(firstiteminordered)(seconditeminordered)documentwidth=Inchesrecords.add_picture(1.25=(test.PNG)#LightShading、LightShadingAccent1至Light#Li
7、ghtList、LightListAccent1至LightListAccent6#LightGrid、LightGridAccent1至LightGrid#太多了其它省略.table=document.add_table(rows=1,cols=3,style=LightShadingAccent1)#获取第一行的单元格列表hdr_cells=table.rows0.cells#下面三行设置上面第一行的三个单元格的文本值hdr_cells0.text=Qtyhdr_cells1.text=Idhdr_cells2.text=Descforqty,id,descinrecords#表格添加行,并返回行所在的单兀格列表row_cells=table.add_row().cellsrow_cells0.text=str(qty)row_cells1.text=idrow_cells2.text=descdocument.add_page_break()#保存.docx文档document.save(demo.docx)docx2txt包用它是因为python-docx读不到超链接的文字内容。而docx2txt一定能读到所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025湖南长沙市天心区梨塘小学春季学期代课老师招聘考前自测高频考点模拟试题附答案详解(模拟题)
- 2025黑龙江黑河北安市招聘乡村医生21人模拟试卷及答案详解(各地真题)
- 2025河南新乡市新乡县消防救援大队招聘政府专职消防队员、消防文员12人考前自测高频考点模拟试题及答案详解(网校专用)
- 2025年中共南平市委党校紧缺急需专业教师招聘模拟试卷及答案详解(考点梳理)
- 2025内蒙古正镶白旗农牧和科技局招聘特聘农技员8人考前自测高频考点模拟试题参考答案详解
- 2025国家自然科学基金委员会机关服务中心招聘合同制6人考前自测高频考点模拟试题及答案详解一套
- 2025辽宁鞍山市千山区公益性岗位招聘1人模拟试卷附答案详解(黄金题型)
- 2025年龙岩市新罗区国有资产经营集团有限公司招聘招商专员考前自测高频考点模拟试题及答案详解1套
- 2025广东广州市海珠区社会保险基金管理中心招用见习人员6名考前自测高频考点模拟试题及答案详解(易错题)
- 2025年宣城广德市国有资产投资经营有限公司下属公司招聘11人考前自测高频考点模拟试题及答案详解(各地真题)
- 大学英语四级考试大纲
- 数字技术赋能下的小学语文课堂创新实践
- 中药塌渍操作方法
- 中科低碳新能源技术学院(能源工程系) 氢能技术应用专业:新版人才培养方案
- 道路工程材料第7版 课件5 水泥混凝土
- 燃气行业人力资源数字化转型-深度研究
- TSG ZF001-2006《安全阀安全技术监察规程》
- 卫星传输专业试题题库及答案
- 2023年全国乙卷语文高考真题(含答案)
- (正式版)JBT 11270-2024 立体仓库组合式钢结构货架技术规范
- 2023年安徽职业技术学院招聘考试真题
评论
0/150
提交评论