付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python读写word文档docx和docx2txt包示例,python,使用,实例简介doc是微软的专有的文件格式,docx是MicrosoftOffice2007之后版本使用,其基于OfficeOpenXML标准的压缩文件格式,比doc文件所占用空间更小。docx格式的文件本质上是一个ZIP文件,所以其实也可以把.docx文件直接改成.zip,解压后,里面的word/document.xml包含了Word文档的大部分内容,图片文件则保存在word/media里面。docx包python-docx不支持.doc文件,间接解决方法是在代码里面先把doc转为.docx。python-docx模
2、块会把word文档中的段落、文本、字体等看作对象,处理对象。?Document对象:一个word文档?Paragraph对象:word文档中的一个段落?Paragraph对象的text属性:段落的文本内容安装pipinstallpython-docx使用实例1:读fromdocximportDocumentdefreadDocx(fileName):doc=Document(fileName)#pythonUnicodeEncodeError:gbkcodeccantencodecharacterxefinposioutFile=open(a.+fileName+.txt,wencoding=
3、utf-8)#forparaindoc.paragraphs:#print(para.txt)#每一段的编号、内容foriinrange(len(doc.paragraphs):outFile.write(str(i)+doc.paragraphsi.text+n)#表格tbs=doc.tablesfortbintbs:#行forrowintb.rows#歹Uinrow.cells:.write(cell.text+t)outFileforcelloutFile.write(n)#也可以用下面方法#text=#forpincell.paragraphs:#text+=p.text#print(
4、text)写fromdocximportDocumentfromdocx.sharedimportInchesdefcreateDocx():document=Document()#添加标题并设置级别,范围0-9,默认1document.add_heading(Title,0)p=document.add_paragraph(aplainparagraphlalalal)#在段落后面追加文本,并设置样式#直接追加哦p.add_run(bold).bold=Truep.add_run(test)p.add_run(italic.).italic=True#oriinrange(10):docum
5、ent.add_heading(heading,level+str(i),level=i)document.add_paragraph(intensequote,style=IntenseQuote)# 添加list(原点)# 添加带计数的list# 添加图片document.add_.picture(test.PNG,width=Inches(1.25j)records=(3,101,Spam),(7,422,Eggs),(4,631,Spam,spam,eggs,andspam)# 添加表格:一行三列# 表格样式参数可选:#NormalTable#TableGrid#LightShadin
6、g、LightShadingAccent1至LightShadingAccent6#LightList、LightListAccent1至LightListAccent6#LightGrid、LightGridAccent1至LightGridAccent6documentlist,style.add_paragraph=LisfBulletdocumentlist,style.add_paragraph=LisfBullet(firstiteminunordered)(seconditeminunordered)documentlist,style.add_paragraph=ListNum
7、berdocumentlist,style.add_paragraph=ListNumber(firstiteminordered)(seconditeminordered)# 太多了其它省略table=document.add_table(rows=1,cols=3,style=LightShadingAccent1)# 获取第一行的单元格列表hdr_cells=table.rows0.cells# 下面三行设置上面第一行的三个单元格的文本值hdr_cells0.text=Qtyhdr_cells1.text=Idhdr_cells2.text=Descforqty,id,descinrecords:#表格添加行,并返回行所在的单元格列表row_cells=table.add_row().cellsrow_cells0.text=str(qty)row_cells1.text=idrow_cells2.text=descdocument.add_page_break()#保存.docx文档document.save(demo.docx)docx2txt包用它是因为python-docx读不到超链接的文字内容。而docx2txt一定能读到所有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学德育处工作责任制度
- 茶室服务主体责任制度
- 混凝土砖生产岗位责任制度
- 加油站消防工作责任制度
- 一航吊司机岗位责任制度
- 理发店岗位卫生责任制度
- 装修公司分包责任制度
- 物资储备组工作责任制度
- 医院内疫情防控责任制度
- 桂林医科大学第一附属医院2026年科研助理招聘备考题库及答案详解参考
- 2026年甘肃事业单位联考笔试易考易错模拟试题(共500题)试卷后附参考答案
- 《化工HSE与清洁生产》课件-项目6 危险化学品
- 运输企业物流标准化管理制度
- 2026年《禁毒法》知识测试题及答案(全优)
- 2026陕煤集团榆林化学有限责任公司招聘(162人)笔试模拟试题及答案解析
- 人工智能与文学创作的未来
- 2026中国藏语系高级佛学院招聘应届高校毕业生6人考试备考试题及答案解析
- 2026年春季学期统编版三年级下册语文教学计划(含进度表)(2024新教材)
- 2023年边缘计算相关项目实施方案
- 七下综合世界真奇妙-共享“地球村”
- 大学英语2 UNIT6课件
评论
0/150
提交评论