版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
单元11Python教你玩转PDF文件任务11.1提取PDF文件中的表格【任务目标】使用PyMuPDF库提取文件“test11_01.pdf”中的所有表格,将其存入一个Excel文件,每个表格占一个工作表。【任务实施】……10.1读取PDF文件内容读取PDF文件内容主要包括读取表格、文本和图片等操作。11.1.1读取表格在PyMuPDF库中,调用页面对象的find_tables()方法可读取页面中的所有表格,再调用表格对象的to_pandas()方法可将表格转换为pandas的DataFrame对象,进一步将DataFrame对象写入Excel文件。示例代码如下。11.1.2读取文本PyMuPDF库的open()方法用于打开现有PDF文件或者创建空白PDF文件,该方法返回一个文档对象。调用文档对象的load_page()方法可加载指定页面,返回页面对象。再调用页面对象的get_text()方法可返回页面中的所有文本。示例代码如下。11.1.3读取图片打开PDF文件后,调用页面对象的get_images()方法可返回一个包含页面中所有图片对象的列表,再调用文档对象的extract_image()方法即可从图片对象中提取图片。示例代码如下。任务11.2批量转换PDF文件【任务目标】“test11_05”文件夹中有多个Word文档,编写一个程序将这些文档转换成PDF文件。【任务实施】……11.2PDF文件高级操作PDF文件高级操作包括合并、拆分、加密、解密文件,为文件添加水印,以及文件格式转换等。11.2.1合并和拆分文件使用PyMuPDF库,调用文件对象的insert_pdf()方法即可实现文件合并。示例代码如下。调用PyMuPDF库的insert_pdf()方法将原PDF文件页面插入新的PDF文件,即可实现文件拆分。insert_pdf()方法的第一个参数用于指定原PDF文件,from_page参数用于指定插入的起始页码,to_page参数用于指定插入的结束页码。示例代码如下。11.2.2加密和解密文件在使用PyMuPDF库的save()方法保存PDF文件时,可通过参数设置加密方法对文件进行加密,示例代码如下。PyMuPDF库的authenticate()方法用于验证密码并解密PDF文件,示例代码如下。11.2.3为文件添加水印1.添加文本水印调用页面对象的insert_text()方法可为文件添加文本水印,示例代码如下。在insert_text()方法中,参数overlay值为True时文本位于原页面文字上方,为False时文本位于原页面文字下方;参数rotate用于指定旋转角度,其有效值为0、90、180和270。如果需要添加其他旋转角度(如45°)的水印,可使用参数morph设置变换矩阵,示例代码如下。2.添加图片水印调用页面对象的insert_image()方法可为文件添加图片水印,示例代码如下。如果需要添加有旋转角度的图片水印,可先旋转图片,然后调用insert_image()方法将其添加到PDF文件,示例代码如下。11.2.4文件格式转换comtypes是一个Python库,可以通过调用MicrosoftWord或者MicrosoftPowerPoint的COM接口实现Word文档、PPT文档与PDF文件之间的转换。comtypes库安装命令如下。1.将Word文档转换为PDF文件调用comtypes.client.CreateObject()方法初始化Word应用程序后,可用其打开Word文档,然后将Word文档另存为PDF文件,示例代码如下。2.将PPT文档转换为PDF文件调用comtypes.client.CreateObject()方法初始化PowerPoint应用程序后,可用其打开PPT文档,然后将PPT文档另存为PDF文件,示例代码如下。3.将PDF文件转换为Word文档与将Word文档转换为PDF文件的操作方法类似,首先利用Word应用程序打开PDF文件,然后将PDF文件另存为Word文档,示例代码如下。【综合实例】生成录取通知书存档联(二)文档“test11_17.docx”保存了录取通知书存档联模板。编写一个Python程序,从文件“test11_17.xlsx”中读取录取信息,将学生的录取编号、姓名、性别、证件号码、专业名称依次填入模板中表格第2列的各行,将录取时间、总分依次填入模板中表格第4列的第4、第5行。最后,将录取照片插入文档末尾。录取照片保存在录取照片文件夹
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车设计工程师面试技巧与要点
- 轨道交通企业人力资源管理体系建设探索
- 高铁工程建设部长月度工作总结与展望
- 活动风险评估及应对措施
- 长城汽车公司行政支持团队的工作挑战与对策
- 江梦南演讲稿标题
- 演讲稿脸皮厚的好处
- 2026年妇产科护理学知识考试题库及答案(共100题)
- 创平安校园的演讲稿
- 2015清华大学演讲稿
- 吴冬冬:长方体和正方体的认识PPT
- 动物行为学绪论
- 高二年级化学寒假作业
- 茶与茶文化-红茶课件
- 循证医学临床实践-1课件
- 《汽车电路识图》课程标准
- 《滕王阁序》-完整版课件
- 做一个幸福快乐的教师课件
- GB∕T 25346-2020 船舶供受燃油规程
- 病毒性肝炎传染病学课件
- Examples资讯案例
评论
0/150
提交评论