自己动手MOBI转PDF.doc_第1页
自己动手MOBI转PDF.doc_第2页
自己动手MOBI转PDF.doc_第3页
自己动手MOBI转PDF.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自己动手 MOBI 转 PDF最近想多背些单词,扩充下词汇量,网上兜了一圈发现大家对韦小绿【是什么自己到网上收下,我就不列出来了,以免引起纠纷】评价很高, 原来想去到书城买本进口原版的看,想来想去那么厚,虽然很轻但是还是带起来不方便啊。平时身上都带着一本M92和一部V9+已经塞满小包了。于是就邪恶的在网上找了本mobi格式的第二版,打算放在M92里。PS:现在知道生活在天朝是多么的幸福吧。 尼玛,谁知道在M92里显示出来有2000多页,实体书也就500多页。音标也无法正确显示,原因是音标都是用图片拼接的。不知道是不是M92的原因,KINDLE的没有试过。在网上找转换工具想把MOBI转成PDF的,结果音节正常了,但是还是有2000多页,每页空白很大,看起来很不爽啊。智能的去掉空白,一般转化软件还真做不到。没办法只有自己手工的改了。原理,其实MOBI是个zip包,你可以把后缀改成zip,然后用解压缩软件打开,再修改里面的HTML文件。都是HTML文件了还是有什么我们不能改的?赶紧动手!1. 把所有HTML文件里的把除了BODY标签里的保留下来,其他的统统删掉。plainview plaincopy1. sed-i1,7d;$d*.html2. sed-is/g*.html2. 把所有处理完的HTML 内容集中在一个文件里,这里因为文件名特殊,要简单处理下。pythonview plaincopy1. importos2. foriinrange(0,2005):3. ifi=0:4. strs=0005. elifi0andi=10andid:testall213. printcmds14. os.system(cmds)3. 处理音标。 就是把所有的标签删掉,注意要避免VI下的贪婪匹配,防止删掉不该删的东西。plainview plaincopy1. %s/*/g4. 微调格式plainview plaincopy1. :%s/./g5. 把生成的文件中头尾加入在第2步中删除的BODY 标签之外的东西。在浏览器中打开,拷到WORD中,然后另存为PDF.6. 大功告成。如果大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论