TIFF图像文件转换为PDF文件的实现.doc_第1页
TIFF图像文件转换为PDF文件的实现.doc_第2页
TIFF图像文件转换为PDF文件的实现.doc_第3页
TIFF图像文件转换为PDF文件的实现.doc_第4页
TIFF图像文件转换为PDF文件的实现.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

TIFF图像文件转换为PDF文件的实现3李明伍方丽萍(西华大学图书馆成都610039) (郫县友爱中心校成都611730)【摘要】介绍了在. NET平台中用C#结合itextsharp控件实现TIFF图像文件转换为PDF文件的开发,并给出实现业务的关键代码,希望对于图书馆资源的数字化建设有所帮助。【关键词】格式转换TIFFPDF图像数字化数字图书馆C#Itextsharp【分类号】G250. 72G354. 4Implement of Converting the TIFF Image File into the PDF DocumentL iM ingwu(L ibrary of X ihua Un iversity, Chengdu 610039, China)Fang L ip ing(Center School of YouA i, Chengdu 611730, China)【Abstract】This article use itextsharp componentwith C# to convert the TIFF image file into the PDF documentin the . NET p latform. Hope this article can help for the digital construction of library resources.【Keywords】Format conversionTIFFPDFImageDigital libraryC#Itextsharp收稿日期: 2005 - 11 - 013 本文系四川省教育厅“图书馆、情报与文献学”规划项目“四川高等教育文献保障体系建设特色数据库”(项目编号: 04216098)和四川省高校特色数据库建设规划项目“汽车特色数据库”的研究成果之一。目前,图书馆的信息化建设已经从基础硬件建设阶段进入到以数字图书馆 1 (Digital Library, DL)为特征的内容建设阶段。资源的数字化、标准化、规范化是该阶段的特点,其中对印刷文献数字化的处理流程如图1所示。在CAL IS 2 以及其他数字图书馆的建设规范 3 中,要求扫描数据格式为TIFF 4 ( Tagged Image File Format ) ,并最终将TIFF格式转换为PDF 5 ( Portable Document For2mat)格式存储并上网提供服务。本文结合“四川高校文献保障体系特色数据库”本地建库系统的研发,重点讨论在. NET平台实现TIFF文件转换为PDF文件,并给出实现业务的关键代码。图1印刷文献数字化处理流程1系统设计1. 1系统结构系统由底层系统接口、功能模块、用户界面三个部分组成。底层系统接口主要包括TIFF文件的读取、PDF文件的输出等模块。各功能模块在. NET平台利用C#语言 6 来编程实现分辨率更改、PDF文件参数设置、格式转换等模块。用户界面利用平台支持的标准控件来设计,实现与用户的交互。系统的结构如图2。图2系统结构图图3系统功能图1. 2系统功能本系统主要实现TIFF文件转换为标准PDF文件,系统的功能结构如图3。(1)文件选择。系统支持对同一目录的单个文件或多个文件的选择,同时支持不同目录的多文件的选择,还必须支持直接从Web或Ftp网站下载文件。(2) TIFF文件读取。既可以打开单页的TIFF文件,也可以打开多页的TIFF文件,还必须支持各种格式的TIFF文件。(3)更改分辨率。根据用户的需要,调整当前图像的分89现代图书情报技术2006年第3 期工作交流总第134期辨率或调整整个图片的分辨率。(4)参数管理。设置是将当前图片转换为一个PDF文件,还是将多个文件转换为一个PDF文件,并按规范同时生成一个24页的PDF文件;设置PDF文件的命名规则;设置PDF文件输出目录,设置PDF文件的版式。(5)格式转换。转换后的文件要保持原有的版式,要适应各类PDF阅读器,要使生成的PDF文件足够小。(6)书签生成。转换后的文件要有书签导航功能。(7)输出控制。将转换后的文件备份到指定的目录或上传到指定的服务器中。2系统实现2. 1实现原理系统开发的难点在TIFF文件的读取与格式转换,但由于TIFF与PDF文件标准相当灵活、复杂,因此我们直接在. NET平台与开放源代码的itextsharp 7 函数库基础上编制了软件,以保证对标准的全面支持和兼容。(1) TIFF图像文件读取,主要利用GD I + ( Graphics De2vice Interface Plus) 8 来进行图形输出和显示。GD I +的Image类封装了对BMP、GIF、JPEG、PNG、TIFF、WMF和EMF图像文件的调入、格式转换以及简单处理的功能。图像操作函数如表1。表11NET平台图像操作关键函数名称与功能名称功能备注new 新建一个对象System. Drawing. B itmapGetFrameCount 获取图片个数System. Drawing. B itmapSelectActiveFrame 获取当前图片System. Drawing. B itmap(2)格式转换,包括更改分辨率与格式转换,主要利用了itextsharp中的两个类库itextsharp. text和itextsharp. text. pdf。其关键类与功能如表2。itextsharp. text. pdf类库提供了Pdf2Writer类与itextsharp. text的document对象关联, 用于产生PDF格式的文档,这是进行格式转换的关键所在。实现转换的关键函数如表3。表2itextsharp关键类与功能名称功能备注document类产生文档对象以便于在其中加入数据itextsharp. textimage类向文档对象插入图片数据itextsharp. textPdfW riter类PDF文件操作itextsharp. text. pdfPdfContentByte类设置图片在文档对象中的位置itextsharp. text. pdf表3格式转换关键函数名称与功能名称功能备注getInstance建立PdfW riter对象与document对象关联,通过PdfW riter对象将文档写入到磁盘中PdfW riter类getInstance 获取当前图像对象实例Image类scalePercent 置当前图像的分辨率Image类add Image 向文档中添加图像数据PdfContentByte类newPage 在document对象中新建一页document类2. 2系统流程首先,用户进行参数设置,选择要转换的TIFF文件并顺序打开,获取文件包含的图像数目,然后读出当前图像的分辨率并根据用户的需要重新设置该图片的分辨率,最后进行格式转换并生成导航书签,按用户设定的文件名保存文件。系统流程如图4。图4系统流程图3系统开发3. 1开发环境程序开发的硬件环境为一般PC兼容机,操作系统为Windows2000 Server,开发平台为VS. NET 2003,语言为C#。同时将下载的itextsharp控件包释放到本地。3. 2程序界面程序的主界面如图5。图5程序主界面3. 3关键的代码System. Drawing. Bitmap bm = new System. Drawing. Bitmap (“test.tif”) ; / /打开TIFF文件。int total = bm. GetFrameCount ( FrameDimension. Page) ; / /获取当前文件图像个数。Document pdfdoc = new Document( PageSize. A4, 50, 50, 50, 50) ;/ /建立Document对象的实例,并设置Document的大小与边距。PdfWriter writer = PdfWriter. getInstance ( pdfdoc, new FileStream(“c: tiff2pdf. pdf”, FileMode. Create) ) ; / /建立一个PdfWriter对象90现代图书情报技术2006年第3 期工作交流总第134期Writer与document对象关联,通过Writer可以将文档写入到磁盘中。pdfdoc. Open ( ) ; / /打开文档。PdfContentByte cb = writer. DirectContent;for ( int k = 0; k total; + + k)bm. SelectActiveFrame ( FrameDimension. Page, k) ;Image img = Image. getInstance ( bm, null, true) ;img. scalePercent(72f / 200f 3 100) ; / / 设置当前图片的分辨率为200dp i。img. setAbsolutePosition (0, 0) ;cb. add Image ( img) ; / /向文档中添加图像数据。pdfdoc. newPage ( ) ;pdfdoc. Close ( ) ; / /关闭文档,将缓冲区的内容写入磁盘以保存文件。图6转换后的文件在Acrobat Reader中正常显示4结论本文设计的TIFF文件转换为PDF文件系统已经成功的应用到四川高校特色数据库的本地建库系统中,图6是通过该系统转换成的PDF文件在Acrobat Reader中的显示效果。实践证明,该系统不仅操作简便、通用性强,满足了项目的需要,而且具有良好的扩展性,便于维护,稍加修改,就可以将其他格式的图像文件转换为标准的PDF文件。参考文献:1什么是数字图书馆. http: / /www. digitalearth. net. cn /debooks/de100 /5 - 12. htm (Accessed Oct. 17, 2005)2 CAL IS. http: / /www. calis. edu. cn / calisnew/ calis_ index. asp? fid =3&class =5 (Accessed Oct. 16, 2005)3我国数字图书馆标准与规范建设. http: / / cdls. nstl. gov. cn /2003 /Whole /TecReports. html#allreports(Accessed Oct. 16, 2005)4光艳良,申宝成. TIF图像文件与BMP图像文件的转换研究. 太原重型机械学院学报, 2001 (1) : 75 - 775李睿. 数字图书馆资源格式选择分析. 情报理论与实践, 2003 ( 3) :283 - 2846窦芳. Visual C#. NET从入门到精通. 北京:电子工业出版社120037itextsharp. http: / / sourceforge. net/p rojects/ itextsharp / (Accessed Oct.16, 2005)8GD I +. http: / /www. crazy - bit. com / articles/gdip lusintro. htm (Ac2cessed Sep t. 25, 2005)(作者E - mail: littfox163. com)动态微软与大英图书馆合作数字化2500万页资料2005年11月4日,微软和大英图书馆宣布一项战略合作计划,在2006年对该馆的2500万页馆藏资源进行数字化,并将长期承担数字化的任务以完成更多资源的数字化工作。微软和英国图书馆将合作数字化10万册图书,并通过MSN图书搜索服务帮助人们在网上方便地获得这些资源。大英图书馆的首席执行官Lynne Brindley说:“这项合作将帮助我们加快实现将我们的馆藏资源提供给每一个人的步伐。任何人、任何地点、任何时间都可以获得我们丰富馆藏的数字化的资源。”微软总裁Bill Gates说:“与大英图书馆的合作不仅仅是资源的数字化和保存,而且也是通过英国图书馆与MSN网络设施的联合,给人们提供一种新的获取信息的途径。”微软已经与大英图书馆一起合作,帮助其建立数字化的基础设施,为国家数字图书馆(National Digital L ibrary)提供软件工具、建议和支持。国家数字图书馆是2005年6月开始的大英图书馆战略( http: / /www. bl. uk / about/ strategy. html)的基础。数字对象管理系统( The DigitalObjectManagement ,DOM)能够长期存储、保存和获取电子期刊、电子图书以及光盘等数字化资源,并且保证这些资源不涉及产权问题。该系统将采取开放的标准,以保证图书馆适应技术的发展。Lynne Brindley说:“在发展国家数字图书馆的过程中,我们重新界定了图书

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论