数据压缩原理_第1页
数据压缩原理_第2页
数据压缩原理_第3页
数据压缩原理_第4页
数据压缩原理_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、AIX总是有适合您的压缩方法。当今世界每天生成大量数据,有些数据需要压缩,数据压缩的好处不言而喻。这意味着节省空间。简单的传输加密保护等。出现了很多压缩工具,每个工具都有其独特的特征。AIX平台的压缩方法还包括compress、pack、gzip、Pax和tar。牙齿文档首先简要介绍了压缩的基本原理,然后详细介绍了AIX平台上的常用压缩工具,比较了各个特征,为读者提供了对AIX平台上压缩的目标识别。因此,您可以根据不适当的需要选择合适的压缩工具。数据压缩原理数据压缩是一种在不丢失信息的情况下减少数据量以减少存储空间并提高传输、存储和处理效率的技术方法。或者,根据特定的算法重新配置数据,以减少重

2、复数据和存储空间。数据压缩过程中包括有损压缩和无损压缩。无损压缩是可逆的。有损压缩是不可逆的。电脑处理信息以二进制(0和1)表示,压缩软件()在二进制信息中以特殊字符表示相同字符串,从而通过缩小文件大小实现压缩目的。压缩的理论基础是信息论。从信息的角度来看,压缩是消除信息重复。也就是说,删除可以确定或估计的信息,保留不确定的信息。换句话说,用更接近信息本质的说明代替原来的重复说明。牙齿本质上是信息量。数据压缩硬件和软件工具也很多。牙齿文档介绍和比较了AIX平台上常用的几种数据压缩工具,并建议您选择适合压缩的压缩工具。AIX平台上常见的。Z .gz。z .ar .tar后缀文件是压缩文件。通过C

3、ompress。可以生成z压缩文件,通过compress、uncompress、gzip。可以提取z格式的压缩文件。通过Gzip。可以生成gz压缩文件,通过gzip。可以提取gz格式的压缩文件。通过面膜。可以生成z压缩文件,通过pack,gzip。可以提取z格式的压缩文件。通过Pax。可以生成ar压缩文件,通过Pax。允许您提取ar格式的压缩文件。通过Pax,tar。可以生成tar压缩文件,可以是Pax、tar、untar或解压缩。您可以使用tar格式的压缩文件。图1显示了可选择用于压缩和解压缩各种档案类型的AIX工具。图1 .压缩和解压缩多种档案类型下面,我将详细说明AIX主要压缩工具的功能

4、已在使用中。返回页首CompressCompress是使用自适应Lempel-Zev编码减少文件大小的相当旧的UNIX档案压缩命令。在参数档案文件中指定的每个源文件都将替换为可能的压缩文件,压缩文件将替换为.添加了z。可以展开文件名以区分未压缩的档案,然后将压缩的文件解压缩到uncompress中。切记,Compress需要相应的权限来替换文件。压缩量取决于输入大小、以Bits变量指定的单位编码的位数以及公共子字符串的分布。通常,源代码或英语文本会减少50%到60%。特征如果您具有调用压缩过程的相应权限,则压缩文件将保留与原始文件相同的所有权、方法和修改时间。如果指定文件的路径大于1023字节

5、,则命令不起作用。如果未指定文件,标准输入将压缩到标准输出。如果压缩没有减小文件大小大小,则在不替换原始文件的情况下,标准错误中会记录消息。Compress命令的压缩通常比使用Haffman编码或自适应Haffman编码小,计算时间短(Haffman编码由pack命令使用)。要将多个文件压缩为一个压缩文件,必须先压缩档案tar,然后再压缩。常用示例1.$compress -v dsm.optDSM . opt : compression : 10.14% this file is replaced with DSM . opt . z .牙齿命令压缩dsm.opt文件,并将-v参数程序发出的消

6、息打印在屏幕上。标准输出显示压缩率为14%。Dsm.opt文件被压缩并重命名为dsm.opt.Z。2.$compress -b 12 dsm.old牙齿命令指定文件中公共子字符串的最大位值为12。-b设置参数公共字符串的最大数量(以位为单位)。可设置的值为9到16位。值越大,可以使用的公用字符串越多,压缩比率越大,因此通常使用默认值16位。3.$ compressDFD sm . opt .牙齿命令将dsm.opt.Z解压缩到dsm.opt中,如果档案文件已存在,-df程序将自动档案复盖。系统自动。由于将z作为扩展档案名添加,因此牙齿命令将dsm.opt.Z作为dsm.opt写入也视为dsm.

7、opt.Z。z返回页首UncompressCompress的解压缩也可以通过uncompress执行。Uncompress指令会还原使用compress指令压缩的原始档案。Uncompress指令会还原使用compress指令压缩的原始档案。在参数文件中指定的每个压缩文件都将被删除,并替换为扩展副本。扩展文件与压缩版本同名。没有z扩展名。如果用户具有root权限,则扩展文件将保留与源文件相同的所有者、组、方法和修改时间。如果用户没有root权限,文件将保留相同的方法和修改时间,但会导入新的所有者和组。如果指定的文件不存在,标准导入将扩展到标准输出。是$uncompress dsm.opt.Z牙

8、齿命令将解压缩dsm.opt.Z文件,然后将其重命名为dsm.opt。返回页首PackPack命令以压缩格式保存文件参数中指定的文件。输入档案在原始文件名中输入.使用附加了z后缀的压缩文件替换。压缩文件保留与原始文件相同的访问方法、访问和修改日期以及所有者。输入档案名称是.包含不超过253个字节,以便有添加z后缀的空间。Pack命令成功运行后,将删除源文件。如果Pack命令无法创建较小的文件,它将停止处理,并报告无法节省空间。(节省空间的失败通常发生在较小的文件或文字分布均匀的文件中。)节省的空间取决于输入文件的大小和字符分布频率。解码树各。因为它是z文件的第一部分,所以小于三个块的文件不会节

9、省空间。通常,文本文件减少为25%到40%。档案位置/usr/bin/pack特色使用Huffman编码压缩文件。因此,pack命令始终只能压缩小于8MB的文件。不能在以下任何条件下压缩Pack命令:文件已压缩。输入档案名称超过253个字节。文件包含链接。文件是目录。无法打开文件。压缩无法节省存储块。名为File.z的文件已存在。无法创建z文件。处理过程中出现I/O错误。是1.$pack dsm.sys dsm.sys.ini2.套件: DSM . sys : this file is reduced in size 47.3%。pack : DSM . sys . ini : this fi

10、le is reduced in size 47.5%。牙齿命令压缩名为dsm.sys和dsm.sys.ini的文件,并显示修改后的文件名。压缩版本被重命名为dsm.opt.z和dsm.sys.z。牙齿pack命令显示每个压缩文件的文件大小减少率。3.$ pack-dsm.sys4.套件: DSM . sys : this file is reduced in size 47.3%。5.the file changed from 6296 to 3315 bytes。6.Huffman tree has 11 levels below the root .7.there are 49 dist

11、inct bytes in input .8.the dictionary overhead is 67 bytes。9.the effective entropy is 4.21 bits per byte。the asymptotic entropy is 4.13 bits per byte。牙齿命令将压缩名为dsmwebcl.log的文件,并显示该文件的统计信息。返回页首UnpackUnpack命令放置通过pack命令创建的文件。Unpack命令搜索每个指定文件中名为File.z的文件。如果牙齿文件是压缩文件,则unpack命令将使用放置的版本替换文件。Unpack命令在File中。删

12、除z后缀以命名新文件。如果用户具有根权限,则新文件具有与原始文件相同的访问方法、访问和修改时间、所有者和组。如果用户没有root权限,文件将保留相同的访问方法、访问时间和修改时间,但会导入新所有者和组。Unpack命令可以。仅适用于以z结尾的文件。结果。如果指定不以z结尾的档案名称,unpack将添加其后缀,并搜索目录以查找带有该后缀的档案名称。档案位置/usr/bin/unpack特色如果正在解压缩的文件包含链接,unpack命令会在标准错误中记录警告。与源的压缩文件相比,新解压缩的文件具有不同的索引节点。但是,链接到压缩文件原始索引节点的其他文件仍然存在,并且保持压缩状态。档案名称(.z档

13、案除外)超过253个牙齿字节时,无法解压缩文件。无法打开文件。文件不是压缩文件。具有文件名的批次档已存在。无法创建解压缩的文件。是$ unpack dsm.sys.z dsm.sys.iniunpack : DSM . sys : this file is now unpacked。unpack : DSM . sys . ini : this file is now unpacked。牙齿命令扩展压缩档案dsm.sys.z和dsm.sys.ini.z,并用名为dsm.sys和dsm.sys.ini的文件替换它。Unpack命令的档案名称包含.可以有或没有z后缀。返回页首Pax提取、写入和列出

14、存档成员复制档案和目录层次结构。-r和-w标记符指定存档操作的类型。可以通过Pax执行的四个茄子主要功能是归档文件的成员档案列表(列表方法)。使用-r标记提取归档文件(读取方法);使用-w标记符写入归档文件(写入方法),使用-r和-w标记符复制(复制方法)文件。Pax命令必须是系统转储和大于2 GB的映像的首选归档方法。还可以使用Pax命令查看和修改tar和cpio格式的文件。以下示例对此进行了说明。档案位置/usr/bin/pax特征默认情况下,支持64位POSIX-定义的数据格式。用于归档大型档案(如dump档案)。存档文件大小可以大于或等于8 GB支持长用户名(或组名)支持大于20971

15、51的大型UID/GID支持长路径名或链接名使用-o标记修改存档算法注意事项对于读取或复制,如果提取存档成员需要中间目录,则Pax执行与mkdir子例程相同的操作,中间目录是路径参数,S_IRWXU值是参数。如果指定的模式或档案操作数与一个或多个档案或存档成员不匹配,则Pax会对每个不匹配的模式或档案操作数在标准错误中写入诊断消息,并以错误状态结束。遍历目录时,Pax检测无限循环。例如,浏览到上次访问文件的祖先以前访问过的目录。检测到无限循环时,Pax将诊断消息写入标准错误并退出。当Pax为读取或列表方式时,无法使用-x Pax归档文件格式和档案名称、链接名称、所有者名称或其他扩展标头记录中的

16、字段从Pax UTF8编码集格式转换为当前编码集和语言环境。Pax将诊断消息记录为标准错误,如-o invalid=选项中所述在AIX 5.3中,Pax命令默认情况下忽略扩展属性。-U选项指示Pax归档或恢复扩展属性(包括ACL)。-pe选项保留ACL。指定-pe选项时,如果Pax无法保留ACL,诊断消息将记录在标准错误中,但不会删除提取的文件。返回非零的退出代码。Pax归档文件中的扩展属性条目需要新的唱片类型。是1.$pax -wf mytest.ar -x Pax test1牙齿命令在当前目录中为test1目录创建Pax格式的归档文件mytest.ar。使用-w标记写入归档文件,或使用-x参数指定输出归档文件格式。Pax有三种茄子输出格式:Pax、copyio和ustar。Pax是默认的数据更换格式。特定字符存档格式的默认区块值为10240。支持从512到32256以512为增量递增的区块值。Cpio扩展cpio更换格式。特定字符存档格式的默认区块值为5120。支持从512到32256以512为增量递增的区块值。Ustar扩展tar更换格式。特定字符存档格式的默认区块值为10240。支持从512到32256以512为增量递增的区块值。值得

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论