找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 6163|回复: 3

[【推荐】] PDF压缩技巧及PDF压缩软件

[复制链接]
发表于 2010-1-20 22:01:28 | 显示全部楼层 |阅读模式
总结一下PDF压缩技巧及相关的PDF压缩软件,作为 全面接触PDF:最好用的PDF软件汇总 的专门补充。尽管使用 pdf 压缩的机会不多,但考虑到这方面的相关文章和软件介绍极少,所以,写作此文并持续完善。欢迎指正补充。一、PDF内部的压缩技术
  pdf 文件内部已经使用了如下压缩技术:
  - LZW (Lempel-Ziv-Welch) 与 FLATE (ZIP, PDF v1.2):用于图像、文本的无损压缩。
  - JPEG 及 JPEG2000 (PDF v1.5):用于图像的有损和无损压缩。
  - CCITT (Group 3 or 4) 与 JBIG2 (PDF v1.4):用于黑白图像无损压缩。
  因此,pdf文件通过压缩软件(7-Zip/WinZip/WinRar)来减小存储体积的做法,通常不会取得明显效果。但必要情况下,也不妨尝试。比如Ni网友留言说,“7-Zip的LZMA算法对某些文件还是有很大压缩效果的,曾试过把50M的PDF用7z压到16M。”
二、pdf文件体积的相关因素及压缩技巧
  关于PDF文件的体积与优化。
  1. 任何优化(或压缩)都可以分为两种:有损和无损。涉及的信息,既包括能直接看到的文字、图像,也包括不被直接看到的字体、文件元信息等。举个非pdf的例子,从bmp到png的格式转换是无损的,到jpg就是有损的。对jpg优化(有损)而言,一种是降低图像质量,一种是减少头信息。其中比较智能的软件,在降低图像质量时,能对不同区域采取不同的图像压缩比。即:次要区域多压缩多损失,重要区域少压缩保持高质量。
  2. pdf如果体积较大,通常是来自图像和嵌入的字体。
  3. 生成pdf时就要考虑体积,建议:采用较少的字体,采用常见的字体,这样就可以在减少字体嵌入的成本,而不影响显示质量。减少图片的数量、尺寸、色深,采用最适合的格式。
  从文件体积看,可以这样表示:pdf=文+字体+格式+图+附件。因此,压缩pdf也要从这些方面入手。
PDF的字体优化原则
  字体优化(via)的原则如下:
  - 优先使用标准字体。PDF默认的标准字体有5种(Times, Helvetica, Courier, Symbol, ZapfDingbats),规范的pdf阅读器必须支持这些字体。此外的字体就有可能需要全部或部分嵌入(Font Embedding)。
  - 使用较少种类的字体。若要体积小,就不要宋体、楷体、黑体一齐来了。另外,滥用字体会远离美观而偏向花哨甚至恶俗。
  - 使用较少的字体风格。对pdf而言,常规、粗体、斜体、粗斜体是4种不同的字体,需要分别嵌入。少用一种是一种。另外,这些字体强调方式,可以换用字号、颜色、下划线、字符间距、缩进等手段实现,它们不会占用多余体积。
  - 使用轻型字体。(比如某些华丽的艺术字体,比常规的黑体、宋体体积更大)。
PDF的图像优化
  待完成……
通常有效的PDF优化措施
  - 用 PDF 打印软件把pdf文件再打印为新的pdf;(推荐一试,因为有大量免费软件!)
  - 在 PDF 编辑软件中“另存为” 。解释:pdf是一种“增量保存(incremental updates)”格式。当你改变一些信息后,它会将这种变化“保存”在原文件的最后,这种做法速度快,但文件体积大。而“另存”则是重写文件内容,速度稍慢,但文件体积减小。
  - 高级PDF编辑软件中的优化按钮。如 Nitro PDF Button → Prepare → Optimize Document;如Acrobat 8 → Advanced → PDF Optimizer.
更多PDF优化资料
   Optimizing your PDF files
  Optimize PDF Files
  Reducing PDF File Size
  
  oversky网友留言 2009-09-27:pdf creator, cutepdf, PrimoPDF, PDF ReDirect, Bullzip 这样都是用 ghostscript 来生成 pdf。档案大小、品质会有差都是因为设定的关系。主要是在图案的 jpeg 压缩比、解析度较高的图案是否有 downsampling,还有字型是否有包入 pdf 档有关。真要说可以制作比较小的档案,要找可以把图用 jpeg2000 压的,目前我只看到 PDF-XCHANGE 4 PRO 和 adobe acrobat 有这技术。
三、pdf 压缩软件综述
免费PDF压缩软件
  免费pdf压缩软件几乎不存在。很多早期免费的pdf压缩软件都在版本升级后转成了收费软件,不再提供免费版本,只能自行搜索。
  - PDF Compress v1.0 免费版:出自 bureausoft 公司,免费版可在 这里 下载注意不要选择官方链接(Official Download),只有选择下载站未更新的链接,才是旧的免费版(2009-10-15测试通过)。最新版本注册价格为 49 USD。
  - Free PDF Compressor:旧的免费版未找到下载链接(欢迎提供),新版为 Nice PDF Compressor(59 usd)。
收费PDF压缩软件
  多数pdf解决方案供应商都有类似专门软件(verypdf/Advanced PDF Tools/PDF Compress;)或全能软件中包含了压缩功能(acrobat)。
四、压缩软件 PDF Shrink 试用手记
  PDF Shrink:原Mac平台的pdf压缩软件,现开始提供windows和iPhone版本。试用期 10天,注册价格:35usd。2009年10月,善用佳软得到了 PDF Shrink 的 windows 内测版本,试用如下。
1. 下载安装与试用
  下载:PDFshrink_w45.exe 约3.5MB。
  安装:安装后 9.3MB,包括如下文件:
PDFShrink.exe
PDF Shrink Users Guide.pdf
webupdater.exe
Apago PDF Shrink.url
license.txt
uninst.exe
webupdatedlg.xrc
6,824 KB
540 KB
1,920 KB
1 KB
1 KB
49 KB
33 KB
  运行主程序,PDFShrink.exe,其界面与基本功能可通过下面的视频 (抱歉,不太清晰)有个基本了解。

  软件的基本界面很简单,主界面的列表是几个预设压缩方案。直接把pdf文件拖放到对应方案上即可。
2. PDF Shrink 压缩原理
  PDF Shrink Users Guide.pdf 中提到,“PDF Shrink reduces the size of PDF files by optimizing the resolution and compression method of each p_w_picpath in the PDF file. The interface allows for setting different compression and resolution choices for color, grayscale and monochrome p_w_picpaths.”
  照此来说,PDF Shrink 的优化措施只是在图片方面:优化(应该就是降低)分辨率、改进压缩算法。而不涉及影响到pdf大小的其他方面(比如字体嵌入)。
3. 纯文本pdf压缩测试
原始文件:雪山飞狐.txt,ansi编码 264KB。
测试过程:用notepad.exe打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:
生成软件初始pdf大小PDF Shrink后压缩率PDFCreator825 KB800 KB3.0%PDFCreator-优化*417 KB375 KB5.3%CutePDF Writer1080 KB1055 KB2.2%TinyPDF982 KB950 KB3.3%* PDFCreator-优化:手工设置不嵌入字体。
结论:
  PDF Shrink 对文字内容几乎无法压缩。不嵌入字体是减少文本类型PDF体积的有效手段。
4. 纯图像pdf压缩测试
原始文件:photo.doc。制作过程:直接在 MS Word 2003 中 ctrl+n 新建文档,在TC中拖放3图片文件(数码相机照片,jpg,3888 x 2592 像素,每张约 3MB,共 9.7MB)到该doc文档,保存,得 doc 文件 10.3 MB。分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:
生成软件初始pdf大小PDF Shrink后压缩率PDFCreator1634 KB39 KB97%PDFCreator-优化*49 KB42 KB15%CutePDF Writer2182 KB39 KB98%TinyPDF837 KB210 KB75%* PDFCreator-优化:手工设置pdf分辨率,从默认600降到72;彩色图像压缩从默认自动改为 jpeg 最大压缩,并设分辨率为72。
结论:
  ① 总体看,大尺寸图像的压缩,从doc到pdf,再到压缩后的pdf,都有明显效果。本例:10MB → 1-2MB → 50KB。
  ② CutePDF Writer 和 PDFCreator 生成的原始文件相差较多,但压缩后的体积相同。这是因为本质上它们都是用 ghostscript 生成的。
  ③ 基于 GhostScript 的 PDF 生成,可以通过参数设置降低文件大小。比如 PDFCreator 更改设置后直接生成的 pdf 为49KB,但比起 PDF Shrink 压缩出的更小(39KB)的pdf,图像质量较差。
5. 实际网页测试
原始文件:在 Chrome 浏览器中打开 http://xbeta.info 页面,分别打印到如下三款pdf打印机(采用默认设置),然后,用 PDF Shrink 的 web 方案进行压缩。
测试结果:
生成软件初始pdf大小PDF Shrink后压缩率PDFCreator203 KB189 KB5%CutePDF Writer289 KB271 KB4%TinyPDF188 KB167 KB9%结论:
  ① pdf压缩效果取决于图像/文字的比例。
  ② 对于本身体积较小的pdf文件,最终大小首先取决于生成时的设置,其次才是压缩。比如,本例中,用tiny pdf生成的原始文件,比压缩后的cuteppdf、pdfcreator文件更小。
  大家如有其他关心问题,欢迎留言提出。
附录:文章更新历史
  2009-10-15:补充PDF优化方法与建议;更正链接/错字,鸣谢黯然过客、ivanlee。
  2009-10-14:新增纯文本、纯图片测试案例。
  2009-10-14:初稿。
出处:http://xbeta.info/pdf-shrink.htm

推荐理由:有时给pdf添加书签,OCR造成体积巨大,压缩能够大幅瘦身。
PDF Compress http://www.softsea.net/soft/131705.htm
回复

使用道具 举报

发表于 2010-1-21 09:16:25 | 显示全部楼层
1、JBIG2 可以是无损,也可以是有损。
2、图像文件用打印的方法转换成PDF纯属扯淡,再讨论优化就更没意义了。
回复

使用道具 举报

 楼主| 发表于 2010-1-21 09:22:03 | 显示全部楼层
引用第1楼strnghrs于2010-01-21 09:16发表的 :
1、JBIG2 可以是无损,也可以是有损。
2、图像文件用打印的方法转换成PDF纯属扯淡,再讨论优化就更没意义了。

谢谢!迎来大师评论,感谢!
回复

使用道具 举报

发表于 2010-1-22 10:13:39 | 显示全部楼层
对pdf文档的使用又多了一分了解,感谢分享经验
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-11-19 08:48 , Processed in 0.180398 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表