wubincom 发表于 2024-11-28 13:32:15

为啥印前PDF的插图没有试读PDF里面的清晰?

本帖最后由 wubincom 于 2024-11-28 13:43 编辑

今天求了一本书,应助的为印前PDF,书籍的文字确实很清晰,就是里面的插图反而没有试读的PDF的清晰,但是把页面提取出来后,文件却很大,一页就超过了1M,请教各位大神,这是什么情况?



印前PDF总文件只有30M,但是单独提取一页就超过了1M,无法上传。传了一份在百度网盘,链接: https://pan.baidu.com/s/1ui7iKuT1Sk-PGxNUjicd3w 提取码: 9svk

请大神们看看

strnghrs 发表于 2024-11-29 10:45:12

扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间被字体占用,35%的空间被色彩空间占用。
为了减小总体文件长度,目前一般的PDF优化软件在优化时都会把缩图当做优先目标。

heyi 发表于 2024-11-29 20:36:19

本帖最后由 heyi 于 2024-11-29 20:37 编辑

链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s

根据楼主提供的2个pdf文件,将普通PDF对应的图像截图,替换原印前PDF的图像位置,即:
cv2进行图像模板对比找到匹配位置,pymupdf的replace_image替换原有图像,得到以上网盘pdf文件。

仔细观察,2个PDF的页面有缩放,位置并不严格对应,所以采用cv2模块。


预览如下:

wubincom 发表于 2024-12-1 23:11:52

strnghrs 发表于 2024-11-29 10:45
扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间 ...

马大侠能看透本质,只是我对此是一窍不通啊:L,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有没有解决的办法?

wubincom 发表于 2024-12-1 23:12:51

heyi 发表于 2024-11-29 20:36
链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s

根据楼主提供的2个pdf文件,将普通PDF ...

兄台好手段,只是这种方法我是不会的,跟听天书没区别:L

strnghrs 发表于 2024-12-2 10:27:42

wubincom 发表于 2024-12-1 23:11
马大侠能看透本质,只是我对此是一窍不通啊,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有 ...

先天不足。没有办法
页: [1]
查看完整版本: 为啥印前PDF的插图没有试读PDF里面的清晰?