为啥印前PDF的插图没有试读PDF里面的清晰?
本帖最后由 wubincom 于 2024-11-28 13:43 编辑今天求了一本书,应助的为印前PDF,书籍的文字确实很清晰,就是里面的插图反而没有试读的PDF的清晰,但是把页面提取出来后,文件却很大,一页就超过了1M,请教各位大神,这是什么情况?
印前PDF总文件只有30M,但是单独提取一页就超过了1M,无法上传。传了一份在百度网盘,链接: https://pan.baidu.com/s/1ui7iKuT1Sk-PGxNUjicd3w 提取码: 9svk
请大神们看看
扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间被字体占用,35%的空间被色彩空间占用。
为了减小总体文件长度,目前一般的PDF优化软件在优化时都会把缩图当做优先目标。
本帖最后由 heyi 于 2024-11-29 20:37 编辑
链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s
根据楼主提供的2个pdf文件,将普通PDF对应的图像截图,替换原印前PDF的图像位置,即:
cv2进行图像模板对比找到匹配位置,pymupdf的replace_image替换原有图像,得到以上网盘pdf文件。
仔细观察,2个PDF的页面有缩放,位置并不严格对应,所以采用cv2模块。
预览如下:
strnghrs 发表于 2024-11-29 10:45
扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间 ...
马大侠能看透本质,只是我对此是一窍不通啊:L,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有没有解决的办法? heyi 发表于 2024-11-29 20:36
链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s
根据楼主提供的2个pdf文件,将普通PDF ...
兄台好手段,只是这种方法我是不会的,跟听天书没区别:L
wubincom 发表于 2024-12-1 23:11
马大侠能看透本质,只是我对此是一窍不通啊,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有 ...
先天不足。没有办法
页:
[1]