找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 171|回复: 5

[【其它】] 为啥印前PDF的插图没有试读PDF里面的清晰?

[复制链接]
发表于 2024-11-28 13:32:15 | 显示全部楼层 |阅读模式
本帖最后由 wubincom 于 2024-11-28 13:43 编辑

今天求了一本书,应助的为印前PDF,书籍的文字确实很清晰,就是里面的插图反而没有试读的PDF的清晰,但是把页面提取出来后,文件却很大,一页就超过了1M,请教各位大神,这是什么情况?



印前PDF总文件只有30M,但是单独提取一页就超过了1M,无法上传。传了一份在百度网盘,链接: https://pan.baidu.com/s/1ui7iKuT1Sk-PGxNUjicd3w 提取码: 9svk

请大神们看看

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-11-29 10:45:12 | 显示全部楼层
扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间被字体占用,35%的空间被色彩空间占用。
为了减小总体文件长度,目前一般的PDF优化软件在优化时都会把缩图当做优先目标。

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-11-29 20:36:19 | 显示全部楼层
本帖最后由 heyi 于 2024-11-29 20:37 编辑

链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s

根据楼主提供的2个pdf文件,将普通PDF对应的图像截图,替换原印前PDF的图像位置,即:
cv2进行图像模板对比找到匹配位置,pymupdf的replace_image替换原有图像,得到以上网盘pdf文件。

仔细观察,2个PDF的页面有缩放,位置并不严格对应,所以采用cv2模块。


预览如下:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
回复

使用道具 举报

 楼主| 发表于 2024-12-1 23:11:52 | 显示全部楼层
strnghrs 发表于 2024-11-29 10:45
扫描版的图像尺寸是1000*1520像素,无损图像压缩。
印前PDF插图尺寸是409*365,有损JPG压缩。61.80%的空间 ...

马大侠能看透本质,只是我对此是一窍不通啊,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有没有解决的办法?
回复

使用道具 举报

 楼主| 发表于 2024-12-1 23:12:51 | 显示全部楼层
heyi 发表于 2024-11-29 20:36
链接: https://pan.baidu.com/s/1Nv1FkKFVy1RGPRifROkdVw?pwd=7i9s

根据楼主提供的2个pdf文件,将普通PDF ...

兄台好手段,只是这种方法我是不会的,跟听天书没区别
回复

使用道具 举报

发表于 2024-12-2 10:27:42 | 显示全部楼层
wubincom 发表于 2024-12-1 23:11
马大侠能看透本质,只是我对此是一窍不通啊,我想知道这种印前PDF是先天不足,还是PDF阅读软件的问题?有 ...

先天不足。没有办法
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-22 09:01 , Processed in 0.218650 second(s), 11 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表