liuyanchen 发表于 2024-11-11 12:19:52

非文本epub格式电子书转PDF

最近发现一本epub格式繁体电子书不仅体积大,还是非文本(图片),无法搜索内容。

想把此书epub转换成PDF版,但转完后发现分页了。
只能将此书的扩展名epub改为rar,然后解压缩。
在OPS文件夹中找到images,将图片合成PDF文件。
再将PDF文件进行OCR处理。
这样此书将成为文本版电子书了!:)

zytxs 发表于 2024-11-11 14:11:42

繁体ocr识别这么准吗

liuyanchen 发表于 2024-11-11 14:57:18

zytxs 发表于 2024-11-11 14:11
繁体ocr识别这么准吗

ABBYY识别繁体字还可以!:)

umn.umn 发表于 2024-11-11 15:45:54

这不校对的话,估计读起来挺费劲的吧

liuyanchen 发表于 2024-11-11 16:15:18

umn.umn 发表于 2024-11-11 15:45
这不校对的话,估计读起来挺费劲的吧

如果转为word校对比较麻烦,但校对是必须的:)
页: [1]
查看完整版本: 非文本epub格式电子书转PDF