找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 955|回复: 12

[【其它】] djvu的魅力与阴影

[复制链接]
shinbade 该用户已被删除
发表于 2011-7-23 01:53:51 | 显示全部楼层 |阅读模式
djvu这种电子书,很早就有收集,不过以前,收到的主要是一些外文的电子书。

最近无意下载了一些中文版的djvu电子书,打开一看,欣喜若狂啊!

这种电子书,不仅体积小,而且十分清晰。不要说比大图,就是清晰pdg恐怕也未必是其对手!顺便,那种10M以内的垃圾PDF咱就不用比了!

可贵的是,这种电子书可以用我使用最多的老马UV来打开!

不过,欣喜之下也有担心。

当djvu的品牌成功了之后,可以预料,大量模糊不清的垃圾也会逐渐充斥其间。中文的世界,悲哀……
回复

使用道具 举报

发表于 2011-7-23 07:17:10 | 显示全部楼层
djvu的ocr功能还很强大,尤其是双层djvu多文件的联索功能,更方便。弊端是准确率和大量祥校的问题。
回复

使用道具 举报

发表于 2011-7-23 10:45:59 | 显示全部楼层
老马有过专门的,不止一篇帖子讲述djvu的利弊
回复

使用道具 举报

发表于 2011-7-23 20:22:46 | 显示全部楼层
老马好像有一篇文章《别了,djvu》
最大缺点就是djvu会有错字。
回复

使用道具 举报

发表于 2011-7-23 20:31:20 | 显示全部楼层
引用第0楼shinbade于2011-07-23 01:53发表的 djvu的魅力与阴影 :
可贵的是,这种电子书可以用我使用最多的老马UV来打开!.......
试了下,至少免费UV不行,杯具!
回复

使用道具 举报

发表于 2011-7-23 20:43:45 | 显示全部楼层
免费uv可以读djuv吧
回复

使用道具 举报

发表于 2011-7-24 00:42:55 | 显示全部楼层
引用第3楼mxqchina于2011-07-23 20:22发表的 :
老马好像有一篇文章《别了,djvu》
最大缺点就是djvu会有错字。
只要是OCR,就会有错别字,不仅仅因为他是djvu。
回复

使用道具 举报

发表于 2011-7-24 08:10:37 | 显示全部楼层
喜乐参半的感觉。
回复

使用道具 举报

发表于 2011-7-24 09:02:57 | 显示全部楼层
但愿不要忽悠可怜的读书人。
回复

使用道具 举报

发表于 2011-7-24 09:18:56 | 显示全部楼层
引用第6楼hoowho于2011-07-24 00:42发表的 :

只要是OCR,就会有错别字,不仅仅因为他是djvu。
DjVu神奇的地方就在于:即使是扫描版,有损JB2压缩对中文也可能产生出错别字,即把没有错字的图片变成有错字的图片。

这是由JB2有损算法本质决定的,理论上无法完全避免,不过提高扫描分辨率、减小宽容系数可以降低出现的概率。

这也是为什么国外自扫界一直提倡先使用300 DPI扫描,软件扩展至600 DPI,然后再转换成DjVu的原因——用高分辨率降低甚至抵消有损风险,这间接造成DjVu版扫描文件看起来更清晰。

其实JB2是从竞争JBig2标准失利的AT&T方案演变来的,PDF支持标准JBig2。所以对于单层、3层DjVu,用DjVuToy转换成PDF文件长度变化不大。

相对来说,分辨率低、宽容系数(压缩比)大的DjVu文件,尤其是中文版扫描文件,可信度就低,如某星的快速版。
回复

使用道具 举报

发表于 2011-7-24 11:48:11 | 显示全部楼层
引用第6楼hoowho于2011-07-24 00:42发表的 :

只要是OCR,就会有错别字,不仅仅因为他是djvu。

这个错别字和ocr没有关系。
回复

使用道具 举报

发表于 2011-7-24 20:36:16 | 显示全部楼层
看来pdf可以取代djvu了
回复

使用道具 举报

shinbade 该用户已被删除
 楼主| 发表于 2011-7-25 00:41:12 | 显示全部楼层
老马兄也来发表观点了!

技术上的内容听不明白。

我有一本只有一个M多的中文电子书,其清晰程度,肉眼看上去超过同等页数,10M以上的PDF。

可能还是制作方面的问题吧。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-11-15 15:21 , Processed in 0.266789 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表