找回密码
 注册
搜索
热搜: 超星 读书 找书
楼主: kqvtkdss

[【其它】] 终于知道这里为什么叫文本pdg了,而且你们不喜欢

[复制链接]
 楼主| 发表于 2017-5-19 22:28:03 | 显示全部楼层
agent124 发表于 2017-5-19 22:07
文本应该是王道。但是文本pdg转html还是错误很多,调校颇为吃力

可能你们理解的文本,超星的“文本版”前期的自己ocr的双层PDF,有错别字,而且排版很难看,这个不是很好。
而现在的新书,超星还有部分文本版不错(常常90字头的),是出版社授权的印前PDF,显示的PDF阅读,可以用超星5.4阅读,然后获取报文,用传统的BBT方法可以下载下来,但是单页的pdg的体积较大,需要用pd2pic中文本转换工具转换为PDF,然后用PDF软件合并,合并后就小很多。这类书是矢量高清的,这样的书很好,可惜还没自动的下载工具。和你们理解的有所差别吧
回复

使用道具 举报

发表于 2017-5-19 22:36:15 | 显示全部楼层
本帖最后由 agent124 于 2017-5-19 22:46 编辑
kqvtkdss 发表于 2017-5-19 22:28
可能你们理解的文本,超星的“文本版”前期的自己ocr的双层PDF,有错别字,而且排版很难看,这个不是很好 ...


即使不是ocr的文本pdg,虽然在acrobat里阅读正常,但是转成html或者txt会有很多排版上的错误或者错别字。文本pdf毕竟还是pdf,体积太大,不如文本轻巧。而且,pdf在kindle上的阅读效果太差,只能转成epub。当然,这是我个人的需求。
至于“自动的下载工具”,首先因为报文要一本本获取,所以自动批量下载的软件估计比较困难。而如果是一本本下载,用超星阅读器+抓包工具+棒棒糖/其他类似工具就能下载了,和下载普通包库差不多(棒棒糖虽然可以自动抓报文,但有时也会失效),稍微复杂了一点点而已。做“一键下载”的工具,个人认为不太必要。因为花时间精力做一个和现有工具功能差不多的东西,不是太合算,除非是特意想学有关的技术。此外,“一键下载”,我总持保留看法。因为越是“傻瓜”的软件,虽然实现基本操作很方便,但往往是以牺牲灵活性为代价的。当然,功能的灵活性和使用上的简便程度总会有矛盾,软件设计上需要tradeoff的考量。但是软件过于“聪明”,反而会产生意想不到的问题。所以个人不是太喜欢太“傻瓜”的软件。
回复

使用道具 举报

 楼主| 发表于 2017-5-19 22:52:21 | 显示全部楼层
agent124 发表于 2017-5-19 22:36
即使不是ocr的文本pdg,虽然在acrobat里阅读正常,但是转成html或者txt会有很多排版上的错误或者错别字 ...

你的理解也是对的,主要是侧重点不一样吧,要这种的话 最好还是去下载azw3 epub mobi这些客户阅读断的书籍,都是可以直接复制的,主要是针对文史类 ,而书世界的书是PDF是原版,对于非文本图文混排的比较好,公式其他符号可以完美显示,而超星的扫描书,其最大的好处是和原书一样,但带来的问题就是版权这些,盗版
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-5-3 08:29 , Processed in 0.297378 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表