找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 1560|回复: 5

[【求助】] 巧用Office虚拟打印机,轻松转换超星PDG格式电子书为word

[复制链接]
发表于 2006-6-16 12:30:58 | 显示全部楼层 |阅读模式
不好意思,发错了,题目没出来
重新发
http://yeahfei.bokee.com/4516528.html



================================================
[版主提示] by 孔南
您发帖时没有选择恰当的主题分类。选择精确的分类有利于浏览(图示)。
我已添加主题分类。如对此有异议,可 PM 孔南进行协商
若对 PM 所得到的答复仍不满意,可到网站建设区投诉

参考: 依据读书园地论坛发贴总则 1.8,
会员发帖时需按照所在版块版规选择主题分类。
=================================================
回复

使用道具 举报

发表于 2006-6-16 13:01:44 | 显示全部楼层
代楼主转一下.
巧用Office虚拟打印机,轻松转换超星PDG格式电子书为word关键词Office虚拟打印机 超星                              

   巧用Office虚拟打印机,轻松转换超星PDG格式电子书为word

   我的一位学生写了一帖子,希望发在我的博客上,代转发如下,感觉内容还是蛮有用的.

  越来越发现超星是个好东东。看N多的书都不用掏钱。美中不足的是:一是翻页太慢,等一页打开的工夫能看十来页。二是打印太贵。一页稀稀拉拉几个字,虽说现在打印一张也就三两毛钱,但三两毛也是钱啊,我爹挣钱不容易,哎,省吧。

  实验时间:2006-2-8
  实验环境:ssreader3.9+windowsXP+OFFICE2003
  实验人:鹏飞万里

  我们知道,超星是支持OCR文字识别功能的。点击工具栏“T”样的图标,再选中一页的内容,就能把文字识别出来。






  只是超星程序员的功夫还没练到家。比较下面两段内容:
‘遁币不见”是一个令人惊异的小节日,表演者将白色手巾平滩在桌上.在手巾省小放——枚硬币(图9—17).将手巾的一角提起,折过来遮住硬币,将手巾其余的二角也递次折拢,请一位观众伸出食指,阴着手巾按一铵、那硬m还在于巾之中(团9—18)c、表演者说一声“去”!提起子巾,那52币就
秘诀与准备工作


第六节 遁币不见
一、表演效果
“遁币不见”是一个令人惊异的小节目,表演者将白色手巾平摊在桌上,在手巾当,l ‘放一枚硬币(图9 一17 ) ,将手巾的一角提起,折过来遮住硬币,将手巾其余的三角也递次折拢,请一位观众伸出食指,隔着手巾按一按,那硬币还在手巾之中(图9 一18 ) ,、表演者说一声“去”!提起一手巾,那硬币就踪迹不见,抖一抖,手巾中已没有任何东西了(图9 一19 )。
二、秘诀与准备工作

  上面这两段内容分别是用超星和MS OFFICE 2003的虚拟打印机(Microsoft Office Document Imaging)的OCR文字识别功能识别的一页内容。智商高的人第一段也能看懂,我不行,呵呵!我们要做的就是把超星一本书的内容用虚拟打印机“打印”成图片,再用OCR识别出来。这样阅读和打印起来都比较方便。
预备工作:

  只有2003版的OFFICE 才自带有虚拟打印机,所以,首先你要在机器上装了Office2003。装好后,在“控制面板”-->“打印机和传真”里,我们能看到一台名为“Microsoft Office Document Imaging”的打印机。





  我们开始工作了!
  第一步 当然是先把超星的书下载回来,我下载了一本《中国艺术经典全书--魔术》。
  打开后,点击左面栏“章节目录”,在下拉框中选择“页列表模式”,这样我们能知道要打印多少页。如图。





  第二步:打印设置
  选择“图书”-->“打印”,弹出“打印设置”窗口,设置打印页数和方式。我们只打印目录页和正文页,共137页。其它使用默认设置。如图:




  在弹出的“打印”窗口中,选择微软的虚拟打印机,勾选“打印到文件”复选框。输出路径可以在“首选项”按钮的“高级”选项卡中设定。打印的生成的文件的扩展名是.mdi。






  注意:超星会检测打印名称中是不是含有“image”,“office"等字样,若有,就拒绝打印。所以我们要把打印机的名字改一下。上图中的“超星打印机”就是Microsoft Office Document Imaging 打印机。
  第三步:执行OCR识别功能
  打印完成后,文件将自动打开。






  大致浏览一下,把空白页和图片太多的页删掉。然后在工具栏点击word样的图标,弹出“将文本发送到WORD”窗口,直接确定,MS Office Document Imaging便开始执行文字识别功能,并将识别的内容写入与打印文件相同目录下的同名word文档。





  文字识别执行完成后文档自动打开。这里打开的是一个网页文件,我们将其另存为.doc。
  生成的文件中有乱码是必然的。在排版复杂或图片多的文件中尤其如此。OCR会努力把图片当成文字来识别(呵呵,挺用功的~)通常我们需要要把文中多余的空格和回车删掉。最后,把乱码修改一下,OK,大功告成!

如果灵活应用,应该会给学习,生活和工作带来很大便利.
回复

使用道具 举报

发表于 2006-6-16 15:13:17 | 显示全部楼层
根据我的经验,OCR识别时要根据文本的内容选择中文或英文作为识别语言,这样才会有较好的效果。
回复

使用道具 举报

发表于 2006-6-16 20:23:27 | 显示全部楼层
好像没有PNG转PDF方面,不过还试一下,看看效果!!
回复

使用道具 举报

发表于 2006-7-13 18:49:00 | 显示全部楼层
现在好象已经打不了了,被超星封了
回复

使用道具 举报

发表于 2006-7-13 18:54:05 | 显示全部楼层
引用第4楼魁哥2006-07-13 18:49发表的“”:
现在好象已经打不了了,被超星封了

是吗? 我暂时还没碰到这种情况.
理论上说, 也不该出现这种情况.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-23 17:43 , Processed in 0.115821 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表