改进pdg文字识别准确率的方法
通常PDG文件用ssreader识别得不是很好,尤其是中文与英文字母混合在一起时。这个问题一直困扰了很多同学。
偶然发现新版的CAJviewer(6.0以上)的中英文混合识别率相当高,接近99.55%。于是吧原来识别不好的一些图书拿来实验了一把。结果十分满意。
分两步:
一、想一切你所熟悉或熟练的办法将PDG转换为pdf格式;
二、直接用CAJviewer文字识别。
估计效果你会十分满意。Try it ! 我是用汉王识别超星,识别率高些! 我来做个证。正好这几天我CAJviewer6.0识别pdf,效果不错。 多谢免费读者能够露面!以前(包括现在)很受益于您的无私奉献!再次表示感谢! 免费读者大侠现身,不来问候说不过去. 清华 ocr 2000 识别率很高 清华 ocr 千禧版 识别率很高 因为课题和单位信息化建设任务比较重,上来的机会不多,谢谢大家的关注 呵呵,免费读者大哥好久不见了。 谢谢免费大侠对书园读者的关注和帮助,但您说的这种方法我试过,效果仍然不理想。上次我先虚拟打印了一本书,然后用CAJ6。0识别,错误太多,最后放弃了。不知道这是因为超星本身的书不清晰还是别的原因,因为我发现用SSREADER3。8识别效果差不多。 CAJviewer6.0识别pdf,效果属于最好的,原先用汉王,现已放弃. 谢谢回头我去试试 清华 ocr 千禧版
CAJviewer6.0
哪个好啊? 不知道,好象都不怎么样 免费读者献身的机会不多,支持一下。 不是说caj的那个不是它自己的技术? 我来做个证。正好这几天我CAJviewer6.0识别pdf,效果不错。 免费读者好像很少来了,很是怀念2003年那段时光。。。。 哦 那赶快试试谢谢 谢谢免费大侠对书园读者的关注和帮助