免费读者 发表于 2006-3-18 01:06:27

改进pdg文字识别准确率的方法

通常PDG文件用ssreader识别得不是很好,尤其是中文与英文字母混合在一起时。
这个问题一直困扰了很多同学。

偶然发现新版的CAJviewer(6.0以上)的中英文混合识别率相当高,接近99.55%。于是吧原来识别不好的一些图书拿来实验了一把。结果十分满意。
分两步:
一、想一切你所熟悉或熟练的办法将PDG转换为pdf格式;
二、直接用CAJviewer文字识别。

估计效果你会十分满意。Try it !

yzwangyi 发表于 2006-3-18 01:49:53

我是用汉王识别超星,识别率高些!

linjpz 发表于 2006-3-18 19:45:30

我来做个证。正好这几天我CAJviewer6.0识别pdf,效果不错。

tree 发表于 2006-3-19 11:38:14

多谢免费读者能够露面!以前(包括现在)很受益于您的无私奉献!再次表示感谢!

xiaoxing 发表于 2006-3-19 14:39:10

免费读者大侠现身,不来问候说不过去.

yuatian 发表于 2006-3-21 17:38:31

清华 ocr 2000 识别率很高

yuatian 发表于 2006-3-21 17:39:12

清华 ocr 千禧版 识别率很高

免费读者 发表于 2006-3-21 22:42:00

因为课题和单位信息化建设任务比较重,上来的机会不多,谢谢大家的关注

dgwwj 发表于 2006-3-22 09:47:26

呵呵,免费读者大哥好久不见了。

headmaster 发表于 2006-4-4 22:21:14

谢谢免费大侠对书园读者的关注和帮助,但您说的这种方法我试过,效果仍然不理想。上次我先虚拟打印了一本书,然后用CAJ6。0识别,错误太多,最后放弃了。不知道这是因为超星本身的书不清晰还是别的原因,因为我发现用SSREADER3。8识别效果差不多。

两寸小鱼 发表于 2006-4-6 18:43:59

CAJviewer6.0识别pdf,效果属于最好的,原先用汉王,现已放弃.

aaaaaaaaa 发表于 2006-4-8 01:17:19

谢谢回头我去试试

capricorn_ye 发表于 2006-4-8 19:33:17

清华 ocr 千禧版
CAJviewer6.0
哪个好啊?

extra_ks 发表于 2006-4-10 13:26:50

不知道,好象都不怎么样

wyjsxl 发表于 2006-4-18 13:16:05

免费读者献身的机会不多,支持一下。

颠倒梦想 发表于 2006-4-18 15:22:34

不是说caj的那个不是它自己的技术?

lll999888 发表于 2006-4-19 01:12:04

我来做个证。正好这几天我CAJviewer6.0识别pdf,效果不错。

love2008 发表于 2006-4-19 11:51:02

免费读者好像很少来了,很是怀念2003年那段时光。。。。

chenxhong 发表于 2006-4-19 17:21:17

哦 那赶快试试谢谢

jifeibiao 发表于 2006-4-22 22:14:26

谢谢免费大侠对书园读者的关注和帮助
页: [1] 2 3 4 5
查看完整版本: 改进pdg文字识别准确率的方法