使用道具 举报
引用第2楼agent124于2015-06-18 10:54发表的 : 既然ocr了就是文本了,为啥还要用pdf?pdf不是适合搜索的。既然是文本,可以转成txt,全文搜索效果最好大概是专门的全文搜索软件(主要是汉语的断词比较麻烦),一般的用windows search也够了。如果只是找关键词,搜索速度最快的是sql server,如果不想为了搜索专门装这个大家伙,可以用UltraEdit,速度也挺快。 另外,楼主说用微软的office做ocr的。个人经验,准确率还是ABBYY Fine Reader高些。楼主说没有校对,那么肯定有无数错字,影响到检索结果的精确性。
本版积分规则 发表回复 回帖后跳转到最后一页
Archiver|手机版|小黑屋|网上读书园地
GMT+8, 2024-11-17 21:45 , Processed in 0.176590 second(s), 18 queries .
Powered by Discuz! X3.5
© 2001-2024 Discuz! Team.