找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 853|回复: 12

[【其它】] jpg也是可以OCR的

[复制链接]
发表于 2009-10-25 10:40:35 | 显示全部楼层 |阅读模式
在读秀里,小部分文字可以摘录是个功德无量的善举,让阅读者引用起来非常方便。

以前印象中只有PNG格式,OCR还有全文检索都是可行的。对于那种白晃晃的拍摄图片制成的书页,自己想当然地以为是不能检索的,其实那种文献自己也确实一直没有检索到过自己想要的那一页,所以对这它的OCR一下的念头也是没有的,而且厌恶JPG格式,庞大而臃肿而模糊。

刚才一边逛论坛,停下时做一下手头的活,把JPG格式的页面也OCR了一下,文字竟然也出来了。原来JPG是可以OCR的。
回复

使用道具 举报

发表于 2009-10-25 11:23:05 | 显示全部楼层
很多JPG页面遇到主要的问题是清晰度不足,导致OCR的错误率太高。

所以,应该在OCR之前,对页面作一些处理, 提高文字清晰度。推荐用老马的软件“ComicEnhancerPro”。
回复

使用道具 举报

发表于 2009-10-25 12:23:02 | 显示全部楼层
jpg的本来就可以识别的。不过个人觉得除非想炒,识别那么多干什么呢,好好看书就可以了。
回复

使用道具 举报

发表于 2009-10-25 13:19:55 | 显示全部楼层
确实是清晰度太低,错误度太高
回复

使用道具 举报

发表于 2009-10-25 21:29:59 | 显示全部楼层
不知楼主用的什么软件OCR的。
对于一些专业的OCR软件,BMP, JPEG,TIF,GIF,PNG......甚至PDF都会支持的。
回复

使用道具 举报

发表于 2009-10-25 21:52:17 | 显示全部楼层
刚下载了老马的软件,准备有空时试一下。
回复

使用道具 举报

发表于 2009-10-25 21:54:42 | 显示全部楼层
不在于格式,在于清晰度啊
回复

使用道具 举报

发表于 2009-10-26 00:06:15 | 显示全部楼层
大家都用什么软件OCR JPG?
回复

使用道具 举报

发表于 2009-11-7 17:06:57 | 显示全部楼层
引用第6楼killl于2009-10-25 21:54发表的 :
不在于格式,在于清晰度啊

赞同。只要需要,没什么格式不能OCR。
回复

使用道具 举报

发表于 2009-11-7 17:51:45 | 显示全部楼层
学习了,请老师们多交流、指导这些基本的文件处理方法软件之类的哈。
回复

使用道具 举报

发表于 2009-11-7 18:33:37 | 显示全部楼层
应该说是对比度决定了识别率的高低
回复

使用道具 举报

发表于 2009-11-7 23:28:16 | 显示全部楼层
效果貌似很差。
回复

使用道具 举报

发表于 2009-11-7 23:39:39 | 显示全部楼层
引用第7楼逐风者于2009-10-26 00:06发表的 :
大家都用什么软件OCR JPG?
老马+汉王
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-9-24 00:21 , Processed in 0.139313 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表