找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 400|回复: 0

[【其它】] [转帖]Acrobat XI 软件功能使用介绍(三)文本OCR

[复制链接]
发表于 2014-2-25 06:27:16 | 显示全部楼层 |阅读模式
Acrobat XI 软件功能使用介绍(三)文本OCR
http://adobefans.diandian.com/post/2012-12-10/40047122495


很多人再使用PDF文件时需要将格式转成Word,但是其中有很多文件是由扫描生成的PDF(既图片)。这类文件就算转换成了Word依然保持图片形式,不能编辑内容。这里就可以使用Acrobat自带的文本OCR功能,将扫描图片转换成可以编辑的矢量文字。

除了Acrobat,还有很多OCR的软件,但是国产的软件基本只能支持英文和中文,Acrobat的最大优势就是支持多国语言的OCR。再识别精度上每个版本也不断提高。

http://m1.img.papaapp.com/farm4/ ... 500_900_234_462.PNG

手动识别:

打开一个扫描生成的PDF文件。

Acrobat 9:菜单“文档》OCR文本识别》使用OCR识别文本”。

Acrobat X/XI:在“工具》识别文本》在文本中”


http://m3.img.papaapp.com/farm4/ ... 500_900_424_428.PNG

在弹出的对话框中点击“编辑”,可以对识别进行设置。




OCR识别的主要语言:多国语言支持,请尽量选择文字占有量最多的语言。不然容易出现识别错误。

PDF输出样式:“可搜索图像”,识别后原图片会保留,在图片上方会出现识别后的矢量文字,同时会自动将旋转的扫描文件摆正。“可搜索图像(精确)”,功能同前者,但是不会摆正文件。“CleraScrn”,原始图片删除,只保留识别后的文字。

确定后,图片就会识别成矢量文字,可以复制黏贴,可以转成Word。但是这里并不能保证每个字都一模一样。识别受到扫描精确程度的影响。


http://m1.img.papaapp.com/farm4/ ... 500_900_500_343.PNG

自动识别:

主要有两种方法,针对图片或者批量转换操作。

将图片转换成PDF时自动识别:在将图片转成PDF时(将图片拖动到Acrobat的图标中),软件会弹出提示框,是否要自动进行文字OCR。


当点击“是”,图片会转成PDF并且自动OCR

将图片PDF转换成Word:以前已经给大家讲过PDF保存成Word的方法,其实在保存成Word时,设置参数中,就已经勾选了文本OCR,存成Word的过程中,软件已经自动帮助你识别了文字(Acrobat 9没有这个功能)。

我们还可以通过动作的方式进行批量化的操作,在以后的文章中我会再说明。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-23 08:15 , Processed in 0.179033 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表