[转帖]Acrobat XI 软件功能使用介绍（三）文本OCR

akever · 发表于 2014-2-25 06:27:16

Acrobat XI 软件功能使用介绍（三）文本OCR
http://adobefans.diandian.com/post/2012-12-10/40047122495

很多人再使用PDF文件时需要将格式转成Word，但是其中有很多文件是由扫描生成的PDF（既图片）。这类文件就算转换成了Word依然保持图片形式，不能编辑内容。这里就可以使用Acrobat自带的文本OCR功能，将扫描图片转换成可以编辑的矢量文字。

除了Acrobat，还有很多OCR的软件，但是国产的软件基本只能支持英文和中文，Acrobat的最大优势就是支持多国语言的OCR。再识别精度上每个版本也不断提高。

http://m1.img.papaapp.com/farm4/ ... 500_900_234_462.PNG

手动识别：

打开一个扫描生成的PDF文件。

Acrobat 9：菜单“文档》OCR文本识别》使用OCR识别文本”。

Acrobat X/XI：在“工具》识别文本》在文本中”

http://m3.img.papaapp.com/farm4/ ... 500_900_424_428.PNG

在弹出的对话框中点击“编辑”，可以对识别进行设置。

OCR识别的主要语言：多国语言支持，请尽量选择文字占有量最多的语言。不然容易出现识别错误。

PDF输出样式：“可搜索图像”，识别后原图片会保留，在图片上方会出现识别后的矢量文字，同时会自动将旋转的扫描文件摆正。“可搜索图像（精确）”，功能同前者，但是不会摆正文件。“CleraScrn”，原始图片删除，只保留识别后的文字。

确定后，图片就会识别成矢量文字，可以复制黏贴，可以转成Word。但是这里并不能保证每个字都一模一样。识别受到扫描精确程度的影响。

http://m1.img.papaapp.com/farm4/ ... 500_900_500_343.PNG

自动识别：

主要有两种方法，针对图片或者批量转换操作。

将图片转换成PDF时自动识别：在将图片转成PDF时（将图片拖动到Acrobat的图标中），软件会弹出提示框，是否要自动进行文字OCR。

当点击“是”，图片会转成PDF并且自动OCR

将图片PDF转换成Word：以前已经给大家讲过PDF保存成Word的方法，其实在保存成Word时，设置参数中，就已经勾选了文本OCR，存成Word的过程中，软件已经自动帮助你识别了文字（Acrobat 9没有这个功能）。

我们还可以通过动作的方式进行批量化的操作，在以后的文章中我会再说明。

		自动登录	找回密码
密码			注册

[【其它】] [转帖]Acrobat XI 软件功能使用介绍（三）文本OCR