PDFTOY批量检查PDF是否OCR及其处理过程

lxh623 · 发表于 2010-8-28 11:20:05

方法原理在这里：http://www.readfree.net/bbs/read.php?tid=4967225
Pdftoy中，输入3[\\s]+?Tr，指定文件夹。搜索。会出来结果报告。（不勾选“报告详情”选项。）报告内容是已经OCR的文件及路径。
1、我的文件在E盘。E盘新建文本b，把上述结果报告内容复制到b；
2、D盘新建“pdf”文件夹作为中转站，把E盘指定文件夹的pdf文件全部剪切到D盘pdf文件夹；

3、把下面代码复制到记事本，保存为“D到E.bat”到E盘。

@echo off
for /f "delims=" %%a in (b.txt) do (move "d:\\pdf\\%%~nxa" "%%a")
pause

复制代码

4、运行批处理文件。所有已经OCR文件回到原来文件夹。（有些嵌入图像的文本格式需要再检查。）
5、剩余的，OCR，透明处理，再剪切回去。

		自动登录	找回密码
密码			注册

[【原创】] PDFTOY批量检查PDF是否OCR及其处理过程