找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 1416|回复: 0

[【原创】] PDFTOY批量检查PDF是否OCR及其处理过程

[复制链接]
发表于 2010-8-28 11:20:05 | 显示全部楼层 |阅读模式
方法原理在这里:http://www.readfree.net/bbs/read.php?tid=4967225
Pdftoy中,输入3[\\s]+?Tr,指定文件夹。搜索。会出来结果报告。(不勾选“报告详情”选项。)报告内容是已经OCR的文件及路径。
1、我的文件在E盘。E盘新建文本b,把上述结果报告内容复制到b;
2、D盘新建“pdf”文件夹作为中转站,把E盘指定文件夹的pdf文件全部剪切到D盘pdf文件夹;

3、把下面代码复制到记事本,保存为“D到E.bat”到E盘。
  1. @echo off
  2. for /f "delims=" %%a in (b.txt) do (move "d:\\pdf\\%%~nxa" "%%a")
  3. pause
复制代码

4、运行批处理文件。所有已经OCR文件回到原来文件夹。(有些嵌入图像的文本格式需要再检查。)
5、剩余的,OCR,透明处理,再剪切回去。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-4-28 07:50 , Processed in 0.265341 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表