找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 539|回复: 28

[【书香茶座】] 新古籍OCR识别算法

[复制链接]
发表于 5 天前 来自手机 | 显示全部楼层 |阅读模式
古联公司全新古籍OCR识别算法于今日推出,版刻古籍准确率突破99%,OCR识别之后无需繁琐校对即可放心进行标点等智能文本整理;书稿抄本古籍等竖排手写体古文献准确率达到95%;

针对古籍图像清晰度低、对比度不稳定、涂改勾画、模糊残缺等客观条件问题,也有极强的抗干扰性,看清古籍不再费眼。

古籍智能整理平台(https://collation.ancientbooks.cn)
古联智能OCR系统(https://ocr.ancientbooks.cn)
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
这网站好像是中华书局的,中华书局的古籍平台似乎玩花招导致字符复制出去都是乱码,我一直没破解

点评

zxd
还有上海古籍的尚古汇典,也亟需您的破解  发表于 5 天前
zxd
加油加油破解!  发表于 5 天前
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
横槊赋诗 发表于 2024-12-17 00:21
这网站好像是中华书局的,中华书局的古籍平台似乎玩花招导致字符复制出去都是乱码,我一直没破解 ...

如果你所在机构买了复制的权限,那就可以复制,每次二百字。
如果没有买复制权限的话,就是文献检索平台,文字人工输入或者ocr。

回复

使用道具 举报

发表于 5 天前 来自手机 | 显示全部楼层
看古籍很不方便,现在能OCR识别还是挺好的
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
测试了一张,识别手写体的效果真的很不错了。比之前好了很多很多。
回复

使用道具 举报

发表于 5 天前 来自手机 | 显示全部楼层
这么厉害的吗?一会儿去试一试
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
看来,OCR前景很好啊
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
是目前最好的,但是要钱,免费一个手机号识别就200页。
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
西屋主人 发表于 2024-12-17 09:18
看来,OCR前景很好啊

如果要做大数据,做中文ai大模型

ocr是必须的,所以现在都在升级ocr模型。
在这之前,古联对不规范的手写体文献支持并不好。
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
dzzabc 发表于 2024-12-17 09:00
这么厉害的吗?一会儿去试一试

这个很厉害的,早几年就已经很有名了,识别率高还能保留原格式,除了贵,没缺点了
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
鬼笔环肽 发表于 2024-12-17 13:23
这个很厉害的,早几年就已经很有名了,识别率高还能保留原格式,除了贵,没缺点了
...

其实贵就是最大的缺点
回复

使用道具 举报

发表于 5 天前 来自手机 | 显示全部楼层
横槊赋诗 发表于 2024-12-17 13:41
其实贵就是最大的缺点

那就要和自己的时间精力比看觉得哪个更值钱了
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
鬼笔环肽 发表于 2024-12-17 15:30
那就要和自己的时间精力比看觉得哪个更值钱了

一页一块钱 一本书动辄几百 而且他也不是100%准确 还是要花时间  校对 。算起来和自己搞差不多,这种是给有资金支持的项目用的,因为可以开票。


回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
cnbook 发表于 2024-12-17 18:03
一页一块钱 一本书动辄几百 而且他也不是100%准确 还是要花时间  校对 。算起来和自己搞差不多,这种是给 ...

中国哲学书电子化计划和搜韵网可以先部署这个ai
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
投入时间与精力,成本应该还有带宽什么的,如果想正惠及大众,估计精度会打折扣。
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
cnbook 发表于 2024-12-17 18:03
一页一块钱 一本书动辄几百 而且他也不是100%准确 还是要花时间  校对 。算起来和自己搞差不多,这种是给 ...

这种ocr模型如果部署到本地的话,几十万。不是个人能使用的,
基本上是需要单位去做的。
如果需要专业语料的训练,就必须要有自己的大数据库。
个人的力量有限,有些东西必须要靠大量人的参与。


回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
小可拉好 发表于 2024-12-17 18:39
这种ocr模型如果部署到本地的话,几十万。不是个人能使用的,
基本上是需要单位去做的。
如果需要专业语 ...

搜韵据说一年赔二十万


不过搜韵似乎有后台,可能是陈永正
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
横槊赋诗 发表于 2024-12-17 18:42
搜韵据说一年赔二十万
这个是什么事情


回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
真有这么高?太厉害了吧?现在的印刷体都不见得有这么高识别率
回复

使用道具 举报

发表于 5 天前 | 显示全部楼层
测试了一份手写体,效果真的不错!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-22 10:54 , Processed in 0.270055 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表