找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 1585|回复: 25

[【原创】] DeepSeek + Cherry Studio 搭建本地读秀书籍知识库检索

[复制链接]
发表于 2025-2-6 09:28:14 | 显示全部楼层 |阅读模式
本帖最后由 cocarmc 于 2025-2-6 09:48 编辑

步骤一:部署DeepSeek模型

这里分为两种方式
方式一:注册华为硅基流动账号
好处: 不用本地部署
坏处: 调用华为硅基云端的模型服务。需要一定的费用,但是也不贵。
步骤如下:
1、注册硅基流动(SiliconFlow)账号,登录硅基流动(SiliconFlow)平台。
      https://cloud.siliconflow.cn/i/4AsUyN77
2、在模型广场,选择deepseek-ai/DeepSeek-R1,
3、在账户管理,新建API密钥,并复制得到,下一步在Cherry Studio调用。




方式二:下载Ollama工具
好处: 可以本地部署DeepSeek模型 + Embedding模型。
坏处: 需要一定的电脑配置才行
网上搜索有很多教程。。。


步骤二:下载Cherry Studio工具
安装Cherry Studio 0.9.17,有一个知识库功能,可以使用Cherry Studio 来实现本地知识库。
https://cherry-studio.com/
1、打开Cherry Studio,在设置中选择硅基流动。
2、“添加”中,加入模型deepseek-ai/DeepSeek-R1,填入上次复制的APE密钥。
3、“管理”中,勾选 嵌入模型 BAAI/bge-m3等,在知识库中使用。




4、在Cherry Studio的右侧,进入知识库,添加知识库的名称,比如 读秀书库。
嵌入模型选上次 BAAI/bge-m3。
5、在知识库中选上次添加的 “读秀书库”。
在右侧的目录中,指向 电脑上的 读秀电子书文件夹。右侧显示绿色勾号,就是书库已经导入。
6、可以在下方的 “检索知识库”,检索资料。
7、在Cherry Studio的右侧,进入最上面的助手,选上次新建的模型deepseek-ai/DeepSeek-R1。
可以通过华为硅基平台在线检索,
也可以勾选搜索框的知识库,从知识库里深度检索。












本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×

评分

1

查看全部评分

回复

使用道具 举报

发表于 2025-2-6 09:51:55 | 显示全部楼层
不明觉厉
回复

使用道具 举报

 楼主| 发表于 2025-2-6 10:56:10 | 显示全部楼层

按照图片,走一遍就明白了。
回复

使用道具 举报

发表于 2025-2-6 17:14:50 来自手机 | 显示全部楼层
这读秀书库是什么?是pdf?uvz?sql数据库?
要都是扫描的uvz的话,速度岂不是很慢?
回复 1 0

使用道具 举报

发表于 2025-2-6 17:31:45 | 显示全部楼层
这个本地书库可以识别哪些格式 pdf  word epub uvz?
回复 1 0

使用道具 举报

发表于 2025-2-6 20:47:56 | 显示全部楼层
只能识别文本,应该扫描的都无法识别
回复 1 0

使用道具 举报

发表于 2025-2-8 13:55:27 | 显示全部楼层
需要OCR吧,不然怎么学习,一个个识别太慢了
回复 1 0

使用道具 举报

发表于 2025-2-8 15:50:49 | 显示全部楼层
shutong 发表于 2025-2-6 17:14
这读秀书库是什么?是pdf?uvz?sql数据库?
要都是扫描的uvz的话,速度岂不是很慢? ...

应该只是书名。   那么多书 如果加入知识库  需要多少H100显卡  。
回复 1 0

使用道具 举报

发表于 2025-2-8 16:01:42 来自手机 | 显示全部楼层
看着有点厉害
回复

使用道具 举报

 楼主| 发表于 2025-2-8 16:26:46 | 显示全部楼层
cnbook 发表于 2025-2-8 15:50
应该只是书名。   那么多书 如果加入知识库  需要多少H100显卡  。

文本pdf、doc都可以搜索全文的。
回复

使用道具 举报

发表于 2025-2-8 16:35:32 | 显示全部楼层
谢谢分享!
回复

使用道具 举报

发表于 2025-2-8 17:03:38 | 显示全部楼层
但是图书没有OCR识别不到啊
回复 1 0

使用道具 举报

 楼主| 发表于 2025-2-8 17:21:30 | 显示全部楼层
dyxhl 发表于 2025-2-8 17:03
但是图书没有OCR识别不到啊

ABBYY可以识别为ocr版本啊
回复

使用道具 举报

发表于 2025-2-8 17:51:13 | 显示全部楼层
cocarmc 发表于 2025-2-8 16:26
文本pdf、doc都可以搜索全文的。

10万本书测试过么?训练多久?  
回复 1 0

使用道具 举报

 楼主| 发表于 2025-2-8 19:08:18 | 显示全部楼层
cnbook 发表于 2025-2-8 17:51
10万本书测试过么?训练多久?

这个超星公司才有实力量化几万本书。

一般个人电脑,也就是常用的一些书。
回复

使用道具 举报

发表于 2025-2-8 22:04:30 | 显示全部楼层
ocr过的双层扫描PDF可以用来做知识库检索吗?我做了近1万本双层,个人电脑算力能支持得了吗?
回复

使用道具 举报

发表于 2025-2-8 23:04:09 | 显示全部楼层
这得先把pdfocr了,整个读秀书库下载到桌面再ocr电脑顶不住的
回复 1 0

使用道具 举报

发表于 2025-2-9 00:29:17 | 显示全部楼层
想法是好的,当目前实现起来很有难度……………………
回复

使用道具 举报

发表于 2025-2-9 02:38:23 | 显示全部楼层
phoenix-chu 发表于 2025-2-9 00:29
想法是好的,当目前实现起来很有难度……………………

其实不难,琢磨琢磨就出来了
回复

使用道具 举报

发表于 2025-2-9 07:53:12 | 显示全部楼层
学习学习!!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2025-12-15 00:06 , Processed in 0.097318 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表