找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 48|回复: 1

[【其它】] 科技: AI 只能完成高等数学新测试问题的不到 2%

[复制链接]
发表于 2024-11-15 08:19:21 | 显示全部楼层 |阅读模式
基于大模型的 AI 系统如 GPT-4 和 Gemini 1.5 Pro 能以九成以上的正确率完成传统数学测试问题。但如果设计出一种全新的、大模型不可能训练过的数学难题呢?包括菲尔兹奖得主陶哲轩和 Timothy Gowers 在内的 60 多名数学家合作编写了数百道原创研究级数学难题,推出了新的高等数学基准测试 FrontierMath。这些问题非常具有挑战性,陶哲轩称需要相关领域研究生级别的专业人士合作才能完成。问题被设计为防猜测,如果没有正确的数学推理能力,它们是不可能解出的。顶级的 AI 系统只能完成不到 2% 的 FrontierMath 问题,显示它们的推理能力有局限性。

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-11-15 09:17:43 | 显示全部楼层
是不是可以理解能研究出来2%也不错了?毕竟节约了部分的人力物力
以后是不是有可能先让AI过一遍
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-12-23 09:42 , Processed in 0.150855 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表