DeepSeek推出新模型数学推理达IMO金牌水平

2025-11-28 11:36:53 第一财经三龙汇之窗网75

11月27日晚，DeepSeek在Hugging Face上开源了一个新模型：DeepSeek-Math-V2。这是一个数学模型，也是目前首个达到IMO金牌水平且开源的模型。

在同步发布的技术论文中，DeepSeek表示Math-V2的部分性能优于谷歌旗下的Gemini DeepThink，并展示了模型在IMO-ProofBench基准以及近期数学竞赛上的表现。具体来看，在Basic基准上，DeepSeek-Math-V2达到了近99%的高分，远胜其他模型，而排在第二的Gemini Deep Think (IMO Gold)分数为89%。但在更难的Advanced子集上，Math-V2分数为61.9%，略逊于Gemini Deep Think (IMO Gold)的65.7%。

在这篇名为《DeepSeek Math-V2：迈向可自验证的数学推理》的论文中，DeepSeek指出大语言模型已经在数学推理方面取得了重大进展，这是人工智能的重要试验台，如果进一步推进，可能会对科学研究产生影响。但当前AI在数学推理方面存在局限：以正确的最终答案作为奖励，正确的答案却不能保证正确的推理。许多数学任务如定理证明需要严格的分步推导，而不是数字答案，这使得最终答案奖励不适用。

为了突破深度推理的极限，DeepSeek认为有必要验证数学推理的全面性和严谨性。团队提出自我验证对于扩展测试时间计算尤为重要，特别是对于那些没有已知解决方案的开放问题。此次推出的Math-V2从结果导向转向了过程导向，展示了强大的定理证明能力。这一模型不依赖大量的数学题答案数据，而是通过教会AI如何像数学家一样严谨地审查证明过程，从而在没有人类干预的情况下不断提升解决高难度数学证明题的能力。

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。三龙汇之窗网对此不承担任何保证责任, 三龙汇之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://www.wlchinajn.com/news/slh1753342.html

更多>同类资讯

资讯图文

女孩为养流浪猫一年“	英国17岁少女在家中被
95后男生写网文还清百	西安高三女生周日在校

今日热榜

投资财经

营销职场

商家产业

网站首页 | 网站地图 | RSS订阅 | SiteMap

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,三龙汇之窗网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎网站处理与建议邮箱：slhzc@qq.com

• 也门万人反以集会人们举枪指天坚定支持黎巴嫩	• 《给阿嬷的情书》可以被复制吗真诚与心力难以
• 浙江多地对福建杨梅进行专项抽查严查违规添加	• 为弟追凶27年姐姐只求凶手偿命二审宣判在即
• 本轮降雨为何如此之强三种系统叠加所致	• 海南支持“一人公司” 最高奖800万鼓励AI创新
• 《给阿嬷的情书》潮汕取景地火了打卡热潮带动	• 现货金银大跌货币政策收紧预期升温
• 广西柳州地震后武警官兵紧急驰援迅速行动抢险	• 夏季出汗排毒养颜是真的吗专家解读适度运动才

DeepSeek推出新模型 数学推理达IMO金牌水平

DeepSeek推出新模型数学推理达IMO金牌水平