DeepSeek上线识图模式视觉理解新突破

2026-04-30 02:23:36 观察者网三龙汇之窗网19

4月28日上午，DeepSeek多模态团队研究员陈小康在X账号@PKUCXK上发布了一条推文：“Soon, we see you. ?”，配图是两只蓝色的小鲸鱼，左边那只戴着画有“XX”的黑色眼罩，右边那只没戴眼罩、正常露出眼睛。尽管这条推文很快被删除，但可能暗示DeepSeek的多模态功能即将上线。

此外，有用户截图显示，chat.deepseek.com输入框上方曾出现过三个并列的标签——除了原有的“快速模式”和“专家模式”，还多出了一个“识图模式”，鼠标悬停后提示“图片理解功能内测中”。这是DeepSeek出圈以来第一次在主线产品里把视觉理解作为独立模式呈现。不过这个标签并不是所有用户都能看到，目前也无法确认它是常态化的灰度内测还是短暂开放后又被回收，官方至今没有对外说明。

根据该用户的测试信息，在试图模式里，用户上传了一张人物照片并提问“这是什么动作姿势”。DeepSeek思考8秒后，先按位置、手臂、头部、头发、着装、光影逐项拆解了画面，再给出最终判断：这是摄影和社交媒体语境里的“慵懒风躺姿”或“清冷氛围感姿势”，常出现在小红书、抖音的“宅家”、“慵懒风”、“清冷感”等标签下。值得注意的是，这段思考过程中有一步明确的“自我修正考虑”，模型先列出其他可能的解读，再判断“慵懒氛围感姿势”是最能涵盖所有细节的描述，最后输出。这种结构化拆解、自我复核加文化语境识别的组合，已经超出DeepSeek过去主线产品上的“图片识文字”能力层次。

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。三龙汇之窗网对此不承担任何保证责任, 三龙汇之窗网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://www.wlchinajn.com/news/slh1767428.html

更多>同类资讯

资讯图文

女孩为养流浪猫一年“	英国17岁少女在家中被
95后男生写网文还清百	西安高三女生周日在校

今日热榜

投资财经

营销职场

商家产业

网站首页 | 网站地图 | RSS订阅 | SiteMap

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,三龙汇之窗网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎网站处理与建议邮箱：slhzc@qq.com

• 女子购止血药被骑手偷拍还公布住址隐私泄露引	• 麻醉师中途离开致患者昏迷三个月医疗疏忽酿悲
• 男子借宿同学家致一死一伤案取消开庭因换律师	• 强奸大嫂案见义勇为者家属索赔132万恶魔伏法争
• 特朗普当查尔斯面和妻子开夫妻玩笑尴尬时刻引	• 连月相都严格考据的抗战剧有多绝人民视角下的
• 冥王星降级20年为何美国有人想翻案科学与情感	• 特朗普称乌克兰在军事上已败普京愿达成协议
• 男子应聘店长时因乙肝携带被拒录用平等就业权	• 王腾称加仓了小米股票看好小米新增长点

DeepSeek上线识图模式 视觉理解新突破

DeepSeek上线识图模式视觉理解新突破