林俊旸从阿里离职后首发长文 展望AI智能体时代【两砚网】

林俊旸从阿里离职后首发长文 展望AI智能体时代

   2026-03-27 01:35:35 第一财经两砚网11
核心提示:3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,详述了他对大模型发展路线的理解及对AI下一阶段的预判。他认为过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,“思考”可以成为一种被训练出来的能力

3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,详述了他对大模型发展路线的理解及对AI下一阶段的预判。他认为过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,“思考”可以成为一种被训练出来的能力。DeepSeek-R1 证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要,但2025年上半年,行业焦点主要停留在“推理式思考”本身:如何让模型在推理时多想一会儿。他判断下一步是智能体式思考:为了行动而思考,在与环境交互过程中,并根据来自世界的反馈持续更新计划。

林俊旸提到,2025年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向,但合并说起来容易,做好却极难。真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:“思考”行为变得嘈杂、冗余或不够果断,而“指令”行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。

分开做在实践中仍然有吸引力。2025年下半年,Qwen 的2507版本发布了独立的Instruct和Thinking版本,30B和235B各一套。他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。推理链更长并不等于模型更聪明,很多时候,推理链越长,反而说明模型在乱花算力。千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,其定义特征是跟真实世界的闭环交互。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。 两砚网对此不承担任何保证责任, 两砚网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。

本文地址:http://news.liangyankj.com/news/264835.html

收藏 0打赏 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行

免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,两砚网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站处理与建议:wfmyw@qq.com