小米大模型 三款新品发布引领智能革新【两砚网】

小米大模型 三款新品发布引领智能革新

   2026-03-19 14:23:34 北京商报两砚网11
核心提示:3月19日,小米大模型团队发布了MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款大模型。Xiaomi MiMo-V2-Pro是小米面向Agent时代的旗舰基座模型,专为现实世界中高强度的Agent工作场景而设计

3月19日,小米大模型团队发布了MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款大模型。

Xiaomi MiMo-V2-Pro是小米面向Agent时代的旗舰基座模型,专为现实世界中高强度的Agent工作场景而设计。该模型拥有超过1T的总参数量(42B激活参数),采用创新的混合注意力架构,并支持1M超长上下文长度。在强大的模型基座上,小米进一步拓展了智能的动作空间,实现了从Coding到Claw的重要泛化。在全球权威大模型综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八,国内第二。

MiMo-V2-Omni是小米面向Agent时代的全模态基座模型,旨在应对现实世界中复杂的多模态交互与执行场景。小米从底层构建了融合文本、视觉、语音的全模态基座,并以统一架构将“感知”与“行动”深度绑定。这不仅打破了传统模型“重理解、轻执行”的局限,还让模型原生具备了多模态感知、工具调用、函数执行及GUI操作能力。MiMo-V2-Omni可无缝接入各种Agent框架,实现了从理解到操控的跨越,大幅降低了全模态Agent的落地门槛。

Xiaomi MiMo-V2-TTS是小米自主研发的语音合成大模型。基于自研Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练与多维度强化学习,实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS支持从整体风格定调到局部情绪表达的精准调节,能在同一句话内完成语气转折和情感递变;真实还原人类说话的自然韵律;在唱歌时,也能准确表达音高和节奏,自然且富有表现力。

 
免责声明:以上所展示的信息由网友自行发布,内容的真实性、准确性和合法性由发布者负责。 两砚网对此不承担任何保证责任, 两砚网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张(包括但不限于侵犯著作权、商业信誉等),请与我们联系并出示相关证据,我们将按国家相关法规即时移除。

本文地址:http://news.liangyankj.com/news/263785.html

收藏 0打赏 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行

免责声明:本站所有信息均来自互联网搜集,产品相关信息的真实性准确性均由发布单位及个人负责,请大家仔细辨认!并不代表本站观点,两砚网对此不承担任何相关法律责任!如有信息侵犯了您的权益,请告知,本站将立刻删除。
友情提示:买产品需谨慎
网站处理与建议:wfmyw@qq.com