3月19日消息,一度被全网猜测为DeepSeek V4的“神秘模型”,最终被小米“认领”。此前OpenRouter平台低调上线两款未署名大模型"Hunter Alpha"和"Healer Alpha",因性能优秀而被被猜测为DeepSeek的新模型,目前已被证实为小米MiMo-V2系列模型的早期测试版本。
该系列包含三款定位不同的产品。据介绍,MiMo-V2-Pro定位为文本基座模型,专注于推理、规划与工具调用能力;MiMo-V2-Omni整合文本、视觉与音频多模态能力;MiMo-V2-TTS则聚焦语音合成技术,为智能体提供情感化语音输出。三款产品共同构成小米的"全栈式智能体解决方案"。
小米CEO雷军表示:"我们刚发布万亿参数大模型MiMo-V2-Pro,在全球大模型综合智能排行榜Artificial Analysis上位列全球第八,按品牌排名全球第五,超过了xAI Grok。我们的模型刚刚完成,未来还会快速迭代增强。"他透露,小米在AI领域相对低调,但实际进展可能比外界预期更快,2024年AI研发和资本投入将超过160亿元。"我相信,只要坚持持续投入,小米在AI时代一定会交出一份靓丽的答卷。"
小米MiMo大模型负责人罗福莉在社交平台透露,基础模型训练始于数月前,采用混合注意力机制和百万级上下文窗口设计。她表示,团队在开发过程中经历了从对话模型到智能体范式的快速转型,并通过强制使用政策推动团队适应新技术。(袁宁)