6月2日,微软一次性发布7款由自家团队打造的MAI(Microsoft AI)模型,覆盖推理、代码开发、图像生成、语音生成以及语音转文字等关键能力,并计划通过Microsoft Foundry向企业与开发者开放使用。更重要的是,后续这些模型还会逐步登陆更多开发平台,让组织能够按自身需求调整模型权重与能力边界,减少对单一外部大模型的依赖。
在众多新模型里,最受关注的是旗舰推理模型MAI-Thinking-1。因为推理模型更贴近行业竞逐的“底层通用能力”,可用于复杂问题拆解、数学推理、软件工程以及企业流程自动化等场景。相比之下,代码、图像、语音与转录往往更偏向某一类明确任务。因此,MAI-Thinking-1被业界视为微软建设自研AI底座、补齐关键技术拼图的重要一步。
MAI-Thinking-1采用稀疏专家混合(Mixture of Experts, MoE)架构,活跃参数约350亿,总参数约1万亿级别。其在SWE-Bench Pro软件工程测试中表现可与Claude Opus 4.6相提并论;在AIME 2025与AIME 2026数学测试里分别取得97.0%与94.5%的成绩。微软特别强调,该模型从零开始训练,使用企业级、干净且具商业授权的数据,并且不使用第三方蒸馏方案;同时支持256K Token长上下文、函数调用以及开发者指令。
其余6款模型则更偏“业务型能力”。MAI-Code-1-Flash聚焦开发工具体验,面向GitHub Copilot与Visual Studio Code等场景,用约50亿参数实现较低成本与更高推理效率;MAI-Image-2.5与MAI-Image-2.5-Flash支持文字生成图片和图片编辑;MAI-Voice-2提供15种语言的自然语音生成,还可通过短语音样本进行声音模仿;MAI-Transcribe-1.5主打高准确率语音识别,覆盖43种语言并支持专业术语转录。
除了模型本体,微软同步推出Frontier Tuning(前沿微调)技术,允许企业基于自身工作流程数据进行定制化训练。据介绍,微软在内部测试中发现,若针对Excel工作负载进行调校,模型能力接近GPT-5.4的同时,推理效率最高可提升10倍。未来企业可用自有数据与流程打造专属模型,并更好掌控知识范围与权限边界。