微软这次太猛了！7款自研MAI模型上线：推理+写代码+出图出声全部打包？

6月2日，微软一次性发布7款由自家团队打造的MAI（Microsoft AI）模型，覆盖推理、代码开发、图像生成、语音生成以及语音转文字等关键能力，并计划通过Microsoft Foundry向企业与开发者开放使用。更重要的是，后续这些模型还会逐步登陆更多开发平台，让组织能够按自身需求调整模型权重与能力边界，减少对单一外部大模型的依赖。

在众多新模型里，最受关注的是旗舰推理模型MAI-Thinking-1。因为推理模型更贴近行业竞逐的“底层通用能力”，可用于复杂问题拆解、数学推理、软件工程以及企业流程自动化等场景。相比之下，代码、图像、语音与转录往往更偏向某一类明确任务。因此，MAI-Thinking-1被业界视为微软建设自研AI底座、补齐关键技术拼图的重要一步。

MAI-Thinking-1采用稀疏专家混合（Mixture of Experts, MoE）架构，活跃参数约350亿，总参数约1万亿级别。其在SWE-Bench Pro软件工程测试中表现可与Claude Opus 4.6相提并论；在AIME 2025与AIME 2026数学测试里分别取得97.0%与94.5%的成绩。微软特别强调，该模型从零开始训练，使用企业级、干净且具商业授权的数据，并且不使用第三方蒸馏方案；同时支持256K Token长上下文、函数调用以及开发者指令。

其余6款模型则更偏“业务型能力”。MAI-Code-1-Flash聚焦开发工具体验，面向GitHub Copilot与Visual Studio Code等场景，用约50亿参数实现较低成本与更高推理效率；MAI-Image-2.5与MAI-Image-2.5-Flash支持文字生成图片和图片编辑；MAI-Voice-2提供15种语言的自然语音生成，还可通过短语音样本进行声音模仿；MAI-Transcribe-1.5主打高准确率语音识别，覆盖43种语言并支持专业术语转录。

除了模型本体，微软同步推出Frontier Tuning（前沿微调）技术，允许企业基于自身工作流程数据进行定制化训练。据介绍，微软在内部测试中发现，若针对Excel工作负载进行调校，模型能力接近GPT-5.4的同时，推理效率最高可提升10倍。未来企业可用自有数据与流程打造专属模型，并更好掌控知识范围与权限边界。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Related Posts