挑战主流认知！蚂蚁、人大发布行业首个原生MoE扩散语言模型将于近期开源-古榕树下原创文学网站

挑战主流认知！蚂蚁、人大发布行业首个原生MoE扩散语言模型将于近期开源

时间：2025-09-12 10:46:01

9月12日消息，9月11日，在2025Inclusion外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型（dLLM）LLaDA-MoE。

挑战主流认知！蚂蚁、人大发布行业首个原生MoE扩散语言模型将于近期开源

中国人民大学高瓴人工智能学院副教授李崇轩，蚂蚁集团通用人工智能研究中心主任、西湖大学特聘研究员、西湖心辰创始人蓝振忠参与了发布仪式。

据介绍，这款新模型通过非自回归的掩码扩散机制，首次通过原生训练的MoE在大规模语言模型中实现了与Qwen2.5相当的语言智能（如上下文学习、指令遵循、代码和数学推理等），挑战了语言模型必须自回归的主流认知。

实现数据显示，LLaDA-MoE模型性能效果在代码、数学、Agent等任务上领先于LLaDA1.0/1.5和Dream-7B等扩散语言模型，接近或超越了自回归模型 Qwen2.5-3B-Instruct，仅激活 1.4B 参数即可实现等效3B稠密模型的性能。

值得一提的是，据蓝振忠介绍，除模型权重外，蚂蚁还将同步开源针对 dLLM 并行特性深度优化的推理引擎。

相比 NVIDIA 官方 fast-dLLM，该引擎实现了显著加速。相关代码与技术报告将于近期在 GitHub 及 Hugging Face 社区同步发布。

据介绍，蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型（dLLM) LLaDA-MoE，在约20T数据上完成了从零训练MoE架构的扩散语言模型，验证了工业级大规模训练的扩展性和稳定性；

效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B，比肩等效自回归模型，并保有数倍的推理速度优势。

模型将在近期完全开源，以推动全球AI社区在dLLM上的技术发展。

挑战主流认知！蚂蚁、人大发布行业首个原生MoE扩散语言模型将于近期开源