12月30日消息,今日,腾讯混元宣布正式开源翻译模型1.5版本,共包含两个模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B。
目前,两个模型均已在腾讯混元官网上线,在Github和Huggingface等开源社区也可直接下载使用。
据了解,该版本支持33个语种互译以及5种民汉/方言,除中文、英语、日语等常见语种,也包含捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

其中,HY-MT1.5-1.8B主要面向手机等消费级设备场景,经过量化,支持端侧直接部署和离线实时翻译,仅需1GB内存即可流畅运行,并且在参数量极小的前提下,效果超过了大部分商用翻译API。
同时,模型也体现出了极致的效率和性价比,与主流商用翻译模型API对比,HY-MT1.5-1.8B 推理速度更快,处理50个tokens的平均耗时只有0.18秒,其他模型的时间在0.4秒左右。
以下为混元Tencent-HY-MT1.5-1.8B与苹果iPhone自带离线翻译的结果对比:

HY-MT1.5-7B模型效果相比前一版本效果有较大提升,是此前获得WMT25比赛30个语种翻译冠军模型的升级版,重点提升了翻译准确率,大幅减少了译文中夹带注释和语种混杂的情况,实用性进一步增加。
官方表示,在部分用户实际使用场景下,混元翻译1.8B和7B两个尺寸模型同时使用,可以实现端侧和云侧模型的协同部署,提升模型的效果的一致性和稳定性。



