12月30日,騰訊混元發文宣佈正式開源翻譯模型1.5版本,共包含兩個模型:Tencent-HY-MT1.5-1.8B和Tencent-HY-MT1.5-7B,支持33個語種互譯以及5種民漢/方言,除了中文、英語、日語等常見語種,也包含捷克語、馬拉地語、愛沙尼亞語、冰島語等小語種。目前兩個模型均已在騰訊混元官網上線,在Github和Huggingface等開源社區也可直接下載使用。
HY-MT1.5-1.8B主要面向手機等消費級設備場景,經過量化,支持端側直接部署和離線實時翻譯,僅需1GB內存即可流暢運行。HY-MT1.5-1.8B 的參數規模只有 1.8B,量化後僅需約 1GB 內存,和一款常見手機應用體量大致相同。在參數量極小的前提下,在多項主流翻譯測試集中,它的整體表現已經達到超大尺寸閉源模型的90 分位水平,明顯領先同尺寸開源模型與主流商用翻譯 API。同時,模型也體現出了極致的效率和性價比,與主流商用翻譯模型API對比,HY-MT1.5-1.8B 推理速度更快,處理50個tokens的平均耗時只有0.18秒,其他模型的時間在0.4秒左右。
HY-MT1.5-7B模型效果相比前一版本效果有較大提升,是此前獲得WMT25比賽30個語種翻譯冠軍模型的升級版,重點提升了翻譯準確率,大幅減少了譯文中夾帶註釋和語種混雜的情況,實用性進一步增加。
在部分用戶實際使用場景下,混元翻譯1.8B和7B兩個尺寸模型同時使用,可以實現端側和雲側模型的協同部署,提升模型的效果的一致性和穩定性。
據介紹,騰訊混元翻譯模型此前不僅在國際機器翻譯比賽拿下30個第1名,也在首次開源一周內便登上了HuggingFace 模型趨勢榜第一位。目前,混元翻譯模型已經在騰訊內部多個業務場景落地應用,包括騰訊會議、企業微信、QQ瀏覽器、客服翻譯等。
關注同花順財經(ths518),獲取更多機會