腾讯混元团队 投稿量子位 | 公众号 QbitAI离线翻译这件事正在从“能用”走向“好用”。对出国旅行、跨境办公和本地阅读来说翻译工具一旦依赖联网就很容易在弱网、无网或隐私敏感场景里掉链子。但把翻译大模型真正塞进手机又会遇到内存和算力限制模型太大、推理太慢都很难常驻本地。为应对这一挑战腾讯混元团队刚刚开源了一份硬核解决方案推出极致量化压缩版本翻译模型Hy-MT1.5-1.8B-1.25bit把支持33种语言的翻译大模型压缩至440MB。无需联网下载后即可在手机本地运行。官方测试显示其翻译质量优于谷歌翻译。△高通骁龙8658GB内存基于混元翻译大模型Hy-MT1.5打造翻译效果比肩商业翻译模型Hy-MT1.5是腾讯混元团队打造的专业翻译大模型原生支持33种语言、5种方言/民汉及1056个翻译方向。从常见的中英互译到法语、日语、阿拉伯语、俄语甚至藏语、蒙古语等少数民族语言它都能游刃有余地处理。值得注意的是1.8B版本的Hy-MT1.5就实现了比肩商业翻译API和235B级大模型的翻译效果。在严格的评测基准中其翻译质量不仅超越了谷歌翻译、百度翻译等主流系统更证明了在高效优化下轻量级模型能够展现出亮眼的翻译能力。但问题也很直接原始的1.8B模型即使在FP16精度下依然占用3.3GB内存。对于手机上金子般的内存来说这还是太大、太慢所以需要量化压缩。极致量化压缩把模型装进手机量化压缩简单来说就是把模型里原本用16位数字16-bit表示的参数改用更低位数字储存。这就像把一幅高清照片压缩成缩略图文件小了很多但你还是能看清楚里面的内容。针对不同的手机用户腾讯特别推出了2-bit与1.25-bit两种极致的量化压缩方案。2-bit模型性能与质量的平衡适用中高端机型2-bit模型采用了业内顶尖的拉伸弹性量化SEQ将模型参数量化至{-1.5-0.50.51.5}并结合量化感知蒸馏在将模型体积压缩至574MB的同时实现了几乎无损的翻译质量效果超越上百GB的大模型。在支持Arm SME2技术的移动设备上2-bit模型能够实现更快速、更高效的推理。△2-bit模型在SME2及Neon内核的速度对比演示1.25-bit模型Sherry极致压缩适用全系机型为了达成极致的轻量化腾讯推出了基于Sherry稀疏高效三值量化技术的1.25-bit模型。该技术方案已被NLP顶级学术会议ACL 2026录用。Sherry压缩方案的核心逻辑在于“细粒度稀疏”策略每4个模型参数3个最重要的用1-bit储存1个用0储存平均每个参数仅需1.25-bit。配合腾讯专门为手机CPU设计的STQ内核该方案实现了对SIMD指令集的适配。最终3.3GB的原始模型被进一步压缩至440MB轻松常驻后台让内存紧张的普通手机也能顺滑进行高质量离线翻译。FP16八倍速vs. 1.25-bit速度对比演示△演示设备高通骁龙8888GB内存本次开源不仅包含模型权重腾讯混元团队还制作了一个实际可用的腾讯混元翻译Demo版特别适配“后台取词模式”。无论是在本地查看邮件还是浏览网页混元翻译都能随叫随到。无需网络无需订阅完全本地处理、不涉及个人信息采集和上传一次下载永久使用。所有模型权重、代码及技术报告均已全面开源目前只支持安卓体验Demo后续正式版会添加对iOS等平台的支持。体验链接Hugging Face海外用户https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk魔搭社区国内用户https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/master/Hy-MT-demo.apk模型下载Huggingface海外用户2-bit 模型权重https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit2-bit 模型ggufhttps://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF1.25-bit 模型权重https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit魔搭社区国内用户2-bit 模型权重https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit2-bit 模型ggufhttps://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-2bit-GGUF1.25-bit 模型权重https://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit1.25-bit 模型ggufhttps://modelscope.cn/models/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF技术报告Sherry论文地址https://arxiv.org/abs/2601.07892AngelSlim技术报告https://arxiv.org/abs/2602.21233Hy-MT1.5技术报告https://arxiv.org/abs/2512.24092代码仓库AngelSlim: https://github.com/tencent/AngelSlim