首页分类信息商家房产手机端

谷歌最强开放翻译模型：TranslateGemma登场，手机也能跑

2026-01-16 08:14 #科技

在谷歌近日发布的最新研究成果中，一个名为TranslateGemma的超强开放性机器翻译系统登上了舞台，这款系统的出现标志着谷歌在AI领域又一次取得了突破性的进展，该系统不仅能够处理各种语言之间的转换，而且可以在移动设备上实现高效运行，这意味着未来人们可以通过手机进行更便捷、更准确的国际交流。，TranslateGemma的成功表明了谷歌在人工智能领域的强大实力和创新精神，这一成果有望为全球用户提供更加智能化、人性化的服务体验，推动AI技术的发展和应用，随着科技的进步，相信这种开放性机器翻译系统的普及将极大促进跨文化交流与理解，从而更好地构建和谐的世界。

IT之家 1 月 16 日消息，谷歌昨日（1 月 15 日）发布博文，基于 Gemma 3 架构，推出 TranslateGemma 开放翻译模型系列，共有 4B、12B 和 27B 三种参数规模，支持 55 种核心语言及多模态图像翻译，目前已在 Kaggle 和 Hugging Face 开放下载。

性能方面，谷歌团队利用 WMT24++ 基准（包含高、中、低资源语言的 55 种语言）和 MetricX 指标进行了严格测试。

结果显示，TranslateGemma 12B 版本的翻译质量超越了参数量大其两倍的 Gemma 3 27B 基线模型。这意味着开发者仅需消耗一半的算力资源，即可获得更高保真的翻译结果，从而大幅提升吞吐量并降低延迟。

同时，体量最小的 4B 模型也展现出惊人实力，其性能与 12B 基线模型相当，为移动端和边缘计算设备提供了强大的翻译能力。

技术方面，TranslateGemma 的高密度智能源于独特的“两阶段微调”工艺。

首先是监督微调（SFT），Google 利用 Gemini 模型生成的高质量合成数据与人工翻译数据混合，对 Gemma 3 底座进行训练；随后引入强化学习（RL）阶段，通过 MetricX-QE 和 AutoMQM 等先进奖励模型，引导模型生成更符合语境、更自然的译文。

在语言覆盖方面，TranslateGemma 重点优化并验证了 55 种核心语言（涵盖西班牙语、中文、印地语等），并进一步探索训练近 500 种语言，为学术界研究濒危语言提供了坚实基础。

此外，得益于 Gemma 3 的架构优势，新模型完整保留了多模态能力。测试表明，无需额外针对视觉任务进行微调，其在文本翻译上的提升直接增强了图像内文字的翻译效果。

为了适应不同的开发需求，TranslateGemma 的三种尺寸对应了精准的部署场景：

4B 模型专为手机和边缘设备优化，实现端侧高效推理；
12B 模型适配消费级笔记本电脑，让本地开发具备研究级性能；
27B 模型则面向追求极致质量的场景，可运行于单张 H100 GPU 或云端 TPU 上。

所有模型目前均已在 Kaggle、Hugging Face 及 Vertex AI 上线。

IT之家附上参考地址

版权声明

部分文章来自互联网，版权归原作者所有，文章内容仅代表作者观点，不代表本站立场，本平台仅提供信息存储服务。

标签也能最强模型

上一篇：KRAFTON：《幻兽帕鲁移动版》等12款游戏未来2年内陆续上线下一篇：谷神星一号海射型遥七运载火箭发射成功

相关文章