以文本翻译工具著称的翻译公司DeepL,近日正式发布了一套语音到语音的翻译解决方案。该套件覆盖多种使用场景,包括会议翻译、移动端与网页端对话翻译,以及面向一线员工的团队对话翻译(可通过定制化应用接入)。与此同时,DeepL还开放了API接口,允许外部开发者和企业基于其技术构建定制化应用,例如呼叫中心场景。
"在文本翻译领域深耕多年之后,语音翻译对我们来说是顺理成章的下一步,"DeepL首席执行官Jarek Kutylowski在接受TechCrunch采访时表示,"我们在文本翻译和文档翻译方面已经走了很长的路,但我们认为市场上还缺乏一款出色的实时语音翻译产品。"
Kutylowski指出,开发实时翻译产品的核心挑战在于如何在降低延迟(即从用户说话到译文播出之间的时间差)与保证翻译准确性之间取得平衡。
DeepL此次为Zoom、Microsoft Teams等主流平台推出了插件,用户可以在他人以母语发言的同时,实时收听翻译音频,或在屏幕上查看实时翻译字幕。目前该功能处于早期访问阶段,公司正邀请有意向的组织加入候补等待名单。此外,DeepL还推出了适用于移动端和网页端的对话翻译产品,支持面对面或远程交流场景。
针对培训课程、研讨会等团队场景,DeepL还支持多人参与的群组对话功能,参与者可通过扫描二维码加入会话。
DeepL表示,其语音翻译技术还具备自适应学习能力,可识别并记忆自定义词汇,例如特定行业术语、公司名称及人名等。
Kutylowski认为,AI正在重塑未来几年客户服务的形态。他特别指出,翻译层的引入有助于企业为那些合格员工稀缺、招聘成本高昂的语种市场提供支持服务。
DeepL表示,公司掌控着语音到语音翻译的完整技术栈。目前,该系统的工作流程为:将语音转换为文本,完成翻译后再转换回语音。DeepL认为,凭借多年积累的文本翻译经验,其在翻译质量上具有明显优势。未来,公司计划开发端到端的语音翻译模型,彻底跳过文本转换环节,实现真正意义上的直接语音翻译。
在竞争格局方面,DeepL面临多家资金雄厚的创业公司的挑战。专注于实时口音调整的Sanas去年完成了由Quadrille Capital和Teleperformance参与的6500万美元融资,其产品主要面向呼叫中心坐席人员。总部位于迪拜的Camb.AI则专注于面向亚马逊云科技等媒体与娱乐公司的语音合成与翻译服务,帮助客户实现视频内容的大规模配音与本地化。而由Reddit联合创始人Alexis Ohanian旗下Seven Seven Six基金支持的Palabra,正在打造一款能够同时保留语义与说话人原声的实时语音翻译引擎,与DeepL当前的产品方向形成了更为直接的竞争。
Q&A
Q1:DeepL的语音翻译产品支持哪些使用场景?
A:DeepL的语音翻译套件覆盖多种场景,包括Zoom、Microsoft Teams等平台的会议实时翻译、移动端与网页端的对话翻译,以及面向培训和研讨会等场合的群组对话翻译。用户可以实时收听翻译音频,也可以在屏幕上查看翻译字幕。目前会议翻译插件处于早期访问阶段,有需要的组织可申请加入候补名单。
Q2:DeepL语音翻译的底层技术原理是什么?
A:DeepL目前采用的是"语音转文本→翻译→文本转语音"的流水线方式,即先将语音识别为文字,再进行翻译,最后合成译文语音。公司认为凭借多年文本翻译经验,在翻译质量上具备优势。未来DeepL计划开发端到端的语音翻译模型,直接跳过文本转换步骤,进一步降低延迟并提升体验。
Q3:DeepL在语音翻译市场面临哪些竞争对手?
A:DeepL的竞争对手主要包括:专注实时口音调整的Sanas(已完成6500万美元融资)、面向媒体娱乐行业提供配音本地化服务的Camb.AI,以及由知名投资人支持、致力于保留说话人原声的实时翻译引擎初创公司Palabra。这些公司从不同细分方向与DeepL的语音翻译业务形成竞争。
好文章,需要你的鼓励
Kollmorgen发布NDC布局助手软件工具,专为工厂和仓库中的自动导引车(AGV)及自主移动机器人(AMR)的路线规划与优化而设计。该工具通过分段分析路线,帮助工程师在系统部署前识别瓶颈与低效环节,提供行驶时间、车速及优化潜力等关键数据,并以可视化方式标注问题区域,从而缩短布局设计与验证周期。Kollmorgen表示,该工具未来还将融入AI驱动的优化能力。
这篇由加州大学圣地亚哥分校等六所机构联合发布的综述(arXiv:2605.02913,2026年4月),首次系统梳理了大型语言模型强化学习训练中长期被忽视的轨迹设计问题,提出了GFCR四模块框架(生成、过滤、控制、回放),覆盖数学、代码、多模态和智能代理等多个应用场景,并附有实用的故障诊断手册,为AI训练工程师提供系统性的方法论指导。
现代仓储已从幕后走向前台,配送速度成为品牌竞争核心。面对次日达甚至两小时送达的市场压力,领先履约中心借鉴敏捷开发理念,以周为单位迭代代码、机器人与工作流程。IoT信标、边缘计算与视觉识别模块构建双层架构,实现厘米级货盘追踪与低延迟决策。人机协作模式让员工从重体力劳动转向异常处理与数据分析,拣选准确率突破99%。同时,自动化系统实时采集碳排放数据,在提速的同时实现可量化的减排目标。
中国科学技术大学与FrameX.AI联合提出Stream-R1框架,针对AI视频生成蒸馏训练中"一视同仁"的核心缺陷,引入奖励模型对训练样本进行双重加权:在样本层面根据质量分数筛选可靠的学习信号,在像素与帧层面通过梯度显著性热力图集中优化最需改进的区域,使4步快速学生模型在VBench多项指标上超越慢速多步教师模型,推理速度提升30倍且不增加任何额外计算开销。