
4月2日,DeepL Japan就“DeepL Voice”举行了新闻发布会。
“DeepL Voice”是一项同时支持在线会议和面对面对话的语音翻译服务。目的是通过实时翻译话语来解决多语言环境中的沟通停滞问题。
将“语言障碍”视为企业问题的语音翻译平台
DeepL将该服务定位为不是传统“文本翻译”的延伸,而是作为整体支持“商业沟通”的基础。
提供这项服务的原因是跨国公司召开会议效率低下的问题。研究表明,大约 34% 的会议时间被浪费在思考如何措辞和倾听上。此外,只有大约60%的参与者准确理解了会议内容,据说误解导致工作停滞。
针对这种情况,发展的出发点就是把语言能力视为整个公司共同解决的问题,而不是个人的努力。

该产品针对每种应用包含两种解决方案。用于网络会议的“DeepL Voice for Meetings”可与 Microsoft Teams 和 Zoom 配合使用,在浏览器上显示实时字幕。它还支持多种语言的会议,并且翻译结果可以作为转录数据下载。输出字幕兼容 100 多种语言。
另一方面,专为面对面会议而设计的“DeepL Voice for Conversations”在智能手机上运行,允许用户使用单一设备与会面的人简单交谈即可进行翻译。它具有“面对面模式”,可以垂直分割屏幕,以便更容易看到对方,以及朗读翻译文本和调整播放速度的功能。支持30多种语言输入输出,适用于海外出差、现场支持等使用场景。

在翻译准确性方面,专家评估表明,与其他公司的翻译工具相比,严重误译数量减少了约70%至80%。其背后的原因是它使用了独特的专门用于翻译的人工智能,而不是通用的大规模语言模型。该设计强调准确的转换,而不是根据上下文生成看似合理的句子,这有助于抑制幻觉。
此外,该模型使用内部管理的高质量数据集进行训练,并包括人工评估过程。它经过优化,可以支持日语等结构复杂的语言,并且抑制了实时字幕时经常出现的显示抖动。此外,词汇表功能允许公司注册自己的技术术语,从操作角度降低误译的风险。
出于操作考虑,翻译机器人参加会议时,必须有授权用户在场。此外,在活动场所等嘈杂环境中,准确性可能会降低,但这可以通过使用具有降噪功能的麦克风或耳机来解决。
每年减少194小时的“效果”和语音翻译的“下一步”
示范实验已经显示了有关引入有效性的具体数据。经确认,每人每年工作时间减少194小时,相当于货币价值约96万日元。会议前后的准备和内容检查工作量减少了26%,减轻了创建会议记录的负担,防止返工。
在安全方面,我们采取了立即删除翻译数据并且不将其用于AI训练的政策。通信经过加密并支持单点登录等企业身份验证。它还符合欧洲个人信息保护法规 GDPR,旨在用于高度机密的商业谈判。
作为未来的发展,DeepL 还在开发“语音到语音翻译”,它可以直接将语音转换为语音。它是一种将语音转换为另一种语言,同时保留说话者的音质和语气的技术,通过结合语音识别、翻译、语音合成和低延迟处理来实现。目标是尽量减少说话和播放之间的延迟,预计在 2026 年底推出。据说还预计支持日语。

此外,还介绍了工作区工具 Notion 作为如何使用 DeepL API 的示例,它允许您将翻译功能合并到您自己的服务中。该公司表示,通过在应用程序内完成翻译,不会干扰用户操作,从而加快全球扩张速度并降低运营成本。
除了现有的文本翻译和文档创建支持之外,DeepL 还扩展到语音翻译。似乎有越来越多的运动将解决多语言环境中的沟通问题作为基础而不是作为单独的工具。
(画像提供:DeepL)
