华盛顿大学开发“太空演讲翻译”技术:几个人
作者:365bet登录 发布时间:2025-05-25 12:05
5月24日,对华盛顿大学EE的调查。 uu。提出了“太空语音翻译”的便携式技术,使其可以通过双耳耳机在对话环境中实时翻译,从而使其能够保留每个说话者的语音特征和指导方向。根据ITMedia News昨天的报道,在这项技术的帮助下,可以将耳机实时翻译成他们的母语,同时保留每个人的声音的个性和方向信息,这使他们能够清楚地交流谁说什么。与现有的翻译工具相比,该技术解决了两个主要问题。一种是支持几个同时讲话的人,另一个是维持独特的音频风格和每个说话者的方向,而不是相同的翻译结果。这项研究结合了诸如隔离源,空间定位,真实时间的技术结合翻译和二元表示,以建立一个完整的系统。在报告中发现,研究小组的三个主要技术进步包括:该空间被细分为多个角度区域,并且神经元网络用于识别每个区域中可能的说话者,以分离和定位精确来源。建立一个可以在苹果芯片中实时执行的语音翻译模型,该模型可以保留说话者的声音和情感的质量。我们开发了一种双向代表方法,以确保翻译的音频来自原始演讲者并改善沉浸式。在现实世界的测试中,研究人员使用噪音和Bi-Oreja取消的耳机在Apple M2芯片中完成了从法语,德语,西班牙语到英语的实时翻译。我认为在多个环境中测试了10名受试者,该系统表现出强烈的多功能性。进行额外的评估,有29名参与者一般Ly认为,新系统不仅提高了翻译的质量,而且还促进了扬声器的识别,而且在几个人的交流方案中的传统翻译工具也比传统的翻译工具更好。此外,空间识别实验允许用户准确确定翻译论述的方向。这与原始配乐大致相同。研究结果:https://doi.org/10.1145/3706598.3713745
上一篇:索尼推出了GP
下一篇:没有了
电话
020-66888888