36氪星发射|实现了高度流畅的跨语言交互体验,人工智能翻译硬件开发商“时空锅”获得了数千万a轮融资

36 krypton最近获悉,人工智能翻译硬件开发商“时空锅”已从东方福海管理的国家中小企业发展基金获得数千万美元的独家融资。

使用不同语言的人应佩戴翻译耳机。随着自然流畅的对话互动的不断发展,耳机会同步产生同声传译。这不再是科幻元素,而是最新产品spacetime pot W3人工智能翻译头戴式耳机的真实使用场景

spacetime pot于2016年成立。人工智能和翻译等智能设备是智能手机市场上主要的人工智能产品,人工智能语音巨头科大讯飞不断优化翻译机。其中,人工智能翻译耳机是制造商为提供更好体验而进行的一次常见尝试

科大讯飞于2017年发布了人工智能翻译TWS耳机Mobis,然后投资了同声翻译耳机制造商sweetalk。百度的小都智能翻译TWS耳机、谷歌的pixel Bus和waverlylabs Ambassador也是市场上的知名产品

“但凭借完全自然流畅的跨语言对话体验,时空罐的W3耳机处于领先地位。”时空锅创始人田莉介绍36氪目前,市场上的AI同声翻译耳机可以通过智能设备向对话一方提供单向语音翻译广播,向另一方提供翻译回复文本显示;或者对话双方可以戴耳机同时收听对方的翻译广播,但只支持对话轮转系统,说话之间必须遵循严格的时间顺序,翻译与复述

时空pot W3耳机突破了两人同声翻译中对话轮系统的局限性,实现了说话时听、打断辩论、及时插入补充等自然对话中常见的人际互动,而且对话体验非常流畅

AI智能翻译耳机需要具备复杂的生产要素,如硬件工业设计、语音降噪解决方案、通信传输方案、后端AI语音识别和翻译能力。它是一款高复杂度的消费电子产品

时空罐主要切入由硬件+降噪+通信+引擎对接组成的前端互动体验解决方案;其后端人工智能语音识别、翻译等处理能力主要与来自各个国家和地区的外部第三方人工智能引擎合作,通过良好的引擎匹配和对接,确保产品的翻译准确性,时空pot W3耳机的流畅通话体验主要基于语音降噪解决方案和通信传输方案的技术能力

W3耳机的矢量降噪技术是一项前沿技术双麦克风阵列降噪技术方案。耳机双麦克风通常是最基本的线性降噪方法,主要是基于耳机顶部和底部麦克风接收到的类似环境噪声,以及接收到的扬声器声信号强度的巨大差异,从而获得环境噪声样本,这使得抵消环境噪声成为可能

空时盆自主开发的矢量降噪算法可以通过声波与麦克风阵列阵元之间的时间差来估计声源角度。根据麦克风阵列接收到的声波信号的振幅差,可以估计声源距离,从而更准确地锁定声源位置,消除范围外的环境噪声。复杂的互相关和空间混叠计算使得相关算法的精度没有较低的技术障碍。准确地消除对方的声音,这为多人语音识别提供了基础

一人戴耳机听,这意味着需要实现录音和声音广播的独立工作。开发者需要在嵌入式端进行深入的软件协议修改,使耳机固件能够实现多通道通信协议,让不同的信号在多个独立的通道上运行。此外,在耳机麦克风收集扬声器的声源信号后,如何实现编码和压缩后的高传输速度以及解压缩和解码后的低损耗,需要研发人员不断改进该技术

仅仅依靠良好的降噪和通信传输方案并不能为人工智能引擎语音识别形成良好的初始材料。因此,时空pot同时在手机上部署了神经网络算法,并初步整合了语音材料中的智能摘录和断句,为了提高人工智能引擎的识别率,在后端人工智能引擎的对接和匹配方面也有大量的研究和开发工作。由于不同AI引擎的逻辑不同,引擎对接要求开发者了解不同引擎的组件,分别开发和调试不同的引擎,匹配后在软件端访问流式翻译和双向翻译。此外,开发人员还需要根据用户的地理位置分配最佳服务器。这个过程涉及服务器的位置确定和大量命令交互

目前,spacetime pot W3耳机支持40种语言和93种口音的翻译

除了双人传输模式外,W3扬声器耳机最多支持6种同声传译。然而,由于多人会议需要大师麦的角色来确保会议的秩序和体验,而且多人混合语音对多语音降噪提出了更高的技术要求,因此到目前为止,只支持对话轮系统。随后,随着edge computing逐渐解放本地计算能力,在线会议的数量可以显著增加。

目前,约90%的时空罐销往海外,其中亚马逊在美国翻译耳机类别中排名第一。除了传统的旅游和商务跨语言交流场景外,随着销售规模的不断扩大,时空pot开始获得更多的用户反馈,并逐渐深入了解翻译耳机的各种细分场景。例如,外国人聚居地区基层政府单位日常管理中的跨语言交流场景,以及海外专业人士为本地非英语移民提供的跨语言服务场景

“我们在美国观察到了高比例的使用场景。医生为非英国移民提供医疗服务。在后续的市场开发中,我们将进行现场产品和市场投资,并与不同行业的客户合作。”Spacetime pot还观察到,许多家长通过同声翻译耳机陪伴孩子进行沉浸式英语对话学习。基于此,spacetime pot与英语教学应用Fluence进行了战略合作

各种用户场景为开发者不断积累场景理解和各种数据提供了更多机会,并为不同垂直场景中的用户开发自适应设备

“我们最终致力于提供高度流畅、完全自然的跨语言交互体验。在现阶段,耳机只是一种媒介。”spacetime pot的创始人田莉告诉36氪星,这意味着整个硬件和软件组织系统可以迭代,甚至可以重构,以获得最终体验

万世资本作为此次交易的财务顾问。这一轮融资将用于市场开发和研发团队扩张。时空正在大力招聘相关领域的人才

东方福海合伙人黄国强表示:东方福海投资科技驱动逻辑。在全球化背景下,跨语言交际已成为一种刚性需求。口译服务的市场规模已达100亿美元。传统的翻译机依赖于出境旅游等低频场景,时空罐产品可以全面满足中高频深度交流的需要。受疫情影响,传统翻译机厂商出货量大幅下降,时空罐逆势上升,受到世界各地用户的好评。这是基于时空罐给底层技术创新带来的独特产品体验优势。未来,b端将推出一系列新产品,以满足更大的客户群。时空pot有望在未来成为翻译领域的全球领先品牌,甚至成为跨国界、跨文化无障碍交流的基础设施

发表评论

您的电子邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据