新闻资讯
新闻资讯

专访Time Pot CEO:不惧苹果入局,AI翻译耳机远未结

作者丨欧雪 编辑丨袁斯莱 当巨头想要将软件和硬件结合起来时,只需动动几下手指,他们就能撼动许多初创公司脚下的坚冰。 2025年,当AI翻译准确率超过95%时,AI翻译耳机可能是最有可能被巨头吞并的硬件品类。它们不需要在硬件层面进行任何改变,只需要包含软件功能。最近一两年,几乎每个Android厂商都在自己的耳机中加入了翻译功能。但直到9月10日凌晨,苹果宣布AirPods将推出实时翻译功能时,翻译耳机的创业者们才真正感受到了寒意——仅苹果一家就占据了全球TWS的23%。翻译显然是必需的,并且迟早会成为所有主要耳机制造商的标准功能。效果出乎意料。事实上,2023年左右,AI翻译之后软件变得免费,大量白牌将涌入市场。不想打价格竞争的独立厂牌冲破重围后,又要面对巨型鳄鱼的撕咬。深企时壶就是先行一步的硬件厂商之一。随着翻译行业竞争的加剧,2024年Time Pot收入将达到2亿元,2025年累计收入将继续大幅增长,连续六年位居行业第一,累计用户超过百万,覆盖全球170多个国家。 Time Pot创始人田力出生于华为。或许与过往的行业经验有关,时空壶一直坚持硬件优先。其翻译耳机售价千元,利用硬件实现“边说边翻译”,力求还原自然的对话体验。面对苹果的AI功能对此,时光壶创始人田力有自己的回应。 “巨人的逻辑是在现有生态上叠加翻译功能。”时空锅创始人田力说,“我们的逻辑是重建整个跨语言通信系统。”这并不是陶器在太空中面临的唯一挑战。 “纵观整个翻译行业,这个行业还不够大。”田丽说道。这是一个分段名词需要的时期,他们必须在无数的间隙中找到不同的定位。田力认为,目前的人工智能不仅仅是直译,只有10%到20%能够理解文化语境并自然翻译。人工智能是技术理性的顶峰。它可以完成基本的翻译,但语言需要情感来赋予它更多的意义。人们想要持续使用的翻译产品不仅仅具有工具的功能。 “语言障碍是一个古老而普遍的问题,翻译行业也面临着巨大的挑战。几千年了。”田力说,“人工翻译往往不会逐字翻译,而是理解你的意图并准确表达。”对此,大公司可能没有耐心进行持续、温和的优化。这也成为初创公司的机会。我们与田力进行了对话,与他讨论了当前的市场竞争和人工智能耳机的未来方向。行业还处于早期阶段:您如何看待目前人工智能翻译领域的竞争状况?李:我们确实不太关注行业的竞争,主要是我觉得现在整个行业还不够成熟,比较谁做得更好就像“竞争更差”,这没有多大意义,但作为一个已经走在行业前面的公司,我们肯定会更多地模仿。编辑。比如双向同声传译、外部对话等模型都是我们首先建立的。我们的核心始终是解决问题,尤其是解决人们的沟通障碍。语言障碍是一个古老而普遍的问题。翻译行业已经存在了几千年,解决这个问题非常重要。我们不想盲目追热点,而是希望有一天,用户不会记得我们是做耳机还是硬件,而是知道我们可以帮助他们克服语言障碍。硬氪:那么对于谷歌、苹果等大公司也进入翻译领域,您怎么看?会有压力吗?田力:首先我想再说一遍,我们并不是特别关心竞争,因为这个行业确实还不够成熟。其次,巨头的逻辑是在现有生态系统上“叠加功能”(比如苹果给AirPods加了翻译),而我们的逻辑是“重建整个通讯系统”。根据出发点的不同,最终解决方案的效率和体验也会有所不同。硬氪:相比竞争对手,pot time的主要护城河是什么?田力:我觉得还是在认知层面。我们的重点是通信场景本身,而不是特定形式的硬件。从一开始,我们就不仅仅关注耳机的形式,而是思考耳机的交互体验能否让两个人交流得更自然。如果我们做不到这一点,我们就更换耳机。这就是为什么我们上一代产品没有使用蓝牙耳机芯片,因为我们的重点不是打电话等传统的na功能。随着时间的推移,这种底层逻辑将形成品牌和用户心智的护城河。 W4 AI随传译耳机-骨声纹识别技术(来源/企业)硬氪:时空Pot海外收入占比70%。在适应不同市场的文化、语言和政策时,您遇到了哪些意想不到的挑战?田力:最有挑战性的是了解用户。在中国,大量场景与商务谈判有关。但在美国,作为一个移民众多的国家,约有20%的人口是移民,而几乎50%的移民,即超过2000万人,英语技能有限。很多人在跨境移民生活中都会使用我们的产品。这在国内可能很新奇,但在国外却很常见。硬氪:公司目前的财务状况如何?是否有利可图?田力:公司已实现盈利。我们并不打算追求收入的快速增长,而是更注重保持健康的盈利能力和产品成熟度。在行业发展初期,追求增长会带来反弹。硬氪ypton:目前许多翻译设备都依赖于大型云模型。不过,行业内也有一股强劲的“设备端AI”趋势。时空锅是否考虑部署“端侧AI”?李田:On-Device AI对我们来说非常重要,因为很多地方的网络条件并不理想。人们对我们的产品有很高的要求。当网络不好的时候,两个人不会立即互相交谈,因此,端上AI是我们必须部署的。硬氪:未来会考虑“语音”之外的其他多模态通讯方式吗?比如手势和语气?田力:这是一个非常大胆的想法。像一些眼镜企业做的多模态输入,通过手势来理解意图比较困难,因为手势不标准化。但你提到的语气,我认为这部分可能是常态。例如,可以将愤怒、疑问、困惑或高兴的语气逐渐推向稳定的方向。标准化。这也是我们内部正在研究的方向。人工智能翻译还远远不够自然。硬氪:您如何看待未来人工智能翻译与人工翻译的关系?锅锅如何定义两者的关系?李田:我们把aof的AI翻译分为L1到L5,比如自动驾驶。我想现在大家能达到的水平大概就是L3级别了。至于人的水平,尤其是高级翻译,无疑是L4甚至L5。我认为L3、L4和L5之间最大的区别本质上是信任程度。 L3只能用,而L4、L5才是你可以真正信任它,让它帮你沟通、解决问题的地方。这里的重复涉及两个方面。首先,它需要像人一样的同理心,能够理解并传达你真正想要表达的内容,而不仅仅是字面翻译。人工翻译常常是这样的。这不是逐字翻译n,而是要理解你的意图并准确地表达出来。这是从 L3 haup 到 L4 的主要分界线。其次是产品本身。交互体验上还有很多细节需要打磨。硬氪:您认为从L3跃升到L4需要多长时间?田力:我觉得如果乐观的话大概需要2到3年的时间。因为有两个部分需要一起改变。前者属于整个行业前进的地方,是智能大体系的一个分支;而后者则需要产品公司认真考虑如何改善用户的体验。硬氪:从用户体验上来说,不同语言中其实有很多文化隐喻和俚语。 Time Pot如何尝试理解和维护这些“含义”?田力:我觉得这可能是整个行业都面临的问题,一个人很难解决。我们能做什么o 目前正在做一些语料库的收集工作,比如在中文、英文、西班牙文等语言上做更多的尝试。但从长远来看,谷歌这样的大公司会做一些基础工作,我们可以站在巨人的肩膀上,专注于我们更擅长的细节。硬氪:那么您认为目前对于AI翻译的文化理解水平是怎样的?田力:我觉得目前只能是10%到20%,大家还在尝试直译。但我相信不会太久。也许在半年左右的时间里,您会看到我们产品的重大演变。例如,产品现在分为两种模式:基础AI翻译和大翻译模式。从技术角度来看,这是一个不同的技术路径。但从消费者的角度来看,他们关心的是翻译是否能引起共鸣,或者是不改变原意、不引起误解的严格翻译它。随着时间的推移,您将看到两种模式之间的显着差异。硬氪:对于翻译中出现的“错觉”(随机翻译)或者错误,您怎么看?定义所涉及的责任?田力:说实话,比如在美国,我们的产品在医疗机构也有一些应用情况。但目前,相关责任的界定尚不明确。由于自动驾驶汽车发生车祸后法律含义尚不明确,目前我们的应用还停留在L3级别,首先是辅助性质。然而,人工智能的翻译还没有达到像自动驾驶那样严肃的程度。毕竟自动驾驶涉及到人的生命攸关的问题。 W4PRO AI耳机同声传译商务谈判(来源/商家) 硬氪:下一代AI翻译工具长啥样?太空壶有没有最新的研究方向你可以分享吗?田力:未来理想的产品确实非常简单,使用起来就能达到我们今天的自然沟通效果。但我们都知道,我们距离这个目标还很遥远,而这正是我们正在努力的方向。目前,我们始终围绕两条主要技术路线进行工作。首先是拾音质量,即使在复杂的环境下也能准确地选择声音。它和传统耳机最大的区别在于,传统耳机强调干净的声音采集,但我们不仅需要干净的声音,还需要音质足够好,发送到云端后能够被机器更好地识别和翻译。其次是AI本身的智能程度,比如是否能够支持更小的语言,能够更好地进行同理心以及更准确的翻译意思。未来2-3年,最主要也是最重要的目标是升级产品体验从 L3 到 L4。我们相信,一旦这个目标实现了,公司的业绩、利润等财务指标自然就不再是问题。 特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。 注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。