字节跳动在人工智能语音领域再次投下震撼弹。昨日(4 月 9 日),字节跳动正式发布原生全双工语音大模型 Seeduplex。目前,这一全新模型已在豆包 App 全量上线,标志着 AI 语音交互正式告别“对讲机模式”,步入如同真人对话般的自然时代

此次 Seeduplex 的核心突破在于其“原生全双工”框架设计。相比于上一代“半双工”模型,新系统彻底解决了 AI 交互中的迟钝感

在传统的 AI 语音交互中,用户必须等 AI 说完才能插话,或者 AI 必须等用户完全停止说话后才能反应,这种“一人一句”的模式被称为半双工。而 Seeduplex 实现了“边听边说”。

这意味着用户可以在 AI 说话时随时插话AI 会像真人一样立即做出反应,而无需重新启动对话。基于端到端语音模型的进化,Seeduplex 的响应速度和语气自然度大幅提升,能够精准捕捉用户的情绪和语境微变化。交互过程不再生硬,AI 能够理解复杂的对话逻辑,甚至处理犹豫不决的语音指令。

作为深耕吉隆坡的新闻社,我们关注到这一技术对东南亚市场的深远意义。随着数字经济在马来西亚的快速渗透,全双工语音技术将直接改变多个领域。

相比于目前生硬的语音自动回复,Seeduplex 类型的模型可以为大马企业提供更具人情味的客户服务,大幅提升用户满意度。对于正在学习多语言的大马用户,这种“边听边纠正”的实时交互,将成为效率极高的虚拟外教。

此外,随着中国品牌新能源车在马来西亚普及,全双工语音技术将让驾驶者通过极其自然的口语控制导航与车辆功能。

豆包 App 作为字节跳动在 AI 领域的拳头产品,此次全量上线 Seeduplex,无疑是在进一步加深其技术护城河。在全球 AI 巨头竞逐语音交互赛道的当下,字节跳动凭借超大规模用户基数底层架构创新,正试图定义下一代 AI 助手的标准。