作为最直接的沟通控制方式,智能语音交互可以让人与设备无缝连接。近日,成都一家科技公司的一款语音AI芯片成为整个人工智能语音家电市场的一抹亮色。
7月21日,红星新闻记者从成都启英泰伦科技有限公司(下称启英泰伦)获悉,该公司自主研发的第三代语音AI芯片(CI130X系列)2023年上半年出货量超过1000万颗,成为语音AI芯片赛道的“黑马”。
早在今年5月,启英泰伦对外披露,已完成B++轮融资,总融资金额数千万。投资方有知名投资机构水木春锦资本、盛裕资本和自觉资本。这意味着,该公司在智能语音芯片市场的布局已按下“加速键”。
芯片模块实物图
自主研发更“聪明”的语音AI芯片
为用户提供更智能、个性的沟通体验
今年,ChatGPT这个名字在全球声名鹊起,它能够与用户进行流畅、自然、有趣的对话,展示了人工智能在自然语言处理领域的巨大进步。作为人工智能大模型的发动机,语音AI芯片可以说是人工智能产业发展的重要基础。
“晒衣服、煮饭、开空调、取暖器,在家庭的各个场景,用户只需要给出简单的指令,就可以让各项设备来完成具体事务。”启英泰伦应用支持总监孙振奎解释,语音AI芯片就是处理语音的AI芯片,也是智能语音交互的核心基础。例如天猫精灵、小爱同学等智能语音产品,体内都有一个语音AI芯片,用于智能语音的交互。
作为AI时代人机交互的入口,智能语音识别得到了更广泛的认可。孙振奎表示,7年前,公司决定攻克离线语音的种种难关,研发了全球首款自主知识产权的深度神经网络处理器(BNPU)语音芯片。“相对于传统的DSP或者MCU架构,BNPU具备高效率、高灵活的神经网络算子指令架构,这意味着,这款语音芯片更‘聪明’,能为用户提供更智能、个性的沟通体验。”
芯片应用场景图
半年内出货量超1000万颗
能识别“川普”,可实现10米远场语音识别
“智能算法,更强抗噪性能和更高识别率。”孙振奎认为,第三代语音AI芯片的特性是语音识别精准、抗噪性能强、误识别低等。“今年上半年,大量的方案商涌入,借助我们的AI平台实现个性化需求,如快速开发性能高、快捷的产品模型等。这也让我们赢得了大量的客户和订单”。正因如此,才使得该公司第三代语音AI芯片能在半年时间内出货量超过1000万颗。
“我们对居家场景做了大量训练,比如电视声、风扇声、水流声、群体声、环境声等,使其能更好适应实际居家环境的声学条件,提高语音识别的准确性。”孙振奎说,这款语音AI芯片甚至能识别“川普”,“哪怕是带一点地方口音的普通话,只要你说出来,它就能听懂。在实际居家环境下,可实现10米远场语音识别,准确度高达97%以上。”
据了解,第三代语音AI芯片支持超过500条离线命令词条,采用端侧NLP技术更可支持高达数万句说法,可为用户提供丰富且灵活的语音交互方式,词条泛化能力强,同一功能可以设定多个命令词,用户不用拘泥于特定命令词,这大大提升了用户体验。
此外,深度学习降噪技术也使得产品应用于取暖器、油烟机、扫地机器人等高噪声场景时,在70±5dB的噪音和人声环境下,识别率仍能达到90%以上。截至目前,围绕该技术,启英泰伦已应用和在研的超过300种家电,产品包括电冰箱、空调、微波炉、晾衣杆等,合作方包括美的、长虹、海尔等家电巨头。
红星新闻记者 赵雨欣 图据成都启英泰伦科技有限公司
编辑 李钰仪
(下载红星新闻,报料有奖!)