AI唇语识别眼镜问世,准确率约为95%

人工智能应用1年前 (2023)发布 aixure
54 0 0
导读:据智慧科技迷,美国康奈尔大学的研究人员开发了一款低功耗唇语识别眼睛,名为EchoSpeech,通过声学传感器和人工智能,能够根据嘴唇的运动连续识别多达31个无声指令,且佩戴者可以向配对的电脑或手机发送指令。相关成果已在德国汉堡举行的计算机协会计算系统…

据智慧科技迷,美国康奈尔大学的研究人员开发了一款低功耗唇语识别眼睛,名为EchoSpeech,通过声学传感器和人工智能,能够根据嘴唇的运动连续识别多达31个无声指令,且佩戴者可以向配对的电脑或手机发送指令。相关成果已在德国汉堡举行的计算机协会计算系统人为因素会议上发表。

IT之家报道称,这项技术最令人兴奋的前景之一是,对于有语言障碍的人来说,可以使用它来无声地将对话输入到语音合成器中,然后将单词大声说出来。眼镜也可以用来在安静的图书馆中控制音乐播放,或者在嘈杂的音乐会上口述信息。

据悉,目前大多数无声语音识别仅限于一组预定的命令,这既不实用也不可行,并且存在隐私问题。该团队开发的EchoSpeech,只需要几分钟的训练,就能识别想要的指令,并且仅在本地智能设备上处理,无需上传云端,保证了隐私性。

值得一提的是,该系统目前的版本提供了大约10小时的电池续航,配备了一对麦克风和比铅笔橡皮擦还小的扬声器,在面部发送和接收声波并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。

赞助本站

© 版权声明

相关文章

暂无评论

暂无评论...