人工智能声呐眼镜可识别唇语,准确率约为百分之九十五

时间:2023-04-10人气:加载中...

  美国康奈尔大学研究人员开发了一款声呐眼镜,它通过声学感应和人工智能跟踪嘴唇和嘴巴的动作,可连续识别多达31条无声的命令,该系统可为那些暂时不方便说话或无法发声的人提供帮助。相关论文将在本月于德国汉堡举行的计算机协会计算系统人为因素会议上发表。

  这款眼镜是一种名为EchoSpeech的无声语音识别接口。该眼镜配备了一对麦克风和比铅笔橡皮擦还小的扬声器,成为一个可穿戴的人工智能驱动的声呐系统,在面部发送和接收声波,并感知嘴巴的运动。然后,深度学习算法实时分析这些回声轮廓,准确率约为95%。这款低功耗、可穿戴的眼镜只需要几分钟的用户训练数据,即可识别命令并可在智能手机上运行。

  EchoSpeech可用于在说话不方便或不合适的地方通过智能手机与他人交流,比如在嘈杂的餐厅或安静的图书馆里。无声语音界面还可与触笔配对,并与CAD等设计软件一起使用,几乎不需要键盘和鼠标。

  研究人员表示,他们正在将声呐技术“搬”到人体上。它体积小、功耗低、对隐私敏感,这些都是在现实世界中部署新的可穿戴技术的重要功能。无声语音识别中的大多数技术都局限于一组选定的预定命令,需要用户面部或佩戴摄像头,这既不实用也不可行。可穿戴式摄像头也存在重大的隐私问题,对用户和与之互动的人来说都是如此。而像EchoSpeech这样的声学传感技术消除了对可穿戴式摄像机的需求。

  此外,由于音频数据比图像或视频数据小得多,因此EchoSpeech只需更小的带宽,通过蓝牙实时传输到智能手机上,且数据在本地,不在云端,确保了敏感隐私信息安全。

责任编辑:关轩轩

来源: 科技日报

版权声明:

原网页已被新农村转码收录,版权归文章来源方:科技日报所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

您如因版权和若对该稿件内容有任何疑问,请30日内与新农村网联系,本网将迅速给您回应并做处理。

对于任何包含、经由链接、下载或其它途径所获得的有关本网站的任何内容、信息或广告,不声明或保证其正确性或可靠性。用户自行承担使用本网站的风险。

基于技术和不可预见的原因而导致的服务中断,或者因用户的非法操作而造成的损失,新农村网不负责任。

服务邮箱:4834222#qq.com(请将#替换成@)处理时间:上午9点至下午5点30分。

标签:
随便看看
本类推荐
本类排行
热门标签

振兴 50年 客运 利率 学区 经贸 接近 今夏 林草 低保 备耕 水产 500亿元 两强一增 专访 北京 舟山市 人形 总面积 商户 中国特色 担保 300个 直击 一周 艺术 常年 农民工 换新 博士 外业 常见 5个 游园会 提升 复合 捐赠 护航 冠军

Copyright 新农村网 版权所有