最新新闻:

研究人员声称他们的AI可以听到说话者是否戴着口罩

时间:2020-08-21 12:53:02来源:互联网

昆山杜克大学,武汉大学,联想大学和广州中山大学的研究人员声称已经开发了一种AI系统,该系统可以根据人的声音低沉来检测人是否戴着口罩。他们说,在实验中,它可以达到一个度量标准的78.8%的准确性,这表明声音可能是在大流行期间强制戴口罩的有用手段。

该团队的工作是在即将到来的2020年Interspeech大会上向第11届年度计算语言学挑战赛(ComParE)提交的作品,这是一个公开的挑战,涉及演讲者的状态和特质。今年,引入了“遮罩子挑战”,其目标是开发能够根据人的声音确定人是否戴着面具的算法。对于次挑战,每个竞争对手(包括本研究的合著者)都必须使用32名德国讲者的同一个语料库,并在戴有Lohmann&Rauscher面罩的录音棚中录制10小时。

研究人员通过改变语音速率,扭曲各种特征并随机擦除语音部分来增强数据集中的数据。他们在这种增强的数据上训练了机器学习系统,其中包括说话者不戴口罩时录制的语音,并进行了实验以确定分类器检测口罩存在的准确性。

研究人员发现,尽管该语料库包含相同数量的男女说话者(每人16人),但该系统的准确性在男女之间并不一致。他们没有猜测为什么会这样,但是其他方面的数据失衡可能是罪魁祸首。演讲者严格讲德语,谈论体育,家庭,孩子和食物等事物;只戴一种口罩;年龄从20岁到41岁不等。语言发音的差异是由于发音方式不同所致。可以期望一位年长的英语男性的演讲与一位年轻的西班牙语言的演讲有所不同。

不过,研究人员表示,在给定的德国数据集上,他们的系统最终实现了比基线模型更高的准确性(特定类召回的未加权平均值为71.8%)。

很明显,从语音中检测遮罩是一个新兴领域,但是它是基于视觉的方法的潜在理想替代方法。美国商务部国家科学技术研究院(NIST)的最新报告发现,松下,佳能,腾讯等公司的89种商业面部识别算法在将数字化口罩与照片匹配时的错误率在5%至50%之间。没有面具的同一个人的形象。包括汉王在内的公司都表示,他们已经开发出了新的AI方法,可以通过口罩识别佩戴者,但是引用的准确率却很高,而且他们并没有声称要保护隐私。

除遮罩检测外,研究人员还在探索如何将语音数据用于诊断COVID-19。卡耐基梅隆大学(Carnegie Mellon)和初创公司Voca.ai的团队发布了一个应用程序,声称可以识别某人是否有语音记录中的COVID-19,而Vocalis Health表示正在与以色列卫生部和国防研究与发展局合作收集“生物标志物”来自COVID-19患者。这些技术并非没有警告-对卡内基·梅隆(Carnegie Mellon)项目做出贡献的研究生本杰明·史翠纳(Benjamin Striner)警告说,由于缺少经过验证的数据,无法测试应用程序的准确性但初步研究表明,基于AI的语音分析可以相当准确地诊断其他情况,包括创伤后应激障碍和高血压。

声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。

图文推荐

热点排行

精彩文章

热门推荐