有数据显示,世界50%新冠(COVID-19)病例由无症状感染者传染。
无发烧、乏力、头晕等明显特征的无症状感染者,已在不知不觉中成为新冠病毒传播和复发的最大威胁。
他们发现,无症状感染者发出的咳嗽声与健康人存在不同,其中细微的差别人耳很难分辨,但AI可以。
在最近发表在《IEEE医学与生物工程学杂志》上的一篇论文中,MIT研究人员明确表示,他们已经开发出一种能够识别COVID-19咳嗽声的AI。
目前,MIT研究团队已经与一家企业展开合作,计划将该AI算法整合到手机应用程序中。项目负责人布莱恩·苏比拉纳(Brian Subirana)表示:
如果每个人在去教室,工厂或餐厅之前都使用该AI诊断工具,将会有效减少新冠大流行的传播。”
据悉,该项研究成果也同步提交到了FDA和其他监管机构,如获得批准,COVID-19咳嗽应用程序将免费用于大规模人群筛查。
人耳能够分辨出五到十种不同的咳嗽特征,但通过机器学习和信号处理,AI能够识别300多种。
如Subirana所说,“说话和咳嗽的声音都受到声带和周围器官的影响。 这也意味着,我们可以从声音中获取有关体内器官的信息,而AI恰好可以做到这一点。”
因此,在疫情爆发之前,MIT研究团队已经在尝试利用AI辨“音”来诊断阿尔茨海默症(AD)早期的患者。
需要注意的是,正是通过这项研究,研究人员发现了识别COVID-19无症状感染者的可能性,并提供了AI算法支持。
阿尔茨海默病是一种神经系统退行性疾病,不仅与记忆力衰退有关,还与声带减弱等神经肌肉退化有关。因此,研究人员开发了一种通用的机器学习算法(或称为ResNet50的神经网络),来区分与不同声带强度所产生的声音。
具体来说,他们训练了三个神经网络模型。第一个神经网络代表一个人声带的强弱,利用有声读物数据集(含1000h语音)进行训练;第二神经网络用来区分言语中的情绪状态。
据了解,AD患者的神经功能衰退较一般人更为普遍,经常会表现出沮丧、悲伤等负面情绪。因此,研究人员利用演员表达不同情绪的大型语音数据集,开发了情绪语音分类器。第三个神经网络在自建的咳嗽数据集上训练,用来辨别肺和呼吸功能的变化。
最后将三种模型结合起来,形成了一个用于检测肌肉退化的AI框架。研究人员经过检测发现,基于声带强度、情绪、肺和呼吸功能等生物特征,该AI能够准确识别出AD患者。
基于此,当冠状大流行开始蔓延后,Subirana开始思考是否可以利用AI诊断COVID-19,因为已经有证据表明,新冠感染患者会发生一些类似的神经系统症状,比如,暂时性神经肌肉损伤。
后来,Subirana在COVID-19咳嗽数据集上训练了阿尔茨海默氏病AI模型,结果取得了惊人的发现。该AI模型不仅可以高精度识别出新冠感染患者,而且无症状感染者的准确率更高。
AI模型和数据集是决定疾病诊断准确率的两项关键指标。
今年4月,MIT研究人员建立了一个公开咳嗽数据收集网站,允许所有人通过网络浏览器、手机或者笔记本电脑等设备自愿提交咳嗽录音。
网站地址:https://opensigma.mit.edu/
Subirana称:“在医疗领域,这是迄今为止最大的咳嗽数据集。”
在模型方面,采用的仍然是阿尔茨海默氏症AI模型,并且同样以声带强度、情绪、肺和呼吸四项生物特征作为诊断COVID-19感染患者的标准。
在该模型内部,咳嗽音频通过梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient)进行转换,并输入到基于卷积神经网络(CNN)的AI架构中,如上文所说,该AI架构由生物特征层和3个并行的ResNet50神经网络构成。最终会输出二进制形式的预筛查诊断结果。
基于以上两个方面,研究人员对其进行了测试,结果发现AI模型识别COVID-19患者的准确率为98.5%,无症状感染者的准确率为100%。
论文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9208795
这一结果表明,COVID-19的患者即时没有明显症状,其声音也会发生明显的变化。同时,该AI模型可以通过这一变化有效地识别出无症状感染者。
据了解,MIT的团队已经在考虑与相关企业合作将该AI模型整合到手机应用程序中,以便人们可以方便地对疾病风险进行初步评估。
与此同时,研究人员也开始与世界各地的多家医院合作,以收集更大,更多样化的咳嗽记录集,这将有助于训练和增强AI模型的准确性。
不过,需要强调的是,该AI模型的优势不在于检测有症状的新冠患者。
这一点Subirana在论文中也明确强调。他说,不管他们的症状是由COVID-19还是其他症状(如流感或哮喘)引起的。该工具的优势在于它能够分辨无症状感染者的咳嗽和健康人的咳嗽。
最新评论