目前,全球约有3.5亿名抑郁症患者,而我国抑郁症患者也已超过9,000万!
2012年,在发表于《生物精神病学》(Biological Psychiatry)杂志上的一项研究中,威斯康星州麦迪逊市心理咨询中心(CPC)的一个科学家团队推测,通过声音特征或许可以判断出一个抑郁症患者病的到底有多严重。
此后产业界便围绕这个猜测出现了一个细分赛道,几家初创公司声称利用数百个人的声音录音训练出来的人工智能可以自动检测抑郁症。其中,Ellipsis Health公司一马当先,他们能够从一个人90秒的讲话中生成对抑郁症的评估。
目前,它已经成功地筹集了2,600万美元的A轮融资,投资者包括前Salesforce首席科学家Richard Socher和Salesforce首席执行官Marc Benioff的Time Ventures。
据创始人兼首席执行官Mainul I Mondal称,Ellipsis的技术是“基于科学的”,并且已经得到了同行评审研究的验证。但专家们对该公司的产品以及其他类似产品是否如广告所说的那样有效仍持怀疑态度。
“听音判病”
从一个人的声音中检测出抑郁症的迹象,这种想法至少已经有60年的历史了。2012年CPC的研究是同一研究小组2007年工作的后续,该研究最初发表在《神经语言学》(Neurolinguistics)杂志上。当时,该研究发现人的“发声声音”特征与某些抑郁症症状的严重程度相关。
据领导2007年和2012年研究的CPC高级研究科学家James Mundt说,抑郁症患者在接受治疗时开始说话更快,停顿时间更短。如果没有反应,则会出现单调、“毫无生气”和“金属质感”的话,或“副语言特征”。
说话需要神经系统进行复杂的控制,而大脑中潜在的通路可能会受到包括抑郁症在内的精神疾病的影响。因此,说话的能力与思维和注意力密切相关,而所有这些都可能因抑郁症而受到损害。
Ellipsis公司利用语言和思维紊乱之间的这种学术联系,开发了一种严重抑郁症的筛查测试。在测试过程中,患者对着麦克风简短地说话,记录下语音样本,然后由公司的算法进行分析,以衡量抑郁症和焦虑症的水平。
“结合当前最先进的深度学习和前沿的迁移学习技术,我们的团队已经开发了新的模型,可以检测语音中的声学模型和基于单词的模型。这些模型直接从数据中学习它们的特征,而不依赖预先确定的特征,”Mondal说。“在全世界各个地方,声音都是衡量健康程度的重要标准。通过语气、节奏和情感,某人的声音可以传达了一个人的内在状态。”
根据Grand View Research的数据,到2027年,人工智能健康初创公司(特别是那些处理生物标志物的公司)的市场估值将达到1,294亿美元。
而Ellipsis是抑郁症诊断语音分析领域的龙头,其它还包括Sonde Health;Vocalis Health;Winterlight Labs;以及位于加州伯克利的Kintsugi,该公司刚完成了一轮800万美元的融资。此外,国内的想象科技(Wonder Tech)也以“语音心理测评”为核心技术发展方向开始对情感计算技术进行研究。
事实上,近来的一些研究也已经对人工智能可以从语音模型中检测出抑郁症的说法给予了肯定。在2018年Interspeech会议上发表的一篇论文中,麻省理工学院的研究人员详细介绍了一个系统,该系统可以通过从访谈中读取音频数据来发现抑郁症的征兆,准确率为77%。而在2020年,加利福尼亚大学洛杉矶分校的科学家们使用一个专注于词汇选择的人工智能系统,说它能够像医生一样监测正在接受严重精神疾病治疗的人。
“毫无疑问,副语言特征可以帮助进行临床诊断,”加州大学旧金山分校的精神病学助理教授Danielle Ramo在2017年的一次采访中说。“如果机器能够利用交流中的副语言特征,那么这是在使用机器为临床诊断或治疗计划提供信息方面的一个进步。”
在佛蒙特大学的另一项研究中,研究人员训练了一个检测儿童抑郁症的系统。由于抑郁症不能通过血液测试或脑部扫描来发现,因此医生必须依靠自我报告和这些访谈的结果来得出诊断。该研究的共同作者Ellen McGinnis认为,这项研究是一种快速、简便诊断年轻人精神障碍的方法。
目前,Ellipsis公司本身也计划将新融资的一部分用于将其平台扩展到儿童和青少年,其既定目标是改善诊断和治疗的便利性。
潜在的缺陷
根据美国心理健康协会的数据,在全球范围内,有中度到重度抑郁和焦虑症状的人数比新冠疫情爆发前增多了不少,据估计有28%的美国人患有抑郁症。在这种背景下,美国全国心理健康联盟(National Alliance on Mental Health)估计,55% 的精神病患者没有接受治疗,随着精神疾病医生的短缺,这一差距预计还会扩大。
此时,Ellipsis公司的技术就被认为是一种部分解决方案,正在美国九个以上的州和国际上通过保险商Cigna进行试点。Cigna公司用它创造了一个名为StressWaves的测试,它可以直观地显示一个人当前的压力水平,并能够给出一些建议来进行康复锻炼。据Mondal说,Ellipses的平台还在Alleviant健康中心的行为健康系统和未披露的学术医疗中心和专业健康诊所进行了测试。
他表示:“现在,这个行业比以往任何时候都需要大胆的、可扩展的解决方案来应对这场危机。首先是需要像我们这样的工具来量化疾病严重程度,因为时间紧迫的供应商本身没有足够的能力来解决这个问题。”
但一些计算机科学家对使用人工智能来追踪精神障碍,特别是像抑郁症这样的严重障碍持保留意见。伦敦玛丽女王大学的人工智能研究员Mike Cook说,通过语音检测抑郁症的想法“貌似不太可能”提供出高度精确的结果。
他指出,在人工智能驱动的情绪识别的早期,算法被训练为从图像和视频记录中识别情感,研究人员能够让系统识别的唯一情感是“假的”情感,如夸张的脸。虽然更明显的抑郁症迹象可能很容易被发现,但抑郁症和焦虑症有多种形式,而连接语言模型和疾病的机制仍然没有得到很好的理解。
“我认为这样的技术是有风险的。首先,它以一种可能不该有的方式将心理健康工业化,但实际上理解和照顾人类是复杂和困难的。”Cook说。“支持者可能会建议我们只把它作为治疗师的指南,但实际上,这项技术很容易就会被滥用,从精神健康问题的自动诊断,到允许这项技术渗透到教室、工作场所、法庭和警察局。像所有的机器学习技术一样,语音分析工具给我们披上了技术权威的外衣,而实际上这是一个微妙而复杂的课题,机器学习不太可能理解其中的细微差别。”
另外,该技术也避免不了AI技术的“偏见”顽疾。正如华盛顿大学人工智能研究员Os Keyes 所指出的,声音涵盖了广泛的特征,包括那些残疾人和那些用非英语语言、口音和方言说话的人,如非洲裔美国人的方言(AAVE)。
例如,一个以法语为母语的人在用英语进行测试时,可能会停顿一下或发音有些不确定,这可能会被人工智能系统误认为是一种疾病标记。2016年,Winterlight公司在《阿尔茨海默卜(Alzheimer’s Disease)杂志上发表了其最初的研究报告,发现其语音分析技术只对讲特定加拿大方言的英语者有效,之后便遇到了麻烦。
“声音是不同的,人们说话的习语形式不同,人们在社交场合的表达方式也不同,而且这些不是随机分布的。相反,它们往往(在此笼统地说)与特定群体密切相关。”Keyes说。
总的来说,检测抑郁症的语音初创公司的成绩好坏参半。Vocalis由以色列科技公司Beyond Verbal和Healthymize合并而成,主要是与梅奥诊所合作进行COVID-19生物标志物研究。Winterlight实验室在2019年宣布与强生公司合作开发阿尔茨海默氏症的生物标志物,目前仍在与基因泰克、Pear Therapeutics和其他合作伙伴进行临床试验。Sonde Health公司也在进行包括帕金森病在内的临床试验,该公司只完成了它从麻省理工学院的林肯实验室授权的抑郁症检测算法的早期测试。
到目前为止,这些公司的系统都没有得到美国食品和药物管理局(FDA)的全面批准。
技术成熟路漫漫
但Mondal称,Ellipsis公司的解决方案是独一无二的,因为它结合了声学(如音调、音调和停顿)和语义(与单词有关)算法,这些算法都经过了“行业标准化”评估工具的训练。
这些算法最初被送入数以百万计的“非抑郁症”患者的对话中,并在其中挖掘出音调、腔调、发音和其他特征。然后,Ellipsis的数据科学家增加了对话、心理健康问卷的数据以及来自抑郁症患者的临床信息,以“教导”这些算法来识别抑郁症的表面声音特征。
“我们利用多样化的数据集,以确保我们的算法没有偏见,并可以在全球范围内部署……我们的模型可以很好地归纳到具有不同人口统计学、不同口音和说话能力水平的新人群,并且足够强大,可以支持不同人群的实时应用,而且不需要基线要求,”Mondal说。“我们的机构审查委员会(IRB)批准的一项研究目前正处于第二阶段,涉及监测抑郁症诊所的病人。早期结果显示,我们的抑郁症和焦虑症的重要得分与临床医生的评估非常接近……我们也有9个IRB提案正在与梅奥诊所、宾夕法尼亚州立大学和哈特福德医疗中心等机构进行合作。”
而Keyes认为Ellipsis对其算法中的偏见所采取的方法“令人担忧”,而且脱离实际。“他们大谈特谈对偏见的关注,并在学术上进行严格的审查,但我发现有一篇关于偏见的论文,它有一些相当可怕的发现,”Keyes说。“首先,尽管他们以年龄不是影响准确性的因素为卖点,但是他们的测试对非裔美国人的真实阴性的正确率只有62%,对加勒比人的正确率只有53%。换句话说,40% 的情况下,他们会把一个黑人误认为是抑郁或焦虑的。这非常令人担忧。”
重压之下,Mondal也承认Ellipses的平台在法律上还不能被认为是一种诊断工具,而仅仅是一种临床决策支持工具。“Ellipsis打算遵循美国FDA对医疗人工智能的指导,计划由FDA监管批准其技术,用于测量临床抑郁症和焦虑症的严重程度,”他说。“以此为基础,希望我们能够将业务扩展到全球市常”