TussisWatch:一款智能手机系统,可以将咳嗽识别为慢性疾病的早期症状

慢性阻塞性肺疾病(COPD)和充血性心力衰竭(CHF)是进行性疾病,通常是心肺疾病的终末期,导致死亡和残疾。这两种疾病都可能表现出类似的相互矛盾的症状,如呼吸急促和咳嗽。患者往往发现咳嗽是这些症状中最令人尴尬和最具破坏性的。咳嗽会干扰社交活动,比如去看电影,还会妨碍人们在晚上入睡。美国胸科医师学会的咳嗽指南建议评估和监测咳嗽的严重程度。然而,缺乏证据表明咳嗽是慢性阻塞性肺病和慢性心力衰竭失代偿的早期症状。

如今的智能手机配备了先进的麦克风,可以记录内置麦克风感知到的音频数据。此外,数字信号处理能够计算声音出现的特征,使用机器学习算法进行模式识别,对咳嗽和非咳嗽事件进行分类。

慢性阻塞性肺病(COPD)、慢性心力衰竭(CHF)与对照咳嗽段的交叉率为零

图1所示。慢性阻塞性肺病(COPD)、慢性心力衰竭(CHF)与对照咳嗽段的交叉率为零。

本文介绍了一种基于智能手机的“TussisWatch”的开发,这是一种低成本,易于使用的家庭系统,可以检测咳嗽模式,以便个人更好地进行家庭监控。我们的目标是使用音频处理计算咳嗽发作的总数和咳嗽频率作为时间的函数。这一过程最终导致了算法的发展,以区分COPD和CHF或非疾病的咳嗽模式。

我们的团队共收集了82段COPD症状的咳嗽,47段CHF症状的咳嗽和81段健康成人的咳嗽进行比较。来自参与者的咳嗽数据被提取为音频文件的片段,使用几个众所周知的特征(即零交叉率,谱质心和Mel频率倒谱系数),如图1所示。

我们使用了一种称为合成少数派过采样技术(SMOTE)的过程来修复声音文件中的噪音和不平衡。使用基于随机森林的机器学习算法来创建决策支持规则。在此基础上,采用两级分类方案对记忆的正确性和召回率进行检验。被称为F-Measure和混淆矩阵的专业统计和数学计算帮助该团队开发了算法,这是一个区分疾病(COPD或CHF)或非疾病咳嗽模式的过程。

将整个数据集分成10个子集,进行10次交叉验证系统,评估10次。每次,一个模型被用来测试或验证模型,而九个子集被用来训练和建立一个决策模型,并在所有10次试验中得出平均误差。整个过程被称为机器学习算法。通过10倍交叉验证,灵敏度为80%,特异性为82%,准确度为80.7%。当测试小型数据集时,方差会更高,但当我们在每个级别添加10%的数据集并在级别上测试它们时,随着数据集的增加,它们开始减少。超过70%的数据集,方差变得稳定并且非常低。我们相信,这使我们对图2所示的两个级别的数据集的代表性充满信心。

不同子集和两级验证的方差趋势

图2所示。不同子集和两级验证的方差趋势。

用于区分对照咳嗽与疾病(即COPD或CHF)的特征更好,但COPD和CHF咳嗽之间存在明显混淆。然而,10倍的验证数字对于实际部署和潜在的扩展是非常令人鼓舞的TussisWatch更好地监测咳嗽的系统。在未来的研究中,我们建议设计个性化模型来提高分类准确性,并尝试更复杂的问题,如评估干预措施的影响(例如,在COPD中使用吸入器)。

Ponrathi R. Athilingam, Anthony Windmon
南佛罗里达大学,美国

出版

TussisWatch:一个智能手机系统识别咳嗽发作的早期症状慢性阻塞性肺疾病和充血性心力衰竭。
Windmon A, Minakshi M, Bharti P, Chellappan S, Johansson M, Jenkins BA, Athilingam PR
IEEE生物医学杂志,2018年9月24日

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复