从复杂的问卷和访谈数据到智能贝叶斯网络模型

医疗数据往往结构糟糕、不完整和不一致。如果我们纯粹依靠机器学习技术,这限制了我们生成有用的预测和决策支持模型的能力。这意味着我们需要在不同的模型开发阶段利用专家知识。本文发表在《医学人工智能》杂志上,解决了这个在许多应用领域都很常见的问题。本文描述了一种从复杂数据中建立有效贝叶斯网络(BN)模型的严格且可重复的方法。

图1所示。提出了基于问卷调查和访谈数据的专家贝叶斯网络开发流程。

BN是什么?它是一种统计模型,表示感兴趣的因素之间的概率关系。bn也被称为概率图形模型,因为它们由表示感兴趣因素的节点和通常表示影响方向的弧线组成。支撑bp网络的是贝叶斯概率推理,它为理性的现实世界推理提供了一种方法。对某些事件的不确定性的任何信念都被认为是根据迄今为止获得的经验或数据而临时的,然后由新的经验或数据来修正。

我们所说的复杂数据是什么意思?在本文中,复杂数据主要是指来自结构不良的问卷调查和访谈的数据。这些数据从来没有被设计用来获得适合因果模型的信息。它涉及数百个问题的答案,但不可避免地包括重复、冗余和矛盾的回答。

在缺乏专家知识的情况下,仅从这些数据中学习BN模型尤其成问题,因为我们对模拟风险管理的因果干预感兴趣。这项工作的新颖之处在于,它提供了一个严格的统一和概括的框架,解决了BN模型开发的整个生命周期。开发过程如图1所示。

图2所示。通过模拟干预/s(平方节点),决策者可以获得风险管理过程的示例。

图2所示。通过模拟干预/s(平方节点),决策者可以获得风险管理过程的示例。

使用法医精神病学的数据验证了该方法。由此产生的BN模型展示了与该研究领域中采用的数据驱动的最先进模型相比具有竞争力的优越预测性能。官方manbetx手机版更重要的是,由此产生的BN模型不仅提高了预测的准确性,而且通过干预对风险管理有用,并且在回答基于未观察到的证据的复杂临床问题方面增强了决策支持。

图2展示了一个风险管理示例,在BN中,决策者可以选择模拟干预的影响(由平方节点表示)。更具体地说,通过实施治疗,决策者可以观察到干预预期对因素的影响。愤怒,考虑到其他相关因素,如参加治疗的动机和对治疗的反应。对愤怒的控制随后会影响不受控制的侵略’通过这一点,其他一些感兴趣的因素也被纳入到模型中。

该方法适用于任何涉及此类复杂非结构化信息的大规模决策分析的应用领域。它对决策科学家提出了挑战,要求他们基于推理真正需要的信息来构建模型,而不是基于可用的数据。因此,它迫使决策科学家以更明智的方式使用可用数据。

安东尼·康斯坦丁努,诺曼·芬顿,威廉·马什卢卡斯Radlinski

出版

从复杂的问卷和访谈数据到医疗决策支持的智能贝叶斯网络模型。
李建军,李建军,李建军。
Artif Intell Med. 2016年2月

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复