寻找β - β残基配对用于蛋白质结构预测

从蛋白质的氨基酸序列预测蛋白质的三级结构在结构生物信息学和生物物理学中是非常重要和迫切需要的,特别是考虑到蛋白质的序列数量和实验确定的结构之间的差距越来越大。了解氨基酸残基之间的天然接触可以极大地促进蛋白质结构的预测,因此从氨基酸序列中预测蛋白质残基之间的接触越来越受到人们的关注。原则上,对蛋白质结构或功能至关重要的天然残基接触可以从进化中残基对的相关突变中推断出来。随着序列数据以前所未有的速度积累,从多序列比对中提取协同进化信息变得越来越可行。不幸的是,即使是最先进的算法预测的残基接触映射也经常包含许多错误,这损害了由接触辅助蛋白质结构预测生成的结构模型的准确性。然而,由于β-β相互作用中存在特征接触模式,因此β链中的残基配对信息可以从噪声接触图中相当可靠地推断出来。这种β-β接触信息可能有利于主要β蛋白的三级结构预测,这是一组具有复杂拓扑结构的蛋白质靶点,因此在蛋白质结构预测中具有很高的挑战性。

蛋白质结构预测

图1所示。

本文介绍了一种新的基于脊线检测的β-β接触预测器RDb2C,从任何预测的残基接触图中识别β链中的残基配对。理论上,相互作用的β链的连续残基对应该在原生接触图上呈现对角线或非对角线方向的连续接触,这可能被预测接触图中的噪声所掩盖。在这里,我们采用传统的计算机图像处理技术脊检测,从具有高水平噪声的预测接触图中捕获β-β相互作用的特征模式。然后,我们设计了一个新的多阶段随机森林框架,该框架读取脊信息以及附加特征,并预测所有β链之间的残基配对。该方法可以有效地提高对β-β接触的预测,从而对主要的β蛋白进行结构建模。

RDb2C可以对任何预测的接触图进行β-β接触预测。从CCMpred(一个流行的基于序列比对的接触预测器RDb)预测的接触图开始2在BetaSheet916和BetaSheet1452两种常规β蛋白测试集上,C在残基水平和链水平上分别达到了~62%和~76%的f1得分。即使在这种情况下,我们的方法也明显优于所有最先进的β-β接触预测方法,包括著名的bbcontacts,其在残基水平和链水平上的f1得分分别为~56%和~72%。此外,当采用更先进的RaptorX-Contact预测的接触图作为输入时,RDb2C获得了令人印象深刻的更高性能,在残基水平和链水平上的f1得分分别达到了~76%和~86%。在顶部结构建模试验中,β-β接触预测精度的提高可以进一步提高主要β蛋白的接触辅助结构预测ll是蛋白质长度)预测接触作为约束条件。对于含有≥50% β残基的61个主要是β蛋白,当使用原始RaptorX-Contact预测时,预测结构模型的质量(通过TM-score评估)平均为0.442。相反,当使用改进的RDb预测时2C时,数字增加到0.506,表明预测模型平均具有正确的折叠(TM-score > 0.5)。

原始代码,源数据/结果和实际使用的培训方案可在http://structpred.life.tsinghua.edu.cn/Software.html或在GitHub地址https://github.com/wzmao/RDb2C

毛文智,龚海鹏
北京大学生命科学学院,北京市结构生物学先进创新中心,
清华大学,北京100084

出版

从预测残基接触图中鉴定相互作用β-链中的残基配对。
毛伟,王涛,张伟,龚华
BMC生物信息学。2018年4月19日

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复