使用深度学习的中分辨率低温电镜图中蛋白质结构检测

由于最近的技术突破,Cryo-EM已经在结构生物学中确立了其作为确定大分子结构的不可或缺的方法选择的地位。近年来,低温电镜(cryo-EM)解决的生物分子结构急剧增加,包括那些以高、近原子分辨率确定的生物分子结构。另一方面,仍然有许多结构以中等分辨率解决,5到10 Å,甚至每年以更低的分辨率解决。在这里,我们开发了一种计算方法,Emap2sec,它可以识别蛋白质的二级结构,α螺旋,β片,以及其他5到10 Å分辨率的EM图。Emap2sec使用卷积深度神经网络作为其算法的核心,该算法最近在2D和3D图像识别任务中非常成功。Emap2sec将二级结构分配给EM地图中的每个网格点。因此,局部预测是在地图的大区域的背景下进行的。

manbetx登录下载科学地图集。使用深度学习的中分辨率低温电镜图中蛋白质结构检测

图1所示。Emap2sec的架构。A,流程图。Emap2sec以3D EM密度图作为输入,并以尺寸为11Å*11 Å*11 Å的体素对其进行扫描。Emap2sec有两个阶段。阶段1网络取体素的归一化密度值,输出三个二级结构类的概率值。阶段2网络获取阶段1网络的输出,并通过考虑对相邻体素的分配来细化分配。最后,为每个体素分配一个二级结构类,该二级结构类是三种结构类型中概率最大的。B,第一阶段和第二阶段深度神经网络的架构。第一阶段网络有五个卷积神经网络(CNN)层,然后是一个最大池化层。 The last layers of the network are two fully connected (FC) layers. The phase 2 network consists of five fully connected neural nets followed by an output layer.

Emap2sec的体系结构如图1所示。Emap2sec用11的立方体扫描EM地图3.一个3.并对每个立方体的中心位置进行二次结构检测。Emap2sec具有典型的两相神经网络架构,其中第一个网络的输出通过第二个网络进一步细化,从而降低预测中的噪声。Emap2sec在两个EM地图数据集上进行了性能测试,一个是34张6.0 Å和10.0 Å分辨率的模拟EM地图数据集,另一个是43张5.0 ~ 9.5 Å分辨率的实验EM地图数据集。在6.0 Å和10.0 Å上,模拟图谱在每个氨基酸水平上的总体精度平均分别为83.1%和79.8%。在实验地图数据集上,平均准确率为64.4%,最高记录为91.6%。

manbetx登录下载科学地图集。使用深度学习的中分辨率低温电镜图中蛋白质结构检测

图2所示。应用Emap2sec对古生菌20S蛋白酶体(EMD-1733)进行蛋白二级结构检测,图谱分辨率为6.8 Å。左为低温电镜密度图;中间为Emap2sec检测到的二级结构。品红点,阿尔法螺旋;黄色,β链;绿色循环。对,与密度图相关的原子细节结构。

Emap2sec可以在kiharalab.org (https://kiharalab.org/emsuites/)上找到。一种更新的方法,Emap2sec+,也可以检测低温电镜图中的DNA/RNA结构,现在已经开发出来,并在同一个网站上提供。

Emap2sec+论文的预印本在bioRxiv (https://www.biorxiv.org/content/10.1101/2020.08.22.262675v1)上发布。

Sai Raghavendra madhuri Venkata Subramaniya
普渡大学计算机科学系,美国印第安纳州西拉斐特47907

出版

利用深度学习技术在中分辨率低温电镜图中检测蛋白质二级结构
madhuri Venkata Subramaniya SR, Terashi G, Kihara D
Nat Methods. 2019年9月

脸谱网 推特 linkedin 邮件 脸谱网 推特 linkedin 邮件

留言回复