摘要
+ })(window)摘要
动机:探索药物-蛋白质相互作用(DPIs)提供了一种快速而精确的方法来帮助实验室实验发现新药。基于网络的方法通常利用药物-蛋白质关联网络,通过相关蛋白质或药物的信息预测DPI,称为“关联内疚”原则。然而,“关联内疚”原则并不总是正确的,因为有时相似的蛋白质不能与相似的药物相互作用。最近,基于学习的方法通过利用已有的表征相互作用的数据库来学习DPIs的分子特性,但忽略了网络级信息。
结果:我们提出了一种新的方法,即桥接DPI。我们设计了一类虚拟节点来弥合药物和蛋白质之间的鸿沟,并构建了一个可学习的药物-蛋白质关联网络。该网络基于来自下游任务DPI预测的监督信号进行优化。通过药物-蛋白质关联网络传递的信息,图形神经网络可以捕获不同药物和蛋白质之间的网络级信息。通过结合网络级信息和基于学习的方法,BridgeDPI在三个真实DPI数据集中实现了显著的改进。此外,案例研究进一步验证了BridgeDPI的有效性和可靠性。
可用性和实施:BridgeDPI的源代码可访问https://github.com/SenseTimeKnowledge-Mining/BridgeDPI.本研究中使用的原始数据可在https://github.com/IBM/可解释的DTIP(用于BindingDB数据集),https://github.com/masashitsubaki/CPI_prediction(对于线虫和人类)数据集,http://dude.docking.org/(对于DUD-E数据集),分别为。联系人:limin@mail.csu.edu.cn或zhangjie1@sensetime.com
为了展示BridgeDPI在实际虚拟筛选中的性能,我们选择了两个重要的病毒靶点,3C样蛋白酶(3CLpro)和RNA依赖性RNA聚合酶(RdRp)作为研究对象。这两个靶点在蛋白质复制/转录和宿主细胞识别中起主要作用,因此对病毒繁殖和感染传播至关重要(Murugan等人,2020年)。与(Kim等人,2021年)一样,我们也选择了一些候选药物,如巴里西尼和伊维菌素,来测试预测的相互作用。首先,我们获得两个目标的氨基酸序列[3CLpro序列来自蛋白质数据库(PDB)数据库(Sussman等人,1998年),PDB ID为6WQF,RdRp来自国家生物技术信息中心(NCBI;Pruitt等人,2007年),NCBI YP_009725307.1]。然后,序列和候选分子被送入桥联DPI。最后,预测了它们的相互作用概率,如表5所示。表5显示,巴里西尼布、雷姆德西韦、洛匹那韦和利托那韦都是非常有潜力的药物,可以与3CLpro相互作用;伊维菌素、雷德西韦、索非斯布韦、达克拉他韦、洛匹那韦和利托那韦都是能与RdRp结合的有效药物。事实上,许多研究和临床试验也验证了结果(Caly et al.,2020;Elfiky,2020;Favalli et al.,2020;Kalil et al.,2021;Sadeghi et al.,2020;Stower,2020)。相比之下,阿司匹林等无关药物与病毒靶点的相互作用潜力很小。这些实验结果验证了BridgeDPI预测新药的有效性和可靠性,表明BridgeDPI对实际研究和药物发现具有指导作用。
5 结论
在本研究中,我们提出了一个端到端的深度学习框架,通过在基于学习的框架中引入网络级信息来预测DPI。我们构建了一个有监督的药物-蛋白质网络,并在其中引入了一类桥节点。桥节点通过在不同的药物和蛋白质之间传递信息来弥合药物和蛋白质之间的差距,因此我们可以使用GNN来捕获网络级别的信息,并依靠有监督的“关联内疚”来执行预测。因此,我们的模型综合了基于网络的方法和基于学习的方法的优点,集成了更全面的特征。实验表明,在BindingDB、线虫、人类、DUD-E数据集上,我们的方法优于其他竞争方法,并实现了SOTA性能。此外,带有具体例子的案例研究也重申了我们模型的实用性。
-