基于结构的虚拟筛选(SBVS)能够从大规模化合物库中快速识别潜在的活性分子。分子对接是SBVS中最常用的技术之一,它可以用于预测配体的结合姿态,描述蛋白质-配体的结合强度,并识别关键的相互作用。传统的分子对接方法一般使用刚性的蛋白质口袋作为对接的受体,即当蛋白-配体晶体结构已知时,移除配体分子再重新对接配体回到已知蛋白质的Holo态结合口袋。然而,在现实应用场景下的分子对接任务中,如果事先不知道受体的结合构象,由配体诱导的口袋构象的变动会使得刚性对接方法给出错误的预测。尽管AlphaFold2能够较准确地预测目标蛋白质的结构,但预测的靶标蛋白结构与结合态有一定差别,导致未考虑蛋白质柔性的刚性分子对接方法无法利用预测的结构给出正确的复合物结构。而现有的柔性分子对接方法,受限于计算复杂度,仅能考虑少量的侧链构象变化。一些基于深度学习的分子对接方法,对蛋白质进行粗粒化的主链编码在一定程度上可以克服局部的侧链构象变化,但由于口袋残基侧链原子信息的缺失以及缺乏基于物理模型的配体分子建模,所生成的对接构象经常出现配体构象不合理及配体与蛋白间的碰撞等问题,也不能提供对于配体进行优化所需要的受体与配体的相互作用细节。
针对以上存在的问题,北京大学来鲁华、裴剑锋团队发展了基于扩散模型(diffusion model)的受体柔性对接构象生成方法DiffBindFR。DiffBindFR使用基于消息传递的 SE(3)-等变网络编码蛋白质口袋和配体分子之间全原子的复杂相互作用。整个模型将柔性对接定义为一个学习四个变量在其切空间中的联合去噪过程的问题,包括:配体旋转 R、平移 T、可旋转键扭转 τ 以及口袋侧链扭转χ。生成的多个对接构象利用confidence model挑选出排名第一的构象作为最终对接结果(图1)。
图1. DiffBindFR生成分子对接构象的流程。
在PDBbind测试集上,DiffBindFR不仅在分子对接成功率(配体RMSD < 2 Å)上超越了以往的传统对接方法与深度学习方法,还能够高精度地预测出蛋白配体结合口袋中残基的侧链构象。在Posebusters测试集上,DiffBindFR同样取得了SOTA(state-of-the-art)的配体对接成功率。同时,DiffBindFR生成的口袋-配体复合物的全原子模型还具有很好的物理合理性。
在实际应用场景下,由于蛋白质口袋在结合不同配体时会发生不同程度的变化,因此交叉对接(cross-docking)是更能检验柔性对接方法应用潜力的任务。交叉对接的测试集包含了各个蛋白质口袋自由态以及不同结合态之间的交叉对接任务。DiffBindFR在各个子集上的分子对接成功率与对接物理合理性都超越了以往的传统对接方法以及深度学习对接方法。其中,在GPCR-AF2子测试集中,AlphaFold2预测的一些GPCR蛋白结构的侧链构象,阻挡了配体分子进入正确的结合位置,导致了传统对接方法的计算失败。由于DiffBindFR具有同时考虑侧链构象的柔性对接能力,可以在将口袋侧链优化到合理位置的同时将配体分子对接到正确的位置(图2)。此外,在27个DUD-E数据库中的由AlphaFold2建模的靶标上,DiffBindFR与基于诱导契合的IFD-MD方法对比也展现出更出色的口袋侧链优化能力与对接成功率。
图2. 两个GPCR-AF2子测试集上的对接案例。其中,蛋白和配体复合物的晶体结构以灰色显示。AlphaFold2建模的蛋白结构以淡绿色显示。DiffBindFR以AlphaFold2建模的主链结构为输入,柔性对接得到的配体和口袋侧链以蓝色显示。每个小图的底部左侧为使用的对接方法。Pocket RMSD为Holo态与AF2结构之间的口袋Cα RMSD。(A)AlphaFold2预测的Human cysteinyl leukotriene receptor 2结构与其拮抗剂ONO-2570366(PDB ID:6RZ6)的对接结果。DiffBindFR将配体对接到了正确的位置,同时化解了R267侧链与配体的碰撞;(B)AlphaFold2预测的5-Hydroxytryptamine receptor 2A结构与其反向激动剂methiothepin(PDB ID:6WH4)的对接结果。DiffBindFR将配体对接到了正确的位置,同时化解了D156侧链与配体的碰撞,准确地预测了侧链构象。
DiffBindFR的研究工作以“DiffBindFR: An SE(3) Equivariant Network for Flexible Protein-Ligand Docking”为题,近日在线发表在Chemical Science期刊上。北京大学定量生物学中心/生命科学联合中心/化学与分子工程学院/北京大学成都前沿交叉生物技术研究院来鲁华教授与北京大学定量生物学中心裴剑锋研究员为本文的通讯作者。北京大学定量生物学中心2021级博士研究生朱金涛与北大-清华生命科学联合中心2020级博士研究生顾仲晖为本文共同第一作者。这项工作得到了国家重点研发计划、国家自然科学基金、中国医学科学院和安徽省科技重大专项项目计划的支持。
程序下载地址:https://github.com/HBioquant/DiffBindFR
原文链接:https://pubs.rsc.org/en/content/articlelanding/2024/sc/d3sc06803j