AI技术丨AlphaProteo:生命科学的高效蛋白质binder生成器

2024-09-06

引言
体内的每一个生物过程,从细胞生长到免疫反应,都依赖于被称为蛋白质的分子之间的相互作用。就像钥匙与锁的关系一样,一种蛋白质可以与另一种蛋白质结合,帮助调节关键的细胞过程。虽然像 AlphaFold 这样的蛋白质结构预测工具已经让我们对蛋白质如何相互作用以执行其功能有了极大的了解,但这些工具无法创造新的蛋白质来直接操纵这些相互作用。然而,科学家能够创造出成功与目标分子结合的新型蛋白质。这些结合剂可以帮助研究人员在广泛的研究领域加速进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至作物对害虫的抗性。


近日,Google DeepMind 推出了 AlphaProteo,这是一种用于蛋白质设计的AI模型,能够从头设计高亲和力的蛋白质binder,为许多研究应用提供了新的解决方案[1]。其中,AlphaProteo在七个目标蛋白质binder设计的湿实验验证中实现了9%到88%的成功率,比现有最佳算法高5到100倍,设计的binder亲和力更是比其他方法高3到300倍,对其中四个目标达到了80-960pM。换而言之,仅通过一轮中等通量筛选,AlphaProteo就能为许多研究应用生成“即用型”binder,无需进一步优化。

AlphaProteo蛋白质设计系统


图1. A. AlphaProteo的蛋白质binder设计系统示意图。B. 蛋白质binder设计问题示意图。

AlphaProteo 由生成模型和过滤器组成,如图 1A 所示:
1. 生成模型:在蛋白质数据库(PDB)的结构和序列数据以及 AlphaFold 预测的蒸馏集上进行训练。
2. 过滤器:对生成的binder进行评分,以预测它们是否会在实验中成功。
为了设计binder,我们输入 “目标” 蛋白质的结构,并可选地指定代表目标表位的 “热点” 残基(Hotspots)。如图1B所示,生成模型输出该目标的候选binder的结构和序列实际应用时生成大量设计候选分子,然后在实验测试之前过滤为较小的集合,进行湿实验的检测确认。

实验验证及结果
为了验证 AlphaProteo 的性能,研究人员设计了针对八种结构多样的目标蛋白质的结合剂,其中包括两种参与感染的病毒蛋白和六种治疗上重要的人类蛋白质。实验结果表明,AlphaProteo 在以下几个方面具有显著优势:

1.中通量筛选获得亚纳摩尔亲和力binder


图2. 研究人员利用AlphaProteo对八个目标蛋白质进行binder设计,湿实验显示其设计成功率及设计binder亲和力均显著优于其他设计方法。

• 高实验成功率:对于每个目标,生成大量的候选binder分子,长度为50 - 140 个氨基酸,并通过酵母表面展示进行实验检验。如图2所示,实验成功率从 9%(TrkA)到 88%(BHRF1)不等,在 7 个目标上的成功率高于现有最佳方法。例如,在 BHRF1、SC2RBD 和 IL - 17A 上,分别比现有次优方法高 5 倍、8 倍和 700 倍。
• 高通用性:通过计算来自 PDB 的 200 个随机选择的目标蛋白质上 3 个表位的计算模拟成功率,发现 80% 的 PDB 目标比最困难但成功获得结合剂的 IL - 17A 具有更高的模拟成功率,这表明 AlphaProteo 可以广泛应用于生物重要蛋白质的binder设计问题。
• 高结合亲和力:对筛选命中的蛋白质进行重组表达和纯化,以测量它们与目标的结合亲和力(KD 值)。AlphaProteo 每个目标的最佳 KD 值在 4 个目标上小于 1 nM,在 6 个目标上小于 10 nM,在 7 个目标上小于 30 nM。与其他设计方法的最佳未优化binder相比,AlphaProteo 设计分子的亲和力在所有目标上都更好,例如在 BHRF1、SC2RBD、IL - 7RA、PD - L1、TrkA 和 IL - 17A 上分别提高了 7 倍、4 倍、37 倍、5 倍、380 倍和 5 倍。


图3. HTRF特异性实验结果,设计binder分子仅与其目标蛋白质特异性结合,与其他非目标蛋白质无结合信号。

• 特异性结合和结构多样性:如图3所示,设计的binder分子能够特异性地结合目标蛋白质,并且通过突变实验验证了它们通过预期的相互作用与目标表位结合。同时,对成功分子的结构多样性分析表明,AlphaProteo 能够为每个设计问题生成许多独特的解决方案。


2. 功能验证
• SARS-CoV-2 变体中和作用:测试了四个设计binder分子对 SARS-CoV-2 变体的中和能力,设计binder不仅可以成功中和原始毒株(hCoV19/England/02/2020),其中一些binder分子能够中和多个变体。

• VEGF 受体下游信号的抑制:设计的binder分子能够有效抑制 VEGF 信号,其效果比临床使用的抗体贝伐单抗更高。


3. 结构验证


图4. A. 设计binder(蓝色)与SARS-CoV-2刺突蛋白(黄色)复合物的冷冻电镜解析结构,binder结构与AF2-multimer预测结构(灰色)高度一致。B-C. 设计binder(蓝色)与VEGF-A同源二聚体(黄色)复合物的X射线晶体结构,binder结构与AF2-multimer预测结构(灰色)高度一致。D-E. 设计binder-目标蛋白质结合面特写,相互作用的侧链结构(彩色)与AF2-multimer预测结构(灰色)高度吻合,疏水侧链的堆积和特定氢键的形成几乎完美的再现了设计。

通过冷冻电镜(cryo-EM)和 X 射线晶体学获得binder-目标复合物的结构,验证了binder的结构及结合模式与设计预期的一致性。例如,冷冻电镜结构显示设计binder与 SARS-CoV-2 刺突蛋白复合物的真实结构与设计高度吻合,其中binder分子Cα RMSD 在 0.84 - 3.14 Å。


4. 结语
AlphaProteo 能够在单轮、中通量测试后为各种目标蛋白质生成低至亚纳摩尔级别亲和力的binder。这些binder分子量小(5 - 15 kDa)、热稳定性高且高表达,因此在某些研究应用中可能无需进一步优化即可使用。然而,目前实验验证的目标相对较少,且所有结合剂都是使用目标晶体结构作为输入设计的。研究团队表示,未来希望进一步改进 AlphaProteo 的性能并扩展其功能,以解决更广泛的结合剂设计问题。总之,AlphaProteo 为生物学和健康研究提供了一种强大的新工具,有望在控制细胞信号、蛋白质成像、赋予目标特异性等领域发挥重要作用。

关注大湾生物,了解各类前沿AI蛋白质模型的开发与应用。大湾生物的生物药物分子评估与优化平台AlfaDAX结合多种自研和开源模型,通过对药物候选分子序列、结构、功能的全面计算分析,预测影响抗体分子成药性的各种关键因素,提前进行评估与优化。AlfaDAX线上系统(https://store.greatbay-bio.com/)多种可开发性和可成药性特征的评估预测值与实际值的准确度接近100%,对创新药物分子可成药性改造有显著的指导作用,大幅降低湿实验工作量,加快新药研发和上市进程。

参考文献
1. Zambaldi, V., La, D., Chu, A. E., Patani, H., Danson, A. E., Kwan, T. O. C., Frerix, T., Schneider, R. G., Saxton, D., Thillaisundaram, A., Wu, Z., Moraes, I., Lange, O., Papa, E., Stanton, G., Martin, V., Singh, S., Wong, L. H., Bates, R., Kohl, S. A., Abramson, J., Senior, A. W., Alguel, Y., Wu, M. Y., Aspalter, I. M., Bentley, K., Bauer, D. L. V., Cherepanov, P., Hassabis, D., Kohli, P., Fergus, R., & Wang, J. (2024). De novo design of high-affinity protein binders with AlphaProteo. Google DeepMind.
2. AlphaProteo generates novel proteins for biology and health research - Google DeepMind. https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/