首页

[AI与药物设计-9]上海交通大学《JCIM》:全原子扩散模型精准预测含非天然氨基酸环肽三维结构!

2026-04-14

上海交通大学邹一可副教授团队针对含有非天然氨基酸及多种环化化学类型的小型环肽在三维结构高精度预测中面临的挑战(现有通用生物分子模型虽已支持非天然氨基酸,但预测精度仍不足),提出基于扩散生成模型的环肽结构预测新策略,具体设计了改进的全原子扩散生成模型AGDIFF(该模型最初用于小分子构象生成,团队将其适配并重新训练于包含36,198个样本的CREMP大环肽构象数据集),并通过采用二维分子图表示以天然支持非天然氨基酸与复杂连接键、结合立体化学校正步骤以解决模型对立体化学不敏感的问题,最终在基准肽上实现了平均RMSD为0.79 Å、环扭转指纹偏差为6.55°的高精度,并可靠生成对映异构残基的正确对映体。拉氏图分析进一步验证了生成构象的合理性。该工作证明了基于扩散的深度学习在环肽建模中的有效性,为含非天然氨基酸的大环肽的合理药物设计提供了有力工具。

研究成果于2026年4月10日以题为“Accurate 3D Structure Prediction of Small Cyclic Peptides Containing Non-Canonical Amino Acid Residues Using an All-Atom Diffusion Model with Stereogenic Implementation”发表在《Journal of Chemical Information and Modeling》上。

373f868379b54a77a750190bc95ef633.png

b888f8131b734677a676a34f3b1fe4d9.png

图1:AGDIFF 框架概述。图一展示了AGDIFF模型的双编码器架构:局部GIN编码器提取原子间键级相互作用,全局注意力SchNet编码器捕捉分子内长程几何依赖。两者输出的梯度按权重组合(局部为主,全局为辅)指导逆向扩散去噪。通过最小化梯度预测误差,模型学会从随机噪声中恢复出真实环肽构象。该设计平衡了局部化学精度与整体拓扑合理性,是实现高精度结构预测的核心。

3a24cf91af4142779422f9c7a8a2ce07.png

图2:从分子图中提取的节点特征与边特征的可视化。图二直观呈现了AGDIFF模型对环肽分子图的双重特征编码:红色垂直向量对应节点特征,编码每个原子的元素类型、杂化状态、局部键合等属性;蓝色向量对应边特征,编码原子间的化学键类型、连接距离及空间相互作用。这种图表示将分子拓扑结构与几何信息解耦,使扩散模型既能保留原子局域化学环境,又能感知全局连接模式,为后续构象生成提供结构化输入,是模型处理非天然氨基酸和复杂环化化学的基础。

本研究针对含非天然氨基酸的小型环肽三维结构预测难题,提出并改进了全原子扩散生成模型 AGDIFF。通过采用二维分子图表示与专用环肽构象数据集 CREMP 训练,模型克服了序列表示及通用小分子数据集缺乏大环构象先验的局限。引入事后立体化学校正步骤,将对映体错误完全修复,使 RMSD 和环扭转偏差分别提升 34.2% 和 38.9%。AGDIFF 成功处理多种非天然氨基酸及复杂环化化学,在实验结构预测上超越现有最先进蛋白模型,为环肽的合理设计、虚拟筛选及先导化合物优化提供了高效计算工具。

文献来源:Wu, Dizhou; Zou, Yike (2026). Accurate 3D Structure Prediction of Small Cyclic Peptides Containing Non-Canonical Amino Acid Residues Using an All-Atom Diffusion Model with Stereogenic Implementation. ACS Publications. Collection.

DOI:https://doi.org/10.1021/acs.jcim.5c0323


来源:Medicine世界微信公众号
新闻搜集:戎吉平