首页

APSB(IF=14.6)|香港中文大学AI赋能适配体药物发现:10 个月从靶点到FDA孤儿药认证,靶向CTGF-CT域治疗杜氏肌营养不良优于临床失败抗体

2026-03-16

9ed912aed8ad41a5b255d536024c8617.png

由香港中文大学中医学院張保亭教授领衔,联合香港浸会大学、上海交通大学、北京师范大学-香港浸会大学联合国际学院等多家机构的研究团队,在期刊《Acta Pharmaceutica Sinica B》(影响因子 14.6)发表了题为 “AI-powered therapeutic aptamer drug discovery: Targeting the CT-domain of CTGF for Duchenne muscular dystrophy” 的研究论文。研究直击杜氏肌营养不良(DMD)临床治疗核心痛点,靶向 CTGF VWC 结构域的抗体药物 FG-3019 三期临床宣告失败的行业难题,首创混合 VAE-GAN 架构的生成式 AI 模型 AptGEN,仅用42 天就完成高亲和力治疗性核酸适体的筛选与优化,成功开发出候选药物 Apc003OA。该药物在 mdx 小鼠(DMD 经典动物模型)中展现出远超 FG-3019 的抗纤维化疗效,且全程不引发代偿性促纤维化因子 TGF-β1 升高,同时具备优异的肌肉组织滞留性与长期安全性。更具转化价值的是,研究团队仅用10 个月就完成从靶点发现、适体药物开发到美国 FDA 孤儿药资格+儿科罕见病资格双认定,为这一致命罕见病带来了全新的精准治疗方案,也为 AI 赋能核酸适体药物研发立了全新的行业标杆。

摘要

杜氏肌营养不良症(DMD)是一种致命的X连锁遗传病,进行性肌肉纤维化是导致患者死亡的关键因素。虽然CTGF是DMD的一个治疗靶点,但靶向其VWC结构域的抗体(FG-3019)在临床试验中失败。通过实验验证,团队确定CT结构域是更优的靶点,因为它比VWC结构域对CTGF的纤维化活性贡献更大,且不会升高代偿性TGF-β1水平。核酸适体是通过SELEX技术鉴定的合成寡核苷酸,能通过其独特的三维构象特异性结合柔性蛋白结构域。它们分子量小,可在保持高靶点特异性的同时实现有效的组织穿透,使其成为理想的CT结

构域抑制剂。然而,传统的SELEX过程耗时且效率低下,需要多轮筛选。本研究中,团队采用生成式AI模型AptGEN,在42天内快速发现了一个有效的、特异性靶向CT结构域的核酸适体。这种经过化学修饰的核酸适体(Apc003OA)能在肌肉组织中长时间分布和停留,而FG-3019则不能。重要的是,与FG-3019相比,它在体外和在mdx小鼠中表现出更好的纤维化抑制活性。此外,Apc003OA在mdx小鼠中显示出良好的安全性。在10个月内,团队从靶点结构域发现、核酸适体药物发现,进而获得了美国食品药品监督管理局授予的孤儿药资格认定和儿科罕见病资格认定。


8b119d43444d43d99ea39718e228fac3.jpg

介绍


杜氏肌营养不良(Duchenne muscular dystrophy, DMD)是一种由抗肌萎缩蛋白基因突变引起的致死性X连锁遗传病,导致进行性肌肉变性、纤维化和早逝。尽管靶向抗肌萎缩蛋白基因的策略有望恢复蛋白表达,但面临重大挑战且成效有限。

近年来,针对DMD潜在病理变化的治疗方法受到关注。纤维化是DMD最突出的病理变化之一,它会抑制肌肉再生,降低肌肉力量和灵活性,最终导致死亡。在纤维化的关键介质中,结缔组织生长因子(connective tissue growth factor, CTGF/CCN2)发挥核心作用。CTGF蛋白水平在DMD患者的骨骼肌中显著升高,并与肌肉纤维化程度正相关。降低DMD动物模型(mdx小鼠)的CTGF水平可显著降低肌肉纤维化程度并增强肌肉力量。因此,CTGF被认为是DMD治疗的潜在靶点。

CTGF具有四个功能结构域:IGFBP结构域、VWC结构域、TSP1结构域和CT结构域。VWC结构域和CT结构域都参与CTGF的纤维化活性,表明它们可能成为DMD的治疗靶点。然而,靶向VWC结构域的抗体FG-3019(Pamrevlumab)虽然在DMD临床前模型中显示出希望,但在III期临床试验中未能达到疗效终点。这一临床结果促使研究者重新评估VWC结构域是否为CTGF的最佳治疗靶点。

本研究数据显示,FG-3019治疗会升高代偿性TGF-β1水平,这可能会削弱FG-3019的纤维化抑制活性。更重要的是,CT结构域对CTGF纤维化活性的贡献大于VWC结构域,且不会引起代偿性TGF-β1水平升高。这些发现提示,CT结构域是DMD纤维化治疗中CTGF的更优治疗靶点。

核酸适配体是通过SELEX技术筛选的单链DNA/RNA寡核苷酸。作为有前景的治疗药物,适配体具有几个关键优势:可通过固相合成轻松进行化学修饰;热稳定性高,在-20°C下保质期超过12个月;化学合成过程保证了优异的批次间重现性;临床试验中显示出极低的免疫原性。特别是,适配体可以通过其独特的三维折叠结构快速识别并结合柔性蛋白区域,实现纳摩尔级结合亲和力。其小分子量(8-15 kDa,约为IgG抗体的1/10)可实现高效的组织穿透,尤其是在血管通透性低的肌肉组织中。因此,开发靶向CT结构域的适配体用于DMD治疗具有重要意义。

传统SELEX过程耗时且效率低下。基于AI的筛选技术为药物发现提供了更高效的计算机驱动方法。本研究开发的AptGEN是一个使用混合VAE-GAN架构的生成模型,能够捕捉进化模式和结构基序,加速CTGF适配体药物的发现。

实验方法


靶点验证模块

构建CTGF敲除的成纤维细胞,分别表达全长CTGF、VWC结构域缺失的CTGF和CT结构域缺失的CTGF,比较各组的纤维化标志物水平和TGF-β1水平。同时,使用FG-3019处理细胞,检测TGF-β1水平变化,并通过联合使用TGF-β1抗体验证代偿性TGF-β1对FG-3019疗效的影响。

AptGEN平台

1.数据预处理与质量评估

对原始NGS数据进行严格质控,确保测序错误率和引物错配率均低于5%。分析核苷酸分布和序列计数分布,确认筛选过程有效富集了高亲和力序列。

2.AptGEN模型架构

AptGEN采用混合架构,结合了变分自编码器(Variational Autoencoder, VAE)和生成对抗网络(Generative Adversarial Network, GAN)。

所有输入的ssDNA序列均进行one-hot编码,转换为形状为(N, 4, L)的张量,其中N为批量大小,4代表核苷酸通道(A, C, G, T),L为序列长度。

1)VAE组件作为生成主干:

①编码器:由三个一维卷积层组成,配置为:(1) 128个滤波器,核大小5,步长2,填充2;(2) 256个滤波器,核大小5,步长2,填充2;(3) 512个滤波器,核大小5,步长2,填充2。每个卷积层后接批归一化和LeakyReLU激活函数(负斜率为0.2)。最后一层输出被展平,传递到两个独立的全连接层,生成潜变量分布的参数:均值向量(μ)和对数方差向量(log σ²),维度均为64。

②解码器:通过转置卷积层从潜变量z重构原始序列,z通过重参数化技巧采样:z= μ+σ⊙ε。解码器结构与编码器镜像对称。

2)GAN组件作为优化引擎:

①生成器:将VAE潜空间采样的64维噪声向量上采样为完整适配体序列。架构包括一个全连接层和三个一维转置卷积层:(1) 256个滤波器,核大小5,步长2,填充2;(2) 128个滤波器,核大小5,步长2,填充2;(3) 4个滤波器,核大小5,步长2,填充2。最后一层使用Softmax激活函数输出核苷酸概率分布。

②判别器:是一个卷积神经网络,用于区分真实序列和生成序列。架构与VAE编码器镜像。

3)条件GAN实现:将预测的亲和力类别作为辅助条件,与潜向量z拼接后输入生成器;对判别器,条件向量与展平的特征图拼接后输入全连接层。

3.训练过程

AptGEN仅使用前5轮SELEX数据进行训练。损失函数包括:

1)VAE损失:优化证据下界,包括重构损失和KL散度。

2)GAN损失:基于极小极大博弈的对抗损失。

使用Adam优化器(β1=0.9,β2=0.999),批量大小128,学习率从1×10⁻⁵预热至4×10⁻⁴,随后通过余弦退火调度衰减。训练周期50,000轮。

4.生成后筛选流程

AptGEN生成数千条潜在高亲和力序列后,通过多阶段计算筛选:

1)高亲和力概率分布分析:分析VAE重构隐层,识别富含强结合子的序列空间区域。

2)高斯混合模型聚类:使用无监督学习算法将高维潜空间划分为不同簇,优先选择平均预测亲和力最高的簇进行湿实验验证。

3)结合亲和力验证:合成候选序列,使用生物层干涉术(BLI)定量测量与CTGF CT结构域的结合亲和力。预测分数与实验测得的亲和力排名相关性高达0.917(Pearson相关系数,P=7.959e-5)。

4)功能验证:对亲和力最高的5条候选序列进行体外抗纤维化活性测试。

适配体优化模块

1.截断优化

通过对精英簇序列进行多重序列比对,发现高度保守的“CCCTC”基序。RNAfold预测显示该基序对维持稳定二级结构至关重要;RosettaFold2NA建模显示该基序直接介导与CTGF CT结构域的关键相互作用。截断该基序后,结合亲和力从9.225 nmol/L急剧下降至971.2 nmol/L,证实其为功能性核心。截断后得到Apc003。

2.化学修饰优化

1)甲氧基修饰:对Apc003中所有C和G进行2'-O-甲基化修饰。BLI测定显示完全修饰的Apc003-all亲和力提高至9.89 nmol/L。血清稳定性测试显示,在100% FBS中72小时后,Apc003-all仍保持>95%的结构完整性。

2)长效脂肪酸修饰:为延长体内半衰期,比较了不同修饰策略(PEG化、不同链长脂肪酸)。药代动力学研究显示,十八碳二烯酸修饰的Apc003OA半衰期最长,达163.18小时,优于PEG化或其他脂肪酸修饰。

体内外药效验证模块

采用mdx小鼠模型,12周龄小鼠随机分组,每周皮下注射给药,持续12周或5个月。评估指标包括:肌肉特异性力、前肢握力、纤维化标志物水平、Masson染色纤维化指数、TGF-β1水平、组织分布和安全性。

CT结构域是DMD治疗的最优靶点

d4aff5ad32894416842a2420d38cf6aa.jpg

图 1.CT 结构域是优于 VWC 结构域、不会引发代偿性 TGF-β1 升高的最优靶点结构域


通过 CTGF 结构域缺失实验证实三大核心结论:

1.纤维化贡献差异:CTGF-ΔCT 组纤维化标志物(纤连蛋白、III 型胶原)表达下调 50%-80%,CTGF-ΔVWC 组仅下调 20%-30%,CT 结构域对 CTGF 纤维化活性的贡献远大于 VWC 结构域;

2.代偿性因子差异:CTGF-ΔCT 组无 TGF-β1 升高,而 CTGF-ΔVWC 组、FG-3019 处理组均出现浓度依赖性 TGF-β1 升高;

3.失效机制证实:联合 TGF-β1 抗体可完全逆转 FG-3019 的疗效衰减,代偿性 TGF-β1 升高是 FG-3019 临床失败的核心原因。

AptGEN模型实现适体快速筛选

AptGEN模型实现适体快速筛选


eea7e6b4738542fe88348e4977f02afd.jpg

图 2.AI 驱动生成的靶向 CTGF CT 结构域高亲和力适体在体外展现出强效抗纤维化活性


AI 模型 AptGEN 展现出颠覆性的筛选效率与精准度:


1.周期大幅缩短:传统 SELEX 需 20 轮、100 天,AptGEN 仅需 5 轮 SELEX+7 天 AI 计算,总耗时 42 天,研发效率提升 2.4 倍;


2.亲和力显著提升:AI 生成适体的平均 Kd 为 19.0±3.0nmol/L,传统 SELEX 为 74.8±54.7nmol/L,结合亲和力提升 4 倍;


3.预测精准度高:AI 预测分数与实验亲和力的皮尔逊相关系数 r=0.917,预测结果高度可靠;


4.最优适体筛选:从 AI 生成序列中筛选出 CT-3,IC50 低至 42.40nmol/L,仅特异性结合 CT 结构域,无其他结构域交叉反应。

鉴定核心结合基序CCCTC,截短获得最优适体Apc003


64af0c629bda46f488b4e602b9a77b1f.jpg

图 3.截短预测的与 CTGF 相互作用关键核苷酸后,靶向 CTGF CT 结构域的 Apc003 体外结合亲和力完全丧失


通过多序列比对与结构预测明确:

1.核心基序:所有高亲和力适体均包含CCCTC保守基序,是结合 CTGF CT 结构域的必需序列;


2.截短验证:缺失 CCCTC 基序后,适体 Kd 从 9.225nmol/L 飙升至 971.2nmol/L,结合能力完全丧失;


3.最小功能适体:截短后获得 Apc003,保留核心基序与高亲和力,分子量更小,肌肉组织穿透性更优。

Apc003特异性抑制CTGF纤维化活性,无代偿性TGF-β1升高


b55495f3483c4fca8c6de3c30bb9a30d.jpg

图 4.Apc003 可通过结合 CTGF CT 结构域发挥体外抗纤维化活性,且不引发代偿性 TGF-β1 升高

体外功能实验证实 Apc003 的精准作用机制:

1.结合位点:Apc003 通过 CTGF 的 K267、F268、K277、C284 残基特异性结合 CT 结构域,阻断肽(BP)可竞争性完全抑制该结合;


2.功能抑制:Apc003 显著下调成纤维细胞纤连蛋白、III 型胶原表达,抑制细胞迁移,抗纤维化活性呈浓度依赖性;


3.安全性:Apc003 处理后无 TGF-β1 升高,完全规避 FG-3019 的核心机制缺陷。

OA修饰延长Apc003半衰期至7天,成药性大幅提升


26e0df10e9e24f52b49446ce7c500bd2.jpg

图 5.OA 可延长偶联 Apc003 在正常大鼠体内的循环半衰期


药代动力学实验筛选出最优修饰方案:

1.修饰效果对比:OA、DA、PA、PEG40K 修饰中,OA 修饰延长半衰期效果最优;


2.关键药代参数:Apc003OA 的消除半衰期 t1/2=163.18h(约 7 天),Cmax=46.67±5.75μg/mL,AUC=7702.50±200.12 (μg・h)/mL;


3.作用机制:OA 通过结合血清白蛋白形成大分子复合物,避免肾脏快速清除,实现长效循环。

Apc003OA肌肉组织滞留性远超FG-3019


d584f1efea8d47b4b21b9a0d2d069865.jpg

图 6.Apc003OA 可在肌肉组织中长期分布与滞留,而 FG-3019 无法实现

活体成像组织分布实验证实:


1.分布特征:Apc003OA 与 FG-3019 均主要分布于肌肉、肝、脾、肺、肾,心脏富集极少,安全性良好;


2.滞留时间:Apc003OA 在膈肌、腓肠肌中可稳定滞留 12h 以上,FG-3019 仅 4h 即无荧光信号;


3.富集强度:各时间点 Apc003OA 在肌肉组织的荧光强度均显著高于 FG-3019,肌肉靶向性远超抗体。

Apc003OA体内疗效碾压FG-3019


a391b144cd39416bb8f7489bb725faa7.jpg

图 7.Apc003OA 在 mdx 小鼠中展现出优于 FG-3019 的抗纤维化活性,且不引发代偿性 TGF-β1 升高


mdx 小鼠体内 12 周给药实验证实 Apc003OA 的优异疗效与安全性:

1.肌肉功能改善:Apc003OA 组比目鱼肌特异性收缩力、前肢握力显著高于载体组与 FG-3019 组,阻断肽可完全逆转该效果;


2.纤维化缓解:膈肌纤维化标志物显著下调,Masson 染色显示腓肠肌、膈肌纤维化指数显著降低,疗效显著优于 FG-3019;


3.因子水平:Apc003OA 组全程无 TGF-β1 升高,FG-3019 组仍出现代偿性升高;


4.长期安全性:12 周给药后,心、肝、脾、肺、肾无病理损伤、无炎症浸润、无坏死,无明显器官毒性。


讨论与总结

研究证实,纤维化疾病靶点选择需规避代偿性促纤维化通路激活:CTGF VWC 结构域与 TGF-β1 存在 1332 个直接接触位点,靶向该结构域会触发 TGF-β1 代偿性升高,抵消治疗效果;而 CT 结构域仅 324 个接触位点,空间构象独立,靶向后无代偿性反应。这一发现为纤维化疾病的靶点筛选提供了关键准则。

抗体作为大分子蛋白,存在肌肉组织穿透性差、免疫原性、生产工艺复杂、成本高等缺陷;而核酸适体分子量小、化学合成易修饰、组织穿透性强、免疫原性低,尤其适合肌肉、中枢神经系统等致密组织疾病的治疗。本研究证实,适体在 DMD 治疗中具备抗体无法比拟的优势,是纤维化疾病治疗的理想药物形态。

传统 SELEX 依赖实验迭代,效率低、盲目性强;而 AptGEN 模型通过深度学习挖掘序列 - 结构 - 亲和力的关联,实现精准生成、快速筛选,将研发周期从数月缩短至数周,大幅降低研发成本。该模型不仅适用于 CTGF 靶点,还可拓展至 DKK1、BCMA 等其他疾病靶点,具备极强的通用性。

核酸适体的临床转化瓶颈是稳定性差、半衰期短,本研究的双修饰策略为适体优化提供了通用方案:甲氧基修饰解决核酸酶降解问题,脂肪酸修饰解决肾脏清除问题,两种修饰协同提升适体的成药性,为其他治疗性适体的优化提供了直接参考。

Apc003OA 已获 FDA 孤儿药与儿科罕见病资格,具备快速临床转化的政策优势;未来可进一步开展临床试验,验证其在 DMD 患者中的疗效与安全性。同时,AptGEN 平台可迭代升级,整合化学修饰预测模型,实现从序列生成到修饰优化的端到端 AI 研发,进一步加速适体药物的临床转化。


新闻搜集:蔡雯捷

转载:AI蛋白质前沿站(如有侵权,联系删除)