Keap1-Nrf2蛋白
引言
针对具有大而无特征、高度亲脂性、高度极性或高柔性结合位点的靶标,生成先导化合物是一项极具挑战性的任务。本文阐述了如何利用大环天然产物的分子核心作为高质量的计算机筛选库,为这些难以药物靶向的靶标提供初始的先导化合物。通过对一组精心选择的天然产物衍生核心进行两轮分子对接,我们成功发现了Keap1-Nrf2蛋白-蛋白相互作用(PPI)的不带电荷的大环分子抑制剂。Keap1-Nrf2因其高极性结合位点而一直被视为极具挑战性的靶标。该大环分子抑制剂展现出细胞活性,并且基于其与Keap1的复合物结构和合成途径,该分子具有良好的进一步优化潜力。我们相信,本文的工作将激发人们对使用大环核心进行计算机辅助先导化合物生成的兴趣,并有助于未来大环筛选库的构建与设计。
背景介绍
在已发现的与人类疾病相关的靶标中,超过一半被认为难以通过符合Lipinski“类药五规则”(Ro5)的传统小分子药物来调节。PPI、蛋白酶、某些激酶以及转移酶和异构酶就是其中的典型例子。这些难以药物靶向的靶标通常具有大而无特征、高度亲脂性或高度极性、高柔性的结合位点。寻找针对这些靶标的具有口服生物利用度的药物是一项艰巨的任务,通常需要在Ro5之外(bRo5)的未知化学空间中寻找配体。大环化合物在bRo5空间中的口服药物中富集,因为它们与传统小分子相比,能更好地与具有大而无特征结合位点的靶标结合。此外,大环化合物还能改善血浆稳定性、细胞通透性和口服吸收。然而,大环化合物在筛选分子库中的代表性通常不足,限制了其在先导化合物生成中的应用。例如,阿斯利康的分子库中包含380万种化合物,但其中大环化合物不到17000种。
尽管越来越多的bRo5化合物进入临床试验,但系统地研究难以药物靶向靶标的先导化合物生成仍然具有挑战性,特别是随着化学空间随分子体积的增大而急剧扩展。天然产物是重要的药物来源,我们假设大环核心可能是自然界的优势子结构,并在难以药物靶向靶标的先导化合物生成中发挥作用,类似于传统药物的分子片段。因此,我们收集了一组类先导化合物的大环核心,用于对靶标(如PPI)进行计算机筛选,随后的优化可以产生新颖的先导化合物。本文报道了通过对大环天然产物化学空间的全面研究,如何生成两组可用于发现难以药物靶向靶标的先导化合物的大环核心。通过将更小、更像先导化合物的化合物对接到Keap1上Nrf2的高电荷结合位点中,我们确定了环噻啶核心是Keap1的潜在抑制剂;使用核心的结构简化类似物进行第二轮对接研究,并进行合成,确定了Keap1-Nrf2 PPI的弱抑制剂。基于该初始抑制剂,我们合成了另外九种优化化合物,最终得到了活性在低微摩尔(μM)范围内并显示出细胞活性的抑制剂14。Keap1和14的复合物晶体结构揭示了不带电的大环分子14如何与Keap1的带电结合位点结合,并为其进一步优化提供了基础。
结果1: Dictionary of Natural Products的挖掘
Dictionary of Natural Products (DNP) 包含超过15万种化合物,涵盖了广阔的化学空间,包括已批准上市的口服和非肠道药物(图1a)。因此,我们认为DNP是鉴定大环核心的理想来源。首先,我们使用Pipeline Pilot中的高通量筛选(HTS)过滤器从DNP中去除含有已知毒理基团和高度活泼基团的天然产物,该过滤器去除了包括酰基卤、酸酐、重氮基团和酰肼在内的多种官能团。然后,将剩余的化合物进一步过滤,以包含至少一个大环、不超过十个较小环,并且分子量(MW)小于2500 Da(图1b)。这一步去除了所有非大环和大型大环化合物,如多糖或多肽性质的大环,最终获得了3657个大环数据集。接下来,我们使用先前报道的片段生成算法的前两个步骤,将该数据集侧链修剪为由至少两个与大环连接的重原子或官能团组成的连接点。进一步过滤得到的扩展Murcko骨架(本文中称为大环核),使其至少包含总共三个氧和氮原子,并且小于15个可旋转键,从而去除不太可能发展为药物的高亲脂性和柔性核。整个大环筛选流程下来,我们得到了近2200个结构不同的核心,这些核心被聚集成217个代表性核心的集合。通过视觉检查,我们去除了含有少量剩余反应性基团(如二硫化物、过氧化物和烷基卤化物)和具有高度合成复杂性的核,以及寡聚体(寡肽和寡糖)。最终,我们得到了一个较小的、包含41个更像先导化合物的核心数据集,这些核心在很大程度上遵循了Lipinski的5规则。这组核心来源于35种已报道其绝对立体化学的天然产物,以及仅了解相对立体化学的三种天然产物。这两组核心构成了独特的计算机筛选分子库,它们之间的结构复杂性各不相同,其中一些易于合成,而简化的类似物可能是其他大环化合物更有吸引力的起点。
结果2:Keap1-Nrf2 PPI的新型抑制剂
为了评估我们的大环核心数据集,我们选择了Kelch样ECH相关蛋白1(Keap1)与核转录因子E2相关因子2(Nrf2)之间的蛋白-蛋白相互作用(PPI)作为研究对象。Keap1-Nrf2系统是细胞对氧化应激的重要应答机制,而氧化应激与多种慢性、年龄相关或炎症性疾病密切相关。抑制该PPI是药物开发的一个热点,因为Nrf2控制着多种细胞保护性基因的表达,但其活性受到与Keap1结合后的负调控,导致Nrf2的泛素化和降解。Keap1-Nrf2 PPI涉及Keap1上的一个高度极性口袋,该口袋以高亲和力与Nrf2上的DEETGE肽段序列及其他带负电荷的配体结合。我们推测,大环化合物由于其构象限制性,可能在Keap1的极性结合位点提供更佳的结合效果。与目前大多数酸性的Keap1抑制剂相比,大环化合物更适合用于发现新型不带电的抑制剂,并且具有改善的细胞通透性和口服吸收性。
为了避免在对接大环核心时偏向特定的结合位点构象,我们选择了Keap1的四个高分辨率晶体结构进行研究,这些结构在结合位点上存在差异:其中两个结合了小分子配体(PDB ID:4IQK和3VNG),另外两个为空蛋白结构(PDB ID:4IFJ和1ZGK)。通过GlideScores评估,我们确定了对接Keap1结构效果最好的十个核心。然后,从合并的前十名列表中筛选出已经对接到至少三个或四个Keap1结构中的核心,并选择它们作为潜在的命中化合物。有趣的是,由此产生的前五个大环化合物在结构上表现出很大的多样性(图1c)。对接姿态分析表明,环噻啶核心能够很好地对接在所有四个Keap1结构中,深入结合位点并到达Kelch通道(图1d)。
诱导契合对接研究表明,环噻啶核心的简化类似物,如立体异构体6-9(其中亚苯基的羟基和甲基以及脯氨酸的羟基已被去除,见图2a),也能够与Keap1结合。特别地,在基于表面等离子共振(SPR)的溶液分析(ISA)抑制实验中,有9种化合物能够抑制Keap1与Nrf2衍生肽的结合(KD = 237μM)(图2a)。将I-脯氨酸部分的立体化学转化为10导致结合亲和力降低,这表明I-脯氨酸对抑制Keap1的重要性;而I-脯氨酸的羟基化(11)则保持了相似的KD值(图2a)。重要的是,用不同的酰胺(12–15)取代甲酯后,我们得到了二甲酰胺14,其活性比9强两个数量级。开环化合物16的活性远低于14;同样地,大环分别扩展一个和三个原子(17和18)后,也失去了结合亲和力,这证实了大环结构对于抑制Keap1的关键作用。
通过直接SPR结合测定法和等温滴定热法(ITC),我们证实了ISA中14的活性,并发现它与Keap1的结合亲和力几乎相同(图2b,c)。大环化合物14通过抑制与Keap1的结合而诱导Nrf2易位进入细胞核,显示出细胞活性(图2d)。此外,14具有较高的水溶性、跨Caco-2细胞单层的中低渗透性以及中等的体外微粒体清除率。因此,14是一种有前景的先导化合物,可以进一步优化为不带电、非酸性的靶向Keap1的高级先导化合物。
结果3: 抑制剂14与Keap1的复合物结构解析
我们成功解析了大环分子14与Keap1在2.4 Å分辨率下的复合物结构,旨在揭示不带电荷的14如何与Keap1的带电和极性结合位点相互作用。晶体结构明确显示,14与Nrf2一样,结合在Keap1的同一个极性结合位点上(图3a)。
对复合物结构的深入分析表明,亚苯基和大环的一部分被紧密地楔入由R415和A556构成的相对疏水口袋中。除了R415与14之间的阳离子-π相互作用外,复合物的稳定主要依赖于少数极性相互作用。此外,我们还观察到一个氯离子桥接了14中的Ser的NH和Keap1中的三个残基,这与通过基于片段的药物发现方法鉴定的高效抑制剂复合物结构相似。
考虑到SPR、ITC分析以及细胞Nrf2易位分析均是在生理盐条件下进行的,我们推测这种复合物的形成在生物学相关环境中也会发生。大环化合物14在结合位点展现出紧凑且稳定的结合构象,这解释了为何开环和扩环类似物16-18对Keap1的亲和力显著降低。
Pro部分及其N-乙酰基在溶剂中的暴露,与用羟脯氨酸(化合物11)替代不会影响抑制活性的观察结果相一致。我们使用Prime MM-GBSA进行了配体结合亲和力计算,为活性差异以及14与Keap1之间复合物稳定作用力的潜在原因提供了解释(图3b)。计算结果与实验解离常数相符,预测大环14对Keap1具有最高亲和力,9和13为中等亲和力,而12和15相对较弱。
我们发现,非极性范德华和亲脂性相互作用是14结合亲和力的主要贡献者,这使得它比抑制剂9和13具有更高的亲和力。根据计算,非活性化合物12通过更强的极性(库仑)相互作用得以稳定,但同时被较大的去溶剂化作用所抵消;而非活性化合物15则形成了所研究五个化合物中最弱的极性(库仑)和范德华相互作用。
有趣的是,14的两个N-甲基与Pro和N-乙酰基的羰基之间的距离表明,在这些残基之间形成了两个分子内非经典氢键(图3a)。这一发现得到了量子力学计算的支持。尽管非经典氢键比传统氢键弱,但两个分子内非经典氢键可能提供了额外的构象限制,从而稳定了14与Keap1的结合。
结果4: 抑制剂14与其他Keap1抑制剂的对比分析
我们通过计算七个指纹的Tanimoto系数来描述结构多样性,结果显示抑制剂14与PubChem数据库及验证数据集中的化合物在结构上相似性较低(图4a)。为了进一步研究Keap1抑制剂空间的多样性,我们利用抑制剂14、组合验证组、PubChem组以及单独验证组计算得出的子结构片段指纹,构建了类似网络的相似性图。
组合数据集的相似性图与验证组的相似性图一致,均表明大环化合物14在化学空间中占据了一个独特的位置,周围没有相似结构的化合物(图4b,c)。此外,组合数据集还揭示了Keap1抑制剂的空间相当多样,大多数抑制剂在结构上几乎没有相似的化合物。图中只有一个较大的簇位于左中心,该簇包含了一系列已验证的抑制剂,其中以V1代表的邻苯二甲酰亚胺为典型(图4c)。
此外,1,4-二氨基萘V3、环磺酰胺V7和二唑V8(图4c)是经过药物化学优化后获得的最有效的Keap1抑制剂。然而,与14不同的是,这些抑制剂都含有羧酸基团。综上所述,Tanimoto系数和类似网络的相似图均突出了利用天然产物核心作为结构独特的Keap1抑制剂来源的潜力,这类抑制剂与先前报道的抑制剂属于完全不同的化合物类别。
总结:
近年来,天然产物已被用作三维(3D)片段的来源,并激发了通过面向多样性的合成(DOS)策略来设计化合物库。同时,也有通过将天然产物衍生的片段进行组合和融合来创造假天然产物的方法。然而,天然产物及其衍生物往往结构复杂。本研究展示了如何通过两轮对接,从一小类先导化合物中筛选出环噻啶核作为大环核心,并通过化合物6–9的对接进一步优化,使其针对靶标Keap1进行定制,同时降低了结构复杂性。这一方法有效缓解了天然产物通常需要较长合成路线的缺点。总之,本文所报道的大环核心示例,展示了如何利用自然界中的优势子结构及其多样性,作为药物发现的高质量起点。
名称 | 货号 | 规格 |
Curcumin | abs815928-50mg | 50mg |
Bardoxolone Methyl | abs813506-50mg | 50mg |
NRF2 (D1Z9C) XP ® Rabbit mAb (PE Conjugate) | 14409S | 100ul |
Nrf2 (A-10) X | sc-365949X | 200μg/0.1ml |