- A+
药物设计的物质基础是药物和靶标。药物小分子在体内通过与特定的生物大分子靶标相互作用,才能达到预期的药效。这篇文章,我们来说说药物和靶标之间的相互作用。
01药物和靶标的相互作用方式
药物产生生物效应是药物小分子和靶标生物大分子之间反应的结果。十九世纪,药物化学家就发现了药物和受体相互作用的重要理论——锁钥原理。药物和受体的相互作用,就像钥匙开锁的关系,药物好比钥匙,受体的活性位点如同锁芯。在锁钥原理中,药物和受体都被当作刚性模型来处理。然而,在实际生物反应中,药物小分子和生物大分子在产生相互作用的时候并非静止不动,而是发生构象变化的。
图1. 药物和靶标相互作用的过程
显然,采用“诱导-契合”模式来描述药物与受体的结合更加接近真实情况。事实上,酶并非事先就以一种与底物互补的形状存在的,而是在受到诱导之后才形成互补的形状。底物一旦结合上去,就能诱导酶蛋白的构象发生相应的变化,从而使酶和底物契合而形成酶-底物络合物,并引起底物发生反应。当反应结束产物从酶上脱落下来后,酶的活性中心又恢复原来的构象。在相互结合过程中,两者通过调整彼此的构象达到一种最佳的契合状态,从而形成稳定的复合物。
图2. 在与底物发生诱导契合后,酶改变自身形状, 生成酶-底物复合物 【1】
因此,药物与受体的结合主要用“诱导-契合”模式来描述。药物进入机体后,通过在立体空间上和受体的活性位点形成几何形状互补、静电作用互补的关系,以及通过各种键力作用(例如:氢键、盐桥、共价键)相互结合,最终形成复合物。该复合物进而引起靶标部位的构象改变,然后出现进一步的形状和性质上的互补,触发机体微环境产生与药效有关的一系列生物化学反应,达到治疗疾病的效果。
02
药物和靶标的相互作用类型
药物与受体的相互作用类型一般分为两类:共价键和非共价键。共价键是药物与受体之间能产生的最强的结合键,形成后不易断裂,属于不可逆过程。药物属于体外异物,因此药物和靶标通常不应发生分子作用力较强的共价键结合,避免完成治疗作用后无法被代谢排出体外。药物和靶标间的分子间作用力以非共价键结合为主,包括很多种,除了常见的范德华力、静电作用和氢键外,还包括阳离子-芳香体系、卤键、胍基(精氨酸)等作用。尤其是卤键,近年来在药物设计领域引起了极大的兴趣。比如,运用QM/MM方法研究阳离子-π、卤键和胍基等作用的本质。这些相互作用既可用于提高药物和靶标间的亲和力,也可用于优化药物的ADME/T性质。
药物-靶标之间的作用是十分复杂又相互影响的,而且靶标蛋白的结构是不断变化的,这使得精确计算药物-靶标间的作用力仍然是目前药物设计研究工作者所面临的一个巨大挑战。
本期内容是前两篇文章的承接部分。大家可以结合第三篇的【药物的分子结构】和第四篇的【靶标的主要类型和结构特征】阅读。
下面,我们介绍评估药物和靶标相互作用的常用数据库和工具。此部分内容源于对文献 A Comprehensive Review of Feature Based Methods for Drug Target Interaction Prediction【2】第二章节的翻译,请继续阅读!
评估药物和靶标相互作用常用的数据库
药物与靶点的相互作用受很多种因素的影响,例如两种化合物的浓度及其分子间的相互作用。评估药物和靶标相互作用的数据库提供了关于这些药物化合物、靶标蛋白以及它们之间相互作用的不同信息。这些信息可用于高效且精确地预测各种潜在的相互作用【2】。以下列举一些常见的数据库:
1) DrugBank【3】本数据库涵盖详细药物靶点数据的信息,是注释丰富、易于获取的生物信息学资源。DrugBank 最近发布的数据库包含 11,123 种药物,其中包括 2,558 种小分子药物、963 种生物技术药物、112 种保健品和超过 5,130 种实验药物。不仅如此,它还包括和这些药物相关的 5,117 个蛋白质序列信息。每个药物拥有超过 20 多个项目的信息,其中包含化学数据以及靶标/蛋白质数据。DrugBank被广泛用于化学家、药剂师、 研究人员以及工业和公众领域。
2) KEGG【4】京都基因与基因组百科全书(KEGG)是一套关于基因组、酶促途径以及生物化学物质的在线数据库。其通路数据库PATHWAY之中记录的是细胞之中的分子相互作用网络以及具体生物所特有的变化形式。除此之外,它还包含各种疾病、药物和化合物的信息。这个数据库进一步分为多个子数据库,如KEGG GENE、KEGG PATHWAY和KEGG DRUG 等。
3) PubChem【5】Pubchem是有机小分子生物活性数据库,它包含了 9390 万种化合物、2.36 亿种物质和 125 万种生物测定的数据。Pubchem数据库有3个子数据库:Pubchem BioAssay库用于存储生化实验数据,实验数据主要来自高通量筛选实验和科技文献;Pubchem Compound库用于存储整理后的化合物化学结构信息;PubChem Substance 用于存储机构和个人上传的化合物原始数据。
4)UniProt【6】UniProt是一款专门为蛋白质而开发的开源数据库,包含蛋白质序列和生物功能信息。该数据库整合了EBI(European Bioinformatics Institute)、SIB(Swiss Institute of Bioinformatics)和PIR(Protein Information Resource)的资源。UniProt主要由这些子库构成:UniProtKB/Swiss-Prot(高质量、手工注释、非冗余的数据库);UniProtKB/TrEMBL(自动翻译蛋白序列、预测序列、未验证的数据库)、UniParc(非冗余蛋白序列数据库)、UniRef(聚类序列减小数据库,加快检索速度)、Proteomes(为全测序基因组物种提供蛋白组信息)。
5) Pfam【7】Pfam是一款专门为蛋白质家族而开发应用的数据库,包括蛋白质及其注释信息和序列比对信息。该数据库可以根据家族和结构域对各种蛋白进行分类。在Pfam数据库中,蛋白质的序列比对是通过隐马尔可夫模型开发的。用户可以查看每个蛋白质家族的家族描述、结构和比对方式等信息。
6)SuperTarget【8】http://insilico.charite.de/supertarget/index.php
SuperTarget 是一个基于网络的结合了药物相关数据、副作用、医疗适应症、药物代谢通路和靶标基因本体论的数据库。目前,该数据集包含 6000 多个靶蛋白、19,600 种药物化合物和 330,000 个关于它们之间相互作用的信息。基于Web的界面提供了药物筛选和目标相似性的选项,还允许用户通过复杂的查询选项查找特定药物或靶标。
7) MATADOR【9】MATADOR是一个涵盖药物和靶标相互作用信息的数据库。该数据库的优势是通过自动文本挖掘工具整合直接作用和间接作用信息数据。通常来说,药物和靶标的间接作用由基因表达水平的下降或代谢物与药物的结合变化等因素所引起。MATADOR数据库整合了这些信息,可以捕捉到药物和靶标之间最大的相互作用信息数据。
8) GLIDA【10】
GLIDA 是一个专门针对G蛋白偶联受体(GPCR)与配体而开发的数据库。该数据库提供了GPCR数据、配体数据、GPCR与配体相互作用数据、同源受体关系网以及保守识别区等信息,为新药发现提供了支持。
9)Therapeutic target database (TTD)【11】Therapeutic Target Database(TTD)是全球第一个提供免费药物和靶标信息的在线数据库,是药物靶标发现和新药开发领域具有国际影响力的数据平台。该数据平台的年访问量超过 15万人次,总访问量达 240 余万人次,年平均被引次数超过200次。随着精准医疗的发展和AI技术的突破,TTD数据库的构建部分满足了相关AI研究的数据需求,为药物设计与新药发现提供了不可或缺的重要支持。目前,该数据库收录了 3500 余个药物靶点,近 4 万个药物分子。
10)STITCH【12】STITCH是一个化合物-蛋白相互作用的数据库,包含了已知的和预测的相互作用。当前版本涵盖了来自2031个物种的43万个小分子和9643763个蛋白之间的相互作用。STITCH与由同一团队开发的基因关联数据库STRING共享蛋白数据。STITCH收集的数据来自人工注释数据库—如DurgBank、GLIDA、Matador、TTD和CTD;通路数据库—如KEGG、PID、Reactome和BioCyc;以及实验结果数据库—如ChEMBL、PDSP Ki和PDB。数据库中的每个相互作用都分配了一个分值,以指示其相互作用的概率或结合亲和力。当通过数据库的web搜索一个化合物时,STITCH将列出它的相似化合物和相似性分数。此数据库也可用于化合物靶标预测。
11) ChEMBL【13】ChEMBL 是人工收集的数据集,包含类药生物活性分子的详细信息特性,提供针对生物活性数据的药物和靶标信息。这些信息可用于药物开发过程中针对先导化合物的发现研究。最新发布的数据库包含超过 297 万个生物测定数据,涵盖了 636,269 种化合物。
12)TDR Targets【14】
TDR靶标数据库通过疾病病原体的各种基因组学和化学数据信息,实现对药物和靶标相互作用的鉴定和排序。用户在使用的过程中,可以通过特定的查询来确定数据的优先级。TDR Targets 数据库包含 11 种细菌和真核生物的病原体的数据信息,以及超过 800,000 种生物活性化合物的数据信息。
13) PDTD【15】PDTD数据库包含超过1100个蛋白条目,数据提取自文献和多个在线数据库(如TTD、DrugBank和Thomson Pharma)。PDTD数据库涵盖超过830种已知或潜在药物和靶标的信息,包括PDB和mol2格式的蛋白和活性位点结构、相关疾病、生物学功能和相关信号调控通路,每个靶标根据疾病分类学和生化功能进行分类。PDTD支持关键词搜索功能,如用PDB ID、靶标名称和疾病名称进行搜索。在PDTD生成的数据集可轻易下载,并可用内嵌式分子可视化工具打开。
14) SIDER【16】SIDER数据库整合了药物、靶点和药物副作用等信息,为用户提供了一个可以全面了解药物作用及其不良反应的平台。最新版本的数据集包含 1430 种药物、588 种副作用和 140,064 个药物副作用对等信息。它还提供了有关药物适应症的相关信息。
15) Integrity【17】Integrity 是一个用于药物设计的存储库,它包含有关药物及其相关靶点、疾病和临床阶段的大量信息。在这个存储库中,药物靶标有四个状态:“已验证”(已上市或正在临床阶段测试的药物)、“候选”(不再处于针对某种特定疾病的开发状态)、“探索性”(正在进行生物探索)或“无”。Integrity 中的药物是通过靶标 ID 关联于基因的。
16)NIST Mass Spectral Library【18】
这是一个集合了来自美国国家标准与技术研究院(NIST)等同行编译评审的数据库 。它包含各种化学物质的质谱数据。
评估药物和靶标相互作用常用的工具图3. 计算药物蛋白质描述符的工具
以上就是本周的学习内容了!我们下周将进入分子模拟的理论基础篇章学习。敬请留意!