**: 雅库杜
作者通過: Gohar
人工智能(AI)在药物设计和开发中受到广泛关注。 试图将人工智能应用于药物发现的初创公司如雨后春笋般涌现,目前至少有350家公司活跃在药物发现领域。 其中包括早期公司、初创公司,以及更成熟和处于IPO阶段的公司。 近期,该领域出现了一波突破,AI系统帮助快速发现和开发一流的小分子,这些小分子都已进入临床研究,以英矽智能、Exscientia、Benevolentai、Recursion Pharmaceuticals、Deep Genomics等公司为代表。
需要注意的是,大多数人工智能驱动的初创公司都专注于小分子药物发现,而不是生物制剂这并不奇怪。 从历史上看,即使是非人工智能计算方法(化学信息学)也主要用于小分子**,因为它们的分子结构和相互作用模式要简单得多。
人工智能在小分子药物发现方面具有一些独特的优势,使其成为该领域的强大工具:
化学品信息可用性
小分子药物的发现通常涉及大量的化学信息,包括分子结构、药物活性和毒性。 这些信息以数字形式存在,可以很容易地被计算机处理和分析。 相比之下,生物制剂(如蛋白质药物)的发现和设计可能涉及更复杂的生物信息,这些信息很难用数字表示,因此处理起来也更复杂。
大规模虚拟筛查
通过大规模虚拟筛选可以加速小分子药物的发现,这是人工智能的一大优势。 人工智能可以处理分子功效、毒性和其他关键特性的庞大化学数据库,从而更有效地筛选潜在候选药物。 生物制剂发现通常涉及较少的分子,虚拟筛选相对较小。
化学空间探索
人工智能能够有效地探索和理解化学空间,推动新化合物的设计和创新。 在小分子药物领域,通过从大量已知药物和相关化合物的数据中学习,人工智能可以帮助挖掘新的化学结构,从而促进新药的开发。 相比之下,生物制剂的设计往往更依赖于生物信息。
针对高渗透性和生物利用度进行优化
小分子药物需要具有良好的口服吸收性能,这涉及到化合物的理化性质。 人工智能在优化小分子药物的渗透性和生物利用度方面具有一定的优势,因为这些特性可以通过大量的实验数据进行建模和**。
这些优势使人工智能能够在小分子药物发现中更快、更准确地筛选和设计化合物,加速新药的发现和开发。
与此相对应,利用人工智能进行药物发现过程中的生物制剂,与小分子药物相反,可能存在以下缺点:
复杂性和多样性
生物制剂通常是大而复杂的蛋白质、抗体或其他具有更复杂结构和功能的大分子。 处理这种复杂的数据需要更先进的模型和算法,而当前的人工智能技术在处理大规模多样化的生物制剂数据时可能会面临一些挑战。
数据可用性
生物制剂的开发涉及不同生物系统中数据库的复杂相互作用。 尽管生物制剂数据越来越多,但与小分子药物相比,可用于大规模生物制剂训练AI模型的数据仍然有限,限制了模型的学习和学习能力。
定制和个性化
生物制剂通常是高度定制和个性化的,因为它们是针对特定疾病或患者需求而设计的。 这增加了设计的难度,因为每种生物制剂可能具有不同的结构、功能和相互作用模式。
生物多样性
生物制剂经常与人体的生物系统相互作用以达到最佳效果,而人体的生物多样性和复杂性使得生物制剂的开发更具挑战性。 人工智能模型需要更好地解释这种多样性,以便更准确地**生物制剂对不同个体的影响。
人工智能在药物分子发现过程中得到了广泛的应用,仅次于疾病建模和靶点发现。 人工智能驱动的药物设计分为三大类:从头药物设计、现有数据库的虚拟筛选和药物再利用。
图1AI药物分子发现的三大类。
从头药物设计
从头药物设计主要通过深度学习模型来实现,例如生成对抗神经网络(GAN),这是一类由生成器和判别器组成的深度学习模型。 氮化镓的训练过程是一个博弈,其中生成器和判别器的性能通过对抗方法不断提高)。生成式 AI 平台的一些示例包括 Insilico Medicine 的 Chemistry42 软件、Iktos 的 Makya 和 Ro5 的 De Novo Platform。 还包括 Recursion Pharmaceuticals、Deep Cure、Standigm 等。
简而言之,从头药物设计是一种计算机辅助方法,用于设计全新的药物分子。 人工智能在从头药物设计中起着关键作用,这可以通过以下步骤完成:
数据采集:首先,该系统需要大量的生化和药理数据,包括已知药物的结构、活性、毒性等信息。 此数据用于训练机器学习模型。
特征提取:在训练模型之前,需要从收集的数据中提取特征,其中可能包括分子的结构、电荷分布、溶解度等。 此步骤的目的是将化学信息转换为计算机可以理解的数字形式。
机器学习模型训练:使用各种机器学习算法,例如深度学习或基于规则的方法,训练模型来理解药物分子的结构和活性之间的关系。 这允许模型从已知数据中学习一般模式。
新分子的产生:一旦模型被训练,它就可以用来生成新的、看不见的分子结构。 这可以通过从随机分子结构开始,然后通过模型的生成能力不断优化,直到药物分子达到特定靶点来完成。
评估和筛选:需要对由此产生的分子结构进行评估,以确保其具有潜在的药用特性。 这可能涉及生物活性、毒性、生物利用度等的变化。
优化和合成规划:所得分子通常需要进一步优化,以提高其合成器的可行性和实验中的生物活性。 人工智能还可以提供合成计划,以帮助确定这些新分子在实验室中的制备方式。
整个过程是一个迭代循环,通过不断优化模型和实验新的分子设计,最终目标是找到具有良好生物活性和临床潜力的新药物分子。 这种方法可以加速药物发现过程,特别是在探索大量潜在分子结构时,尤其是在探索大量潜在分子结构时。
虚拟放映
将人工智能应用于药物分子发现的第二种途径是超大规模虚拟筛选,它可以筛选数十亿个分子以找到成功的靶点。 2022 年 8 月,赛诺菲与 Atomwise 合作开展了一项价值高达 12 亿美元的药物设计交易。 赛诺菲进行了2000万美元的前期投资,重点是使用Atomwise的AtomNet平台来研究赛诺菲选择的多达五个药物靶点的小分子。 根据公告,基于卷积神经网络的AtomNet在基于结构的药物设计方面表现出色,能够“通过AtomWise,AI快速搜索超过3万亿个可合成化合物”。
虚拟筛选是一种使用计算机模型和算法来评估和评估潜在药物分子的方法,以便从大型化合物库中筛选出具有潜在生物活性的候选分子。 这个筛选过程是通过在计算机中进行模拟和**来完成的,而不是在实验室中进行物理实验,因此得名"虚拟"筛选。
虚拟筛选的主要目标是在药物发现的早期阶段,从数百万到数千万个潜在候选药物中,识别可能对特定疾病靶点具有生物活性的分子。 这有助于加快药物开发过程,减少实验室实验的时间和成本。 在虚拟筛选中,人工智能的应用主要是通过构建**模型来实现的:
数据预处理:数据清理、去噪和规范化。 这确保了用于模型训练的数据准确且一致,从而提高了模型的性能。
分子表征:将分子结构转换为计算机可处理的特征表示。 这可以通过分子描述符、分子指纹、图神经网络等方法实现。 正确的分子表征对于模型性能至关重要。
选型:选择适当的机器学习或深度学习模型。 常用的模型包括支持向量机、随机森林、深度神经网络等。 模型的选择应基于任务的性质和数据的特征。
模型训练:使用具有已知生物活性的化合物数据集对选定的模型进行训练。 通过这种方式,模型能够学习药物分子结构与生物活性之间的关系。
模型评估:验证集用于评估模型,以测试其泛化到看不见的数据的能力。 指标可能包括准确性、灵敏度、特异性等。
虚拟放映使用经过训练的模型对潜在的药物分子执行**。 这可以是从公共数据库获得的已知分子,也可以是通过计算或合成生成的新分子。 该模型为每个分子提供一个生物活性值,该值根据这些值进行排序。
分子优化:对于在虚拟屏幕中排名较高的分子,可能需要进一步的化学优化。 这可以通过调整分子结构以增加生物活性、改善药代动力学性质等来实现。
实验验证:虚拟筛查的结果需要在实验室中进行验证。 实验验证有助于确认虚拟筛选的准确性,并验证潜在药物分子的生物活性和其他关键特性。
药物再利用
最后,许多公司正在使用药物再利用策略进行人工智能药物发现。 这些公司包括Healx、Benevolentai、Bioxcel Therapeutics。 他们使用自然语言处理 (NLP) 模型和机器学习,分析大量非结构化文本数据(研究文章和专利、电子健康记录和其他类型的数据),以构建和搜索可重复使用的药物群体。
数据集成与挖掘:人工智能可以整合和挖掘大量生物医学数据,包括基因组学、蛋白质组学、药物相互作用等。 这有助于发现现有药物可能在新的**领域活跃的迹象。
网络分析:使用网络分析技术,人工智能可以在药物、蛋白质和疾病之间建立关联网络。 通过分析这些网络,可以确定潜在的药物再利用机会,例如,通过发现与目标疾病相关的预先存在的药物或化合物。
药物相似性和特征学习:人工智能可以使用药物相似性和特征学习方法分析现有药物与新**靶点之间的相似性。 这有助于确定现有药物是否对新靶点具有潜在活性。
机器学***:利用机器学习算法,人工智能可以根据现有药物的生物活性和药理特性,建立这些药物在新领域的作用模型。 这种方法有助于对候选药物进行有效筛选。
文本挖掘和知识图谱:AI技术可以通过文本挖掘和知识图谱构建,自动从文献、专利、临床试验数据库中提取药物信息。 这有助于发现药物的新用途和关联。
细胞和基因组学数据分析:利用细胞和基因组数据,人工智能可以识别现有药物对细胞或基因表达的影响,从而发现可能的机制并推断它们对新靶点的潜在影响。
例如,总部位于美国的临床阶段生物技术公司Lantern Pharma专注于利用先进的基因组学、机器学习和人工智能来创新癌症药物开发过程。 该公司的人工智能平台RADR目前包含超过250亿个数据点,并使用大数据分析和机器学习来快速发现与药物反应相关的生物基因组特征,然后确定相关的癌症患者亚组,以受益于Lantern的候选药物。 Lantern及其合作者还使用RADR来开发和定位新药以及药物再利用。
人工智能在小分子药物研究中的应用前景
根据 Biopharmatrend** 收集的数据,下图显示了 319 家药物发现初创公司对 AI 的使用情况。 近一半的公司(49%,156家初创公司)专注于小分子药物的发现,而只有20%的公司(64家初创公司)参与生物制剂(抗体、疫苗等)的发现和开发。
图2医药AI创业公司业务分布图,**生物医药趋势
AI在小分子药物发现领域前景光明,虽然目前还没有通过AI将小分子药物推向市场,但这只是时间问题。
也许人工智能的最大优势是它大大缩短了药物设计周期。 传统的药物发现过程既费时又昂贵,而人工智能能够加快整个过程。 通过高效的虚拟筛选、分子设计和优化,人工智能可以在更短的时间内生成和评估大量候选药物。 根据《自然评论药物发现》报告,研究人员发现:多个人工智能项目在不到四年的时间内完成了整个发现和临床前过程,而通常需要五到六年的时间。
基于现有的生物学和药理学知识,人工智能可以设计出具有靶向生物活性和更好生物利用度的分子。 这包括生成新的分子结构、优化药物特性等。 人工智能还可以分析复杂的生物网络、不同药物的相互作用,从而帮助发现更有效的药物组合。 这对于复杂的疾病和耐药性问题尤为重要。 通过大规模分析生物学和临床数据,人工智能可以帮助患者个性化他们的药物**。
根据患者的遗传信息、生物标志物和疾病特征,定制用药方案,提高疗效。 AI模型可以帮助早期识别潜在的安全问题,并减少候选药物**潜在毒性和不良反应的损失。 结合结构生物学数据,AI可以更准确地**小分子与蛋白质的相互作用,从而指导药物设计的方向。 在新药靶点识别方面,人工智能可以通过在分析大规模生物数据的过程中识别新靶点,为药物发现提供更多选择。
这些前景表明,人工智能在小分子药物发现领域的应用有望在未来取得更多突破,为新药的发现和开发提供更强大、更高效的工具。
引用:
1.buvailo, a. will biologics surpass small molecules in the pharmaceutical race? biopharmatrend. 03. 11. 2023.
2.the landscape of artificial intelligence (ai) in pharmaceutical r&d. biopharmatrend. retrieved on 09. 11. 2023.
3.buvailo, a. ai drug discovery: key trends and developments in pharmaceutical industry. biopharmatrend. 26. 07. 2023.
4.jayatunga, m. k. p. et al. ai in small-molecule drug discovery: a coming w**e? nature review drug discovery. 07. 02. 2022.
*免责声明:本文仅为介绍医学疾病领域的研究进展或简要描述研究概况或分享医学相关信息,不构成也不会对**或诊断方案作出推荐,也不构成对相关投资的任何推荐。 内容如有遗漏,欢迎随时沟通并指出!