随着深度神经网络的发展,基于片段或支架的方法重新兴起



随着深度神经网络的发展,基于片段或支架的方法重新兴起


文章图片



随着深度神经网络的发展,基于片段或支架的方法重新兴起


文章图片



随着深度神经网络的发展,基于片段或支架的方法重新兴起


文章图片


药物设计中的一个经典方法是基于这样一个原则 , 即分子通常可以表示为用不同取代基装饰的中心支架 。 取代基因的修饰可用于产生新分子 , 这种方法长期以来一直用于通过使用基于反应的枚举来生成虚拟库 。 该方案的最新应用还表明 , 可以枚举和搜索非常大的虚拟化学空间 。 然而 , 由于可访问的化学空间仍然有限且太大而无法明确列举 , 因此也使用了优化方法 , 如遗传算法 。



随着深度神经网络的兴起和计算资源的增长 , 基于片段或支架的方法再次兴起 。 在这种情况下 , 科学家开发了一个名为深度FMPO的框架 。 在这里 , 潜在客户结构按照特定规则进行细分 。 另一组分子按照相同的规则进行碎片化 , 并作为可能的碎片池 。 然后使用强化学习方法通过随后替换先导结构的片段并使用定制的评分函数奖励执行的修改来生成新分子 。



最近 , 引入了基于图形的方法在神经网络和属性预测中的应用 。 图是一种数学结构 , 其中成对的对象相互关联 。 在这种情况下 , 节点代表一个对象 , 边代表对象之间的连接 。 节点和边都可以具有附加属性 。 将这些想法转化为化学图 , 分子也可以表示为化学图 。 这种表示保留了不同分子片段排列的拓扑信息 。 原子代表图的节点 , 原子之间的键代表边 。 对于属性预测 , 卷积网络中不同节点和边的权重被优化 , 神经网络可以学习分子部分对评估属性的重要性 。 相比之下 , 对于具有生成网络的复合生成 , 首先训练网络以学习训练空间中存在的图 。



科学家介绍了使用图作为生成模型的首批方法之一 。 另一种早期方法是基于与分子的图形表示相结合的变分编码器 。 此外 , 詹森使用基于图的方法与遗传算法和蒙特卡洛树搜索 。 最近 , 梅尔卡多等人引入了一种基于图的设计方法来生成称为图形发明的优化分子 。 基于图的方法的一个优点是以更数学的方式对化学信息进行编码 , 这对神经网络是有益的 。 相比之下 , 分子的表示更加抽象 , 这使得对结果的理解和解释更加困难 。



到目前为止提到的所有方法的局限性是仅使用分子的2D表示 。 然而 , 生物学和化学发生在3D空间中 。 经常表明3D相似性搜索在寻找生物活性分子方面非常有效 。 因此 , 直接基于3D表示的生成式设计非常有趣 , 可以提供非常有希望的结果 。 法布里蒂斯等人介绍了一种基于3D的方法的实现 。 分子发生器由两个主要步骤组成 。 首先 , 训练形状自动编码器以生成输入分子的形状表示 。 该自动编码器的输入作为SMILES字符串给出 , 输出是遵循光体素方法的体素化分子 。


【随着深度神经网络的发展,基于片段或支架的方法重新兴起】
第二步 , 使用卷积神经网络和长短期记忆网络的组合将体素化分子转换为SMILES字符串 。 形状自动编码器在分子数据库上进行训练 , 其三维构象异构体是用开发工具包生成的 。 总之 , 这构建了一种生成方法 , 该方法从查询结构及其体素化3D形状分子表示和受变分自编码器干扰的药效团开始 。 以下从体素化形状到SMILES的转换生成了新分子作为SMILES , 可能具有类似的3D形状 。



另一种方法是使用基于2D分子表示的生成方法 , 而有趣分子的评分和选择过程基于3D方法 , 如3D形状覆盖 。 这被证明对于脚手架跳跃识别新系列非常有效 。 在药物发现中 , 化合物需要满足所需的特性 。 通常 , 需要在多维优化工作中联合优化生物活性、对不需要的目标的选择性以及ADMET特性 。

    推荐阅读