基于片段的分子生成的深度生成模型

具有重要资源的简短研究论文摘要

0
1725

在本文中,作者讨论了有关分子生成的问题,这是化学信息学中的一个难题。通常使用的两种类型的深度生成方法是将分子图编码为文本字符串,并学习它们对应的基于字符的语言模型,而另一种方法则直接在分子图上运行。但是上述方法有两个局限性,例如无效分子和重复分子的产生。

为了克服该模型的局限性,本文的作者提出了一种称为小片段的小分子亚结构的语言模型,这是受到基于片段的药物设计的著名范式的宽松启发。用简单的语言,他们提出了逐个片段地生成分子,而不是逐个原子地生成。

本文的作者实验表明,他们的模型在很大程度上优于其他基于语言模型的竞争对手,达到了基于图的方法所具有的最新性能。

//arxiv.org/pdf/2002.12826.pdf

就本文使用的方法而言,主要方法包括三个步骤:

  • 将分子分解成碎片序列,
  • 将它们编码为SMILES单词,
  • 学习他们相应的语言模型。

阅读全文以获得更多详细信息

纸本PDF: //arxiv.org/pdf/2002.12826.pdf

Github: //github.com/marcopodda/fragment-based-dgm

广告deeplearning.ai与一名学习者的深度学习专业化横幅,戴着眼镜在笔记本电脑上。

发表评论

请输入您的评论!
请在这里输入您的名字

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.