本研究针对AI驱动药物发现中阴性数据稀缺和发表偏倚问题,开发了首个基于真实生物活性数据的惰性化合物数据库InertDB。研究人员通过自然语言处理(NLP)聚类分析从PubChem中筛选3,205个经多生物实验验证的惰性化合物(CICs),并利用循环神经网络(RNN)生成64,368个扩展 ...