输入靶标蛋白的Uniprot ID执行基于序列相似性的靶标扩展,从ChemBL库中抓取化合物,并且将化合物的SMILES转为分子指纹进行机器学习模型训练,最终用模型进行化合物库的虚拟筛选和输出数据处理结果。
输入靶标蛋白的Uniprot ID,基于序列相似性搜索扩展靶标蛋白家族,识别相关靶标。
从 ChemBL 数据库中检索与扩展靶标相关的化合物,获取 Molecule ChembL ID、SMILES 等信息。
将化合物 SMILES 转换为分子指纹(Morgan、AtomPair、MACCS、Topological),用于机器学习模型训练。
使用分子指纹训练机器学习模型,构建化合物活性预测模型。
使用训练好的模型对化合物库进行虚拟筛选,预测候选化合物的活性。
对虚拟筛选结果进行处理分析,包括理化性质分布、预测分数分布等。
整合各模块输出数据,生成最终虚拟筛选分析报告和可下载的结果文件包。
已选任务链: 输入: 靶标蛋白的Uniprot ID → 输出: 扩展靶标蛋白集
输入 UniProt ID 和相似度阈值,搜索序列相似性蛋白靶点。
最近运行和已完成的任务