吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 894|回复: 1
收起左侧

[Python 原创] 处理小分子化合物相似性,保留相似分子

[复制链接]
greatzdl 发表于 2024-4-3 18:20
[Python] 纯文本查看 复制代码
from rdkit import Chem
from rdkit.Chem import rdFingerprintGenerator
from rdkit.Chem import DataStructs
from rdkit.Chem import SDMolSupplier, SDWriter

def similarity_filter_tversky(ref_smiles, sdf_filename, output_filename):
    # 从参考分子 SMILES 字符串中构建 RDKit 分子对象
    ref = Chem.MolFromSmiles(ref_smiles)
    if ref is None:
        print("无法解析参考分子的 SMILES")
        return
    
    # 创建 RDKit 分子指纹生成器
    fpgen = rdFingerprintGenerator.GetMorganGenerator(radius=2, fpSize=1024)
    
    # 从 SDF 文件中读取分子
    suppl = SDMolSupplier(sdf_filename)
    if suppl is None:
        print("无法读取 SDF 文件")
        return
    
    # 创建输出 SDF 文件的写入器
    writer = SDWriter(output_filename)
    
    # 遍历每个分子
    for mol in suppl:
        if mol is None:
            print("无法解析 SDF 文件中的分子")
            continue
        
        # 计算参考分子和当前分子的 Tversky 相似性
        fp1 = fpgen.GetCountFingerprint(ref)
        fp2 = fpgen.GetCountFingerprint(mol)
        simi = DataStructs.cDataStructs.TverskySimilarity(fp1, fp2, 0.05, 0.95)
        
        # 如果相似性大于 0.4,则将该分子写入输出文件
        if simi > 0.4:
            writer.write(mol)
            print(f"分子与参考分子相似性: {simi}, 分子已保留")
        else:
            print(f"分子与参考分子相似性: {simi}, 分子被过滤")
    
    writer.close()
    print("处理完成")

# 使用示例
reference_smiles = "C1(C2=CC=CC=C2)=CC=CC=C1"
sdf_file = "input.sdf"
output_sdf_file = "output_tversky.sdf"
similarity_filter_tversky(reference_smiles, sdf_file, output_sdf_file)

免费评分

参与人数 1吾爱币 +7 热心值 +1 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

pbf0613 发表于 2024-4-4 09:28
化学AI吗?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 17:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表