drugC - 简书

发简信

drugC

0
关注
9
粉丝
10
文章
5243

字数
12

收获喜欢
2

总资产

IP属地：上海

drugC

化合物分子片段替换与拼接
需要对多个化合物批量进行特定片段或基团的拼接或替换时，可以参考以下代码。一、片段的拼接虽然rdkit中有一个Chem.CombineMols（mol_1,mol_2）的函...

1032 0 0
drugC

存储化合物信息SDF与CSV格式的互相转换
AIDD流程中常常遇到的数据集格式为csv为主，CADD流程中遇到的则以sdf文件为主，本文分享常用的格式转换代码。一、SDF文件转CSV文件然后遍历整个SDF文件，转为...

1214 0 0

drugC

rdkit可视化原子序号
rdkit中对于单个原子的操作，常常是通过GetAtomWithIdx这个函数来实现的，然后可以对该原子做各种下游操作，但对于本身没有明确序号的原子，人难以确认该输入哪个序号...

1236 0 2
drugC

将化合物分子数据标准化（移除电荷、小片段、互变异构、空间信息）
在AI应用的数据准备阶段，或者化合物数据库归类合并时，会有将同个化合物的不同形式标准化的需求。这样在比对时，就可以通过标准化后的SMILES的字符串比对，方便地处理化合物数据...

1187 0 2
drugC

并行处理化合物数据方式对比
rdkit的操作中，对大批量化合物的处理，人们倾向于采用并行化的方式加速处理，例如在Pandas的表格中，采用apply的方式实现化合物属性计算等等。关于apply函数的并行...

360 0 1
drugC

化合物数据集的降维可视化
对于分子聚类后的结果，或者是某个化合物数据集，有时希望可视化后有个直观的对比来确认不同来源的分子集合所占据的化学空间。但对于化合物这种高维度数据，直接可视化是不行的，需要先...

653 0 1
drugC

筛除早期药物发现中有害的PAINS与警示结构
基于RO5，即Lipinski规则过滤化合物库在早期药物研发项目中已经很常用，但其适用范围往往是限制口服相关的利用度与PK性质。本文介绍基于PAINS与警示结构的过滤方式并简...

1554 0 2

drugC

药物分子关于RO5等常用属性计算
药物早期设计中，常常需要根据类药五原则（rule of five,RO5, 亦称Lipinski规则）进行初步判断筛选，RO5是辉瑞公司资深药物化学家Christopher ...

1378 0 1
drugC

基于分子指纹的大规模分子聚类
新药早期研发的应用场景中, 常常需要对虚拟化合物库进行聚类，从不同类别中挑选出多样性好的代表化合物，但视聚类规模对使用的算法与硬件有不同的要求，这里列出两种实测后，对内存与聚...

1452 0 2
drugC

rdkit | 药物分子进行片段分解
化学信息学家在某些药物研发应用场景里，不仅仅关注整体药物分子，有时也需要将所谓的类药性好的片段单独提取出来，提取出类药性质分子片段的共性，用于数据库的建设或者AI训练。例如阿...

1255 0 1
drugC

@IT·互联网
若锦编，74092 篇文章，2649961 人关注

Hi，很高兴在@IT·互联网专题遇见你。收录范围：收录IT&互联网行业观察与思考，数码产品极客体验分析等类型文章投稿须知：https://www.jianshu.com/p/4edc76104c27 专题主编：@若锦 https://www.jianshu.com/u/e4c63b354a77 官方社群：可联系添加 @若锦加入专题官方社群交流、学习，添加时备注简书ID。
drugC

程序员
小彤花园编，96810 篇文章，1663177 人关注

如果你是程序员，或者有一颗喜欢写程序的心，喜欢分享技术干货、项目经验、程序员日常囧事等等，欢迎投稿《程序员》专题。专题主编：小彤花园 http://www.jianshu.com/users/4a4eb4feee62/ 【程序员】专题拒稿指北：http://www.jianshu.com/p/7c8b33b5f63b 投稿须知： 1.收录相关技术文章，但不限于技术，也可以是项目经验类的文章和程序员日常。 2.文章內不得有任何推广信息。包括但不限于公众号、微博、微信，更不得在通过投稿后再修改文章加入推广信息。你可以将这些推广以及个人信息放在个人主页介绍里。 3.字数极少，段落混乱，大段代码没有放到代码框的文章不收录 4.不相关的内容不收录，请确认文章内容和本专题相关目前针对优质作者及爱好者，开设了官方程序员微信群，希望加入请发简信给主编小彤花园索取个人微信，主编会将你加入到【程序员】微信群，分享内容，收获知识。添加微信时备注昵称。

drugC