科研项目

>>> 综合药物-药物相互作用数据库:DDIner 数据挖掘及前端可视化

  • 项目地址:http://ddiner.scbdd.com
  • 项目简介:DDInter是一个开放获取的、全面的、专业的药物-药物相互作用数据库,用于促进临床合理用药。其内容涵盖了相互作用的明确机制,严重程度,合并效应和监测处理办法等信息;同时提供了相互作用药物对的ADMET Profile和基于ATC分类的药物替换方案;相互作用数据浏览和强大的结果可视化,增强了工具的实用性;DDInter旨在为医疗卫生系统提供开放专业的DDI数据库,辅助临床决策,确保病人用药安全;开放可下载的相互作用可以作为数据科学家挖掘潜在DDI的重要资源宝库。
  • 论文发表:Xiong, G.; Yang, Z.*; Yi, J.; Wang, N.; Wang, L.; Zhu, H.; Wu, C.; Lu, A.; Chen, X.; Liu, S.,
    Nucleic Acids Research 2021.

>>> 药物负向设计工具:Scopy 开发者

  • 项目地址:https://github.com/kotori-y/Scopy
  • 项目简介:高通量筛选(HTS)和虚拟筛选(VS)现已广泛用于在先导化合物发现。但是,大型化学文库中的许多分子表现出较差的类药性,多靶点结合性和潜在毒性,大大削弱了HTS和VS的效率。Scopy是基于Python语言的负向设计工具, 可用于过滤筛选库中的不良化合物,从而提升先导化合物发现的效率。
  • 论文发表:Yang, Z.-Y.; Yang, Z.-J.*; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Briefings in Bioinformatics 2021, 22 (3), bbaa194.
  • 软著登记:基于python语言的高通量负向设计虚拟筛选系统(2020SR1189891)

>>> 药物结构警示搜索工具:pySmash 开发者

  • 项目地址:https://github.com/kotori-y/pySmash
  • 项目简介:结构警示(Structural Alerts) 广泛用于分子生物活性和ADMET性质的评估,并且可以辅助解释先导化合物的优化。pySmash专为结构警示的提取及应用设计:提供三种子结构推导算法(环形指纹算法,路径算法,官能团算法);提供Python软件包和用户友好的软件;提供子结构应用的接口,便于其他药物发现工作流的调用。
  • 论文发表:Yang, Z.-Y.; Yang, Z.-J.*; Zhao, Y.; Yin, M.-Z.; Lu, A.-P.; Chen, X.; Liu, S.; Hou, T.-J.; Cao, D.-S.,
    Briefings in Bioinformatics 2021.

>>> 分子翻译及优化平台:ChemMort底层模型开发者

  • 项目地址:http://chemmort.scbdd.com/
  • 项目简介:ChemMort是一个结合分子翻译及性质优化的平台,可用于改善目标化合物的ADME/T性质,减少临床试验中由于不良的药物动力学性质而产生的损耗。首先使用当前先进的LSTM神经网络建立了一个分子翻译模型来实现从SMILES到512维的描述符的映射,该描述符经翻译模型还能返回至原始的SMILES,实现“逆向QSAR”。此外,ChemMort还包含了一个基于PSO优化算法及加权算法的优化模型,能够对分子进行多目标优化,在保持生物活性不变的情况下,改善化合物的ADMET性质。
  • 论文发表:Nucleic Acid Research (in progress)

>>> 量子化学描述符提取工具:QUANTUM开发者

  • 项目简介:QUANTUM是一个方便的/Python环境无依赖的量子化学描述符提取软件。量子化学描述符具有不依赖实验,无统计误差,物理意义明确,可解释性强,描述分子结构、电子结构及反应性精确等优势,可用于包括毒理学在内的QSAR模型的建立。然而,对于大多数药物化学家来说,从Gaussian等计算量子化学特征的软件输出的结果文件中,提取位于模型技术底层的量子化学描述符是一项非常困难且耗时的任务。QUANTUM基于Python语言,使用字符串匹配进行特征提取,可对Gaussian软件计算输出文件的17个局部和39个全局量子化学描述符进行自动提取。

>>> 其他项目

  • 成药性预测平台:ADMETlab 2.0 前端维护及部分后端计算函数
  • 频繁命中化合物预测系列平台:ChemAgg等.机器学习模型建立
  • 集成靶点预测分析平台:metaTarFisher.底层爬虫编写及平台维护
  • 基本分子描述符在线计算平台:BDes.描述符算法编写

研究成果

  1. Yang, Z.-Y.; Yang, Z.-J.*; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Scopy: an integrated negative design python library for desirable HTS/VS database design. Briefings in Bioinformatics 2021, 22 (3), bbaa194.
  2. Yang, Z.-Y.; Yang, Z.-J.*; Zhao, Y.; Yin, M.-Z.; Lu, A.-P.; Chen, X.; Liu, S.; Hou, T.-J.; Cao, D.-S., PySmash: Python package and individual executable program for representative substructure generation and application. Briefings in Bioinformatics 2021.
  3. Xiong, G.; Yang, Z.*; Yi, J.; Wang, N.; Wang, L.; Zhu, H.; Wu, C.; Lu, A.; Chen, X.; Liu, S., DDInter: an online drug–drug interaction database towards improving clinical decision-making and patient safety. Nucleic Acids Research 2021.
  4. Zhang, X.-C.; Wu, C.-K.; Yang, Z.-J.*; Wu, Z.-X.; Yi, J.-C.; Hsieh, C.-Y.; Hou, T.-J.; Cao, D.-S., MG-BERT: leveraging unsupervised atomic representation learning for molecular property prediction. Briefings in Bioinformatics 2021.
  5. Yang, Z.-Y.; Yang, Z.-J.; He, J.-H.; Lu, A.-P.; Liu, S.; Hou, T.-J.; Cao, D.-S., Benchmarking the mechanisms of frequent hitters: limitation of PAINS alerts. Drug Discovery Today 2021.
  6. Yang, Z.-Y.; Dong, J.; Yang, Z.-J.; Yin, M.; Jiang, H.-L.; Lu, A.-P.; Chen, X.; Hou, T.-J.; Cao, D.-S., ChemFLuo: a web-server for structure analysis and identification of fluorescent compounds. Briefings in Bioinformatics 2021, 22 (4), bbaa282.
  7. Xiong, G.; Wu, Z.; Yi, J.; Fu, L.; Yang, Z.; Hsieh, C.; Yin, M.; Zeng, X.; Wu, C.; Lu, A., ADMETlab 2.0: an integrated online platform for accurate and comprehensive predictions of ADMET properties. Nucleic Acids Research 2021.
  8. Wu, C.-K.; Zhang, X.-C.; Yang, Z.-J.; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Learning to SMILES: BAN-based strategies to improve latent representation learning from molecules. Briefings in Bioinformatics 2021, 22 (6).
  9. Fu, L.; Yang, Z.-Y.; Yang, Z.-J.; Yin, M.-Z.; Lu, A.-P.; Chen, X.; Liu, S.; Hou, T.-J.; Cao, D.-S., QSAR-assisted-MMPA to expand chemical transformation space for lead optimization. Briefings in Bioinformatics 2021.
  10. Yang, Z.-Y.; Dong, J.; Yang, Z.-J.; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Structural analysis and identification of false positive hits in luciferase-based assays. Journal of chemical information and modeling 2020, 60 (4), 2031-2043.
  11. Yang, Z.-Y.; Yang, Z.-J.; Dong, J.; Wang, L.-L.; Zhang, L.-X.; Ding, J.-J.; Ding, X.-Q.; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Structural analysis and identification of colloidal aggregators in drug discovery. Journal of chemical information and modeling 2019, 59 (9), 3714-3726.
  12. Fu, L.; Liu, L.; Yang, Z.-J.; Li, P.; Ding, J.-J.; Yun, Y.-H.; Lu, A.-P.; Hou, T.-J.; Cao, D.-S., Systematic Modeling of log D 7.4 Based on Ensemble Machine Learning, Group Contribution, and Matched Molecular Pair Analysis. Journal of chemical information and modeling 2019, 60 (1), 63-76.

练习项目

项目地址练习技术
贪吃蛇https://github.com/kotori-y/kotori-snakeJavaScript面向对象写法,JavaScript异步
推箱子https://github.com/kotori-y/kotori-sokobanJavaScript面向对象写法,JavaScript异步
井字棋https://github.com/kotori-y/kotori-tictactoe树,JavaScript对象的深拷贝,蒙特卡洛树搜索
scuehttps://github.com/kotori-y/scueVue,Redis,fastapi
fake-travel私有库Vue,Redis,fastapi,H5项目编译成移动端APP
俄罗斯方块https://github.com/kotori-y/kotori-tetrisTypeScript,Webpack