特征量计算方法、筛选方法及化合物创建方法与流程
admin
2023-05-26 09:28:58
0
该技术已申请专利。仅供学习研究,如用于商业用途,请联系技术所有人。 特征量计算方法、筛选方法及化合物创建方法与流程

1.本发明涉及一种药物发现支持技术,尤其涉及一种特征量的计算、医药候选化合物的筛选及医药候选化合物的立体结构的创建。


背景技术:

2.以往,使用了计算机的药物研发中,通过准备收集数万到十万左右的现有的化合物而成的文库且提供化合物的结构式来调查相对于1个目标蛋白质的键合力,搜索医药候选化合物(以下,称为“命中(hit)”)。例如,在下述专利文献1中,提供化合物的结构式来预测键合力。并且,在专利文献2中,也记载有重复进行结构式的生成和键合力的预测来逐渐搜索具有所期望的键合力的化合物(重复试验)。
3.并且,在专利文献3中,记载有使用被称为“化合物指纹(指纹识别)”的描述符来进行搜索。“描述符”是指由化合物的结构式获得的信息,“化合物指纹”表示各种官能团的有无等信息。这种描述符的特征在于“若化合物的描述符相似,则化合物的骨架相似”。
4.并且,关于具有所期望的物理特性值的化合物的结构的搜索,以往主要通过解决“正向问题”(提供作为问题的原因的分子结构来求出作为结果的物理特性值)来进行,但是随着近年来信息学的发展,针对“反向问题”(提供物理特性值来求出具有其物理特性值的分子结构)的解法的研究正在迅速推进。关于基于解决反向问题的结构的搜索,例如已知有非专利文献1。
5.现有技术文献
6.专利文献
7.专利文献1:美国专利第9373059号公报
8.专利文献2:日本专利第5946045号公报
9.专利文献3:日本专利第4564097号公报
10.非专利文献
11.非专利文献1:“bayesian molecular design with a chemical language:用化学语言进行贝叶斯分子设计”、hisaki ikebata等、[2020年7月17日检索]、互联网(https://www.ncbi.nlm.nih.gov/pubmed/28281211)


技术实现要素:

[0012]
发明要解决的技术课题
[0013]
近年来,需求高的目标蛋白质变得较复杂且高难度,仅通过文库的筛选难以发现命中。另一方面,化合物的理论上的数量即使限制在分子量为500以下的低分子也有(10的60次方)个,当扩大至分子量为1,000左右的中分子时,其数量进一步增加,若考虑有史以来所合成的化合物为(10的9次方)个左右,则仍然有可能发现命中。但是,针对这种天文数字量的化合物整体调查键合力,不仅在实验中,即使在模拟中也几乎无法进行。即使在相对于一部分的化合物调查键合力的情况下,如上所述专利文献1、2那样重复进行重复试验时效
率也低。并且,在如专利文献3中所记载的指纹(fingerprint)那样的现有的描述符(特征量)的情况下,即使为显示出相同药效的化合物,其特征量也并不一定相似,特征量未准确表示对象结构体的化学性质,因此使用了特征量的搜索的效率低。
[0014]
并且,在上述非专利文献1中所记载的iqspr(inverse quantitative structure-property relationship:逆定量结构性质关系)中,由于结构更新的算法(基于贝叶斯估计的粒子滤波器),存在搜索效率立即降低等问题。具体而言,在基于贝叶斯估计的结构更新中,物理特性值接近目标值,但是搜索用结构多样性减少,搜索陷入局部极小值,即使重复进行试验,也无法轻易脱离局部极小值状态(无法到达最终结构)。
[0015]
如此,在现有的技术中,特征量未准确表示对象结构体的化学性质,因此使用了特征量的筛选和立体结构创建的效率低。
[0016]
本发明是鉴于这种情况而完成的,其目的在于,提供一种能够计算出准确表示对象结构体的化学性质的特征量的特征量计算方法。并且,本发明的目的在于,提供一种能够使用特征量来有效进行医药候选化合物的筛选的筛选方法。并且,本发明的目的在于,提供一种能够使用特征量来有效创建医药候选化合物的立体结构的化合物创建方法。
[0017]
用于解决技术课题的手段
[0018]
为了达到上述目的,本发明的第1方式所涉及的特征量计算方法具有:对象结构体指定工序,指定由具有化学性质的多个单元结构体构成的对象结构体;立体结构获取工序,针对对象结构体获取基于多个单元结构体的立体结构;及探针特征量计算工序,计算出表示相对于对象结构体的1种以上的探针的截面积的特征量,探针为具有实数电荷且产生范德华力的多个点分开配置的结构体。
[0019]
对象结构体的化学性质被表示为对象结构体与其周围的1种以上的探针之间的相互作用的结果,因此在对象结构体彼此之间表示截面积的特征量相似是表示这些对象结构体的化学性质相似的情况。即,通过第1方式计算出的特征量相似的对象结构体显示出相似的化学性质。因此,通过第1方式,能够计算出准确表示对象结构体的化学性质的特征量。另外,在第1方式及以下各方式中,“截面积”包含有散射截面积(微分散射截面积)、反应截面积、吸收截面积。
[0020]
第2方式所涉及的特征量计算方法在第1方式中,在探针特征量计算工序中,计算出截面积、或最近距离及散射角作为特征量。第2方式具体规定第1方式中的“表示截面积的特征量”。
[0021]
第3方式所涉及的特征量计算方法在第1或第2方式中,在探针特征量计算工序中,计算出取决于探针的种类、数量、组合、碰撞直径及入射能量的特征量作为特征量。
[0022]
第4方式所涉及的特征量计算方法在第1至第3方式中的任一个中,在立体结构获取工序中,通过生成所指定的对象结构体的立体结构来进行获取。
[0023]
第5方式所涉及的特征量计算方法在第1至第4方式中的任一个中,在对象结构体指定工序中,指定化合物作为对象结构体,在立体结构获取工序中,获取基于作为多个单元结构体的多个原子的化合物的立体结构,在探针特征量计算工序中,针对在立体结构获取工序中所获取的化合物,将氨基酸作为探针计算出第1特征量。在第5方式中,将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。另外,对聚集程度进行定量化的氨基酸并不限于1种,可以为键合有
2种以上的氨基酸的肽。
[0024]
第6方式所涉及的特征量计算方法在第5方式中,还具有不变量化工序,使第1特征量针对化合物的旋转不变量化来计算出第1不变量化特征量。在第6方式中,使第1特征量针对化合物的旋转不变量化,因此能够容易处理特征量,并且能够减小数据容量。关于第1特征量的不变量化,能够通过电势的角度平均来进行。
[0025]
第7方式所涉及的特征量计算方法在第6方式中,在探针特征量计算工序中,针对2种不同的氨基酸计算出第1特征量,在不变量化工序中,使用针对2种不同的氨基酸的第1特征量来计算出第1不变量化特征量。根据第7方式,能够在第1不变量化特征量的计算中,通过使用针对2种不同的氨基酸的第1特征量来在维持氨基酸的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第1不变量化特征量)的化合物的比较(药效判定)。
[0026]
第8方式所涉及的特征量计算方法在第1至第4方式中的任一个中,在对象结构体指定工序中,指定与作为目标蛋白质的活性部位的口袋键合的口袋结构体作为对象结构体,在立体结构获取工序中,获取基于多个虚拟球体的口袋结构体的立体结构,在探针特征量计算工序中,针对在立体结构获取工序中所获取的口袋结构体,将氨基酸作为探针计算出第2特征量。在第8方式中,将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为口袋结构体,将第1方式中的“单元结构体”设为多个虚拟球体。目标蛋白质的“活性部位”是指通过口袋结构体的键合而目标蛋白质的活性被促进或者抑制的部位,能够认为“虚拟球体”具有范德华半径、电荷等化学性质。
[0027]
在上述第5方式中,计算出相对于所提供的化合物的氨基酸的聚集程度,相对于此,在第8方式中,计算出表示相对于与所提供的目标蛋白质的口袋键合的口袋结构体的氨基酸的截面积的特征量(第2特征量)。第8方式所涉及的特征量相似的口袋结构体显示出相似的化学性质,因此通过第8方式,能够计算出准确表示口袋结构体的化学性质的特征量。另外,口袋结构体对应于与目标蛋白质的口袋键合的化合物。并且,在第8方式中,能够将基于目标蛋白质的立体结构的实际测量结果、口袋的位置信息等的模拟用于第2特征量的计算中。另外,关于目标蛋白质的立体结构,只要为能够识别氨基酸的各残基的解像力的立体结构,则不限定测定技术(x射线晶体结构、nmr结构(nmr:nuclear magnetic resonance:核磁共振)、低温tem结构(tem:transmission electron microscopy:透射电子显微镜)等)。
[0028]
第9方式所涉及的特征量计算方法在第8方式中,还具有不变量化工序,使第2特征量针对口袋结构体的旋转不变量化来计算出第2不变量化特征量。根据第9方式,与第6方式相同地,能够容易处理特征量,并且能够减小数据容量。关于第2特征量的不变量化,与第6方式相同地,能够通过电势的角度平均来进行。
[0029]
第10方式所涉及的特征量计算方法在第9方式中,在探针特征量计算工序中,针对2种不同的氨基酸计算出第2特征量,在不变量化工序中,使用针对2种不同的氨基酸的第2特征量来计算出第2不变量化特征量。根据第10方式,能够在第2不变量化特征量的计算中,通过使用针对2种不同的氨基酸的第2特征量来在维持氨基酸的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第2不变量化特征量)的化合物的比较(药效判定)。
[0030]
第11方式所涉及的特征量计算方法在第1至第4方式中的任一个中,在对象结构体
指定工序中,指定化合物作为对象结构体,在立体结构获取工序中,生成基于多个原子的化合物的立体结构,在探针特征量计算工序中,针对在立体结构获取工序中所获取的化合物的立体结构,将1种以上的核酸碱基、1种以上的脂质分子、1种以上的单糖分子、水、1种以上的离子中的1个以上作为探针计算出第3特征量。在第11方式中,将第1方式中的“探针”设为1种以上的核酸碱基等(可以为任意种类、数量、组合),将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。另外,离子可以为单原子离子,也可以为由多原子构成的离子。
[0031]
第12方式所涉及的特征量计算方法在第11方式中,还具有不变量化工序,使第3特征量针对化合物的旋转不变量化来计算出第3不变量化特征量。根据第12方式,与第6、第9方式相同地,能够容易处理特征量,并且能够减小数据容量。关于第3特征量的不变量化,与第6、第9方式相同地,能够通过电势的角度平均来进行。
[0032]
为了达到上述目的,本发明的第13方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的第1目标化合物和/或不与目标蛋白质键合的第2目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第5方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第1特征量建立关联并进行存储;筛选特征量计算工序,计算出针对作为确认到与目标蛋白质的键合的化合物的配体的第1特征量;相似度计算工序,计算出针对多个化合物的第1特征量与针对配体的第1特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取第1目标化合物和/或第2目标化合物。如第5方式的上述内容,若配体和对象化合物的第1特征量相似,则两者的药效相似。因此,根据第13方式,根据第1特征量提取与配体的药效相似的目标化合物(第1目标化合物和/或第2目标化合物),能够有效进行医药候选化合物的筛选。
[0033]
为了达到上述目的,本发明的第14方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的第1目标化合物和/或不与目标蛋白质键合的第2目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第6方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第1不变量化特征量建立关联并进行存储;筛选特征量计算工序,计算出针对作为确认到与目标蛋白质的键合的化合物的配体的第1不变量化特征量;相似度计算工序,计算出针对多个化合物的第1不变量化特征量与针对配体的第1不变量化特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取第1目标化合物和/或第2目标化合物。在计算出针对配体的特征量的方面,第14方式与第13方式共通,在第14方式中,根据第1不变量化特征量的相似度提取与配体的药效相似的目标化合物(第1目标化合物和/或第2目标化合物),能够有效进行医药候选化合物的筛选。
[0034]
为了达到上述目的,本发明的第15方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的第1目标化合物和/或不与目标蛋白质键合的第2目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第5方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;筛选特征量计算工序,使用第8方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2特征量;相似度计算工序,计算出针对多个化合物的第1特征量与针对口袋结构体的第2特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取第1目标化合物和/或第2
目标化合物。
[0035]
如第8方式的上述内容,若口袋结构体和对象化合物的第2特征量相似,则两者的化学性质相似。因此,根据第15方式,提取与口袋结构体的化学性质相似的目标化合物(第1目标化合物和/或第2目标化合物),能够有效进行医药候选化合物的筛选。另外,口袋结构体对应于与目标蛋白质键合的化合物,因此能够将针对口袋结构体的特征量(第2特征量)和针对化合物的特征量(第1特征量)进行对比,并能够计算出相似度。
[0036]
为了达到上述目的,本发明的第16方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的第1目标化合物和/或不与目标蛋白质键合的第2目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第6方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;筛选特征量计算工序,使用第9方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2不变量化特征量;相似度计算工序,计算出针对多个化合物的第1不变量化特征量与针对口袋结构体的第2不变量化特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取第1目标化合物和/或第2目标化合物。在第16方式中,使用第1、第2不变量化特征量来提取与口袋结构体的化学性质相似的目标化合物(第1目标化合物和/或第2目标化合物),能够有效进行医药候选化合物的筛选。另外,与第15方式的上述内容相同地,能够将针对口袋结构体的特征量(第2不变量化特征量)和针对化合物的特征量(第1不变量化特征量)进行对比,并能够计算出相似度。
[0037]
为了达到上述目的,本发明的第17方式所涉及的筛选方法从多个化合物提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第11方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第3特征量建立关联并进行存储;特征量计算工序,针对作为确认到与除了蛋白质以外的目标生物高分子键合的化合物的键合化合物计算出第3特征量;相似度计算工序,计算出针对多个化合物的第3特征量与针对键合化合物的第3特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第11方式的上述内容,本发明能够使用作为除了蛋白质以外的目标生物高分子的dna等,若与目标生物高分子键合的键合化合物和对象化合物的第3特征量相似,则两者的药效相似。因此,根据第17方式,根据第3特征量提取与键合化合物的药效相似的目标化合物,能够有效进行医药候选化合物的筛选。
[0038]
另外,在第13~第17方式中,在化合物提取工序中,能够提取相似度为阈值以上的化合物。关于阈值,能够根据筛选的目的、精度等条件来进行设定,也可以根据由用户指定的值来进行设定。并且,在第13~第17方式中,在化合物提取工序中,能够以相似度高到低的顺序提取化合物。通过这种提取,能够有效进行医药候选化合物的筛选。
[0039]
为了达到上述目的,本发明的第18方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第5方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;创建特征量计算工序,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1特征量;生成器构建工序,通过将多个化合物的立体结构设为训练数据且将第1特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用生成器从配体的第1特征量生成目标化合物的立体结构。
[0040]
在上述第13至第17方式所涉及的筛选方法中,从结构式已确定(已被写下)的多个化合物中发现与配体或者目标蛋白质匹配的化合物。因此,采用在计算出化合物的特征量之后,根据另外计算出的与配体或者目标蛋白质的口袋结构体的特征量的相似度提取化合物的方法即检索的方法。因此,只要预先记录化合物的结构式与特征量的对应关系,则能够发现相似度高的(或者阈值以上的)结构式。相对于此,在第18方式中,生成具有与配体的特征量(第1特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索。
[0041]
关于在提供特征量的情况下的结构式的生成,能够使用通过机器学习所构建的生成器来进行。具体而言,在第18方式中,通过将化合物的立体结构设为训练数据且将第1特征量设为解释变量的机器学习(学习方法并无特别限定)来构建生成器,并使用该生成器,从配体的第1特征量生成目标化合物的立体结构。在第18方式中,由于不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物的立体结构,从而能够有效创建医药候选化合物的立体结构。
[0042]
另外,在第18方式中所生成的立体结构受到作为训练数据所提供的化合物的特征的影响。因此,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。例如,通过提供容易合成的化合物作为训练数据,能够生成具有容易合成的立体结构的化合物。
[0043]
为了达到上述目的,本发明的第19方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第6方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;创建特征量计算工序,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1不变量化特征量;生成器构建工序,通过将多个化合物的立体结构设为训练数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从配体的第1不变量化特征量生成目标化合物的立体结构。在第19方式中,与第18方式相同地,生成具有与配体的特征量(第1不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第18方式相同地,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
[0044]
为了达到上述目的,本发明的第20方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,与使用第5方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;创建特征量计算工序,使用第8方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2特征量;生成器构建工序,通过将多个化合物的立体结构设为训练数据且将第1特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从口袋结构体的第2特征量生成目标化合物的立体结构。根据第20方式,与第18、第19方式相同地,生成具有与口袋结构体的特征量(第2特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第18、第19方式相同地,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
[0045]
为了达到上述目的,本发明的第21方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,与使用第6方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;创建特征量计算工序,使用第9方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2不变量化特征量;生成器构建工序,通过将多个化合物的立体结构设为训练数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从口袋结构体的第2不变量化特征量生成目标化合物的立体结构。根据第21方式,与第18至第20方式相同地,生成具有与口袋结构体的特征量(第2不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第18至第20方式相同地,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
[0046]
为了达到上述目的,本发明的第22方式所涉及的化合物创建方法从多个化合物创建与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第11方式所涉及的特征量计算方法计算出的第3特征量建立关联并进行存储;创建特征量计算工序,针对作为确认到与除了蛋白质以外的目标生物高分子的键合的化合物的键合化合物计算出第3特征量;生成器构建工序,通过将多个化合物的立体结构设为训练数据且将第3特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第3特征量生成目标化合物的立体结构。根据第22方式,与第18至第21方式相同地,生成具有与键合化合物的特征量(第3特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第18至第21方式相同地,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
[0047]
为了达到上述目的,本发明的第23方式所涉及的化合物创建方法创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:输入工序,输入一个或多个化合物的化学结构、使用第5方式所涉及的特征量计算方法计算出的针对化学结构的第1特征量及作为第1特征量的目标值的针对作为确认到与目标化合物的键合的化合物的配体的第1特征量;候选结构获取工序,使化学结构发生变化并获取候选结构;创建特征量计算工序,针对候选结构,使用第5方式所涉及的特征量计算方法计算出第1特征量;候选结构采用工序,采用或放弃候选结构,其中,进行根据通过化学结构的变化而候选结构的第1特征量是否接近目标值来判断是否采用候选结构的第1采用处理,在通过第1采用处理未采用候选结构的情况下,进行根据通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加来判断是否采用候选结构的第2采用处理,在通过第1采用处理及第2采用处理未采用候选结构的情况下,进行放弃化学结构的变化而返回到进行变化之前的化学结构的放弃处理;及控制工序,直至满足结束条件为止,重复进行输入工序、候选结构获取工序、创建特征量计算工序及候选结构采用工序中的处理。
[0048]
在第23方式所涉及的化合物创建方法中,根据结构多样性促进从局部极小值的脱离,能够有效搜索具有所期望的物理特性值(第1特征量的目标值)的化合物的结构。并且,
在第23方式中,由于与第18方式相同地不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物(特征量与配体的特征量(第1特征量)相似,因此药效相似的化合物)的立体结构,从而能够有效创建医药候选化合物的立体结构。
[0049]
为了达到上述目的,本发明的第24方式所涉及的化合物创建方法创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:输入工序,输入一个或多个化合物的化学结构、使用第6方式所涉及的特征量计算方法计算出的针对化学结构的第1不变量化特征量及作为第1不变量化特征量的目标值的针对作为确认到与目标化合物的键合的化合物的配体的第1不变量化特征量;候选结构获取工序,使化学结构发生变化并获取候选结构;创建特征量计算工序,针对候选结构,使用第6方式所涉及的特征量计算方法计算出第1不变量化特征量;候选结构采用工序,采用或放弃候选结构,其中,进行根据通过化学结构的变化而候选结构的第1不变量化特征量是否接近目标值来判断是否采用候选结构的第1采用处理,在通过第1采用处理未采用候选结构的情况下,进行根据通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加来判断是否采用候选结构的第2采用处理,在通过第1采用处理及第2采用处理未采用候选结构的情况下,进行放弃化学结构的变化而返回到进行变化之前的化学结构的放弃处理;及控制工序,直至满足结束条件为止,重复进行输入工序、候选结构获取工序、创建特征量计算工序及候选结构采用工序中的处理。在第24方式中,也与第23方式相同地,能够有效搜索具有所期望的物理特性值(第1不变量化特征量的目标值)的化合物的结构,并且能够有效创建医药候选化合物的立体结构。
[0050]
为了达到上述目的,本发明的第25方式所涉及的化合物创建方法创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:输入工序,输入一个或多个化合物的化学结构、使用第8方式所涉及的特征量计算方法计算出的针对化学结构的第2特征量及作为第2特征量的目标值的针对确认到与作为目标蛋白质的活性部位的口袋的键合的口袋结构体的第2特征量;候选结构获取工序,使化学结构发生变化并获取候选结构;创建特征量计算工序,针对候选结构,使用第8方式所涉及的特征量计算方法计算出第2特征量;候选结构采用工序,采用或放弃候选结构,其中,进行根据通过化学结构的变化而候选结构的第2特征量是否接近目标值来判断是否采用候选结构的第1采用处理,在通过第1采用处理未采用候选结构的情况下,进行根据通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加来判断是否采用候选结构的第2采用处理,在通过第1采用处理及第2采用处理未采用候选结构的情况下,进行放弃化学结构的变化而返回到进行变化之前的化学结构的放弃处理;及控制工序,直至满足结束条件为止,重复进行输入工序、候选结构获取工序、创建特征量计算工序及候选结构采用工序中的处理。在第25方式中,也与第23、第24方式相同地,能够有效搜索具有所期望的物理特性值(第2特征量的目标值)的化合物的结构,并且能够有效创建医药候选化合物的立体结构。
[0051]
为了达到上述目的,本发明的第26方式所涉及的化合物创建方法创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:输入工序,输入一个或多个化合物的化学结构、使用第9方式所涉及的特征量计算方法计算出的针对化学结构的第2不变量化特征量及作为第2不变量化特征量的目标值的针对确认到与作为目标蛋白质的活性部位的口袋的键合的口袋结构体的第2不变量化特征量;候选结构获取工序,使化学结构发
生变化并获取候选结构;创建特征量计算工序,针对候选结构,使用第9方式所涉及的特征量计算方法计算出第2不变量化特征量;候选结构采用工序,采用或放弃候选结构,其中,进行根据通过化学结构的变化而候选结构的第2不变量化特征量是否接近目标值来判断是否采用候选结构的第1采用处理,在通过第1采用处理未采用候选结构的情况下,进行根据通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加来判断是否采用候选结构的第2采用处理,在通过第1采用处理及第2采用处理未采用候选结构的情况下,进行放弃化学结构的变化而返回到进行变化之前的化学结构的放弃处理;及控制工序,直至满足结束条件为止,重复进行输入工序、候选结构获取工序、创建特征量计算工序及候选结构采用工序中的处理。在第26方式中,也与第23~第25方式相同地,能够有效搜索具有所期望的物理特性值(第2不变量化特征量的目标值)的化合物的结构,并且能够有效创建医药候选化合物的立体结构。
[0052]
为了达到上述目的,本发明的第27方式所涉及的化合物创建方法创建出与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:输入工序,输入一个或多个化合物的化学结构、使用第11方式所涉及的特征量计算方法计算出的针对化学结构的第3特征量及作为第3特征量的目标值的针对作为确认到与除了蛋白质以外的目标生物高分子键合的化合物的键合化合物的第3特征量;候选结构获取工序,使化学结构发生变化并获取候选结构;创建特征量计算工序,针对候选结构,使用第11方式所涉及的特征量计算方法计算出第3特征量;候选结构采用工序,采用或放弃候选结构,其中,进行根据通过化学结构的变化而候选结构的第3特征量是否接近目标值来判断是否采用候选结构的第1采用处理,在通过第1采用处理未采用候选结构的情况下,进行根据通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加来判断是否采用候选结构的第2采用处理,在通过第1采用处理及第2采用处理未采用候选结构的情况下,进行放弃化学结构的变化而返回到进行变化之前的化学结构的放弃处理;及控制工序,直至满足结束条件为止,重复进行输入工序、候选结构获取工序、创建特征量计算工序及候选结构采用工序中的处理。在第27方式中,也与第23~第26方式相同地,能够有效搜索具有所期望的物理特性值(第3特征量的目标值)的化合物的结构,并且能够有效创建医药候选化合物的立体结构。
[0053]
另外,在第23至第27方式中,“化学结构”除了初期状态下的结构(初期结构)以外,还包含初期结构因处理的重复而变化的结构。
[0054]
发明效果
[0055]
如上所述,根据本发明的特征量计算方法,能够计算出准确表示对象结构体的化学性质的特征量。并且,根据本发明的筛选方法,能够有效进行医药候选化合物的筛选。并且,根据本发明的化合物创建方法,能够有效创建医药候选化合物的立体结构。
附图说明
[0056]
图1是表示第1实施方式所涉及的筛选装置的结构的框图。
[0057]
图2是表示处理部的结构的框图。
[0058]
图3是表示存储于存储部的信息的图。
[0059]
图4是表示将化合物的结构信息与特征量建立关联而进行存储的状态的图。
[0060]
图5是表示求出微分散射截面积的状态的图。
[0061]
图6是表示针对化合物的aas描述符的计算步骤的流程图。
[0062]
图7是表示结构式的三维化的例的图。
[0063]
图8是表示微分散射截面积的例的图。
[0064]
图9是表示微分散射截面积的例的另一图。
[0065]
图10是表示针对口袋结构体的aas描述符的计算步骤的流程图。
[0066]
图11是表示目标蛋白质与口袋结构体的关系的概念图。
[0067]
图12是表示针对各种不变量化aas描述符的命中的发现容易度的例的图。
[0068]
图13是表示针对与目标蛋白质键合的化合物及不与目标蛋白质键合的化合物的命中的发现容易度的图。
[0069]
图14是表示基于配体的aas描述符的化合物的提取的步骤的流程图。
[0070]
图15是表示配体输入的筛选结果的例的表。
[0071]
图16是表示使用了针对口袋结构体的aas描述符的筛选的步骤的流程图。
[0072]
图17是表示目标蛋白质输入的筛选结果的例的表。
[0073]
图18是表示第2实施方式所涉及的化合物创建装置的结构的框图。
[0074]
图19是表示处理部的结构的图。
[0075]
图20是表示存储于存储部的信息的图。
[0076]
图21是表示输入配体时的立体结构生成步骤的流程图。
[0077]
图22是表示使用了机器学习的生成器构建的状态的概念图。
[0078]
图23是表示使用了生成器的立体结构的生成例的图。
[0079]
图24是表示输入目标蛋白质时的立体结构生成步骤的流程图。
[0080]
图25是表示进行基于结构多样性的化合物的立体结构创建时的化合物创建装置的结构的图。
[0081]
图26是表示基于结构多样性的立体结构生成处理的步骤的流程图。
[0082]
图27是表示第3实施方式所涉及的医药候选化合物搜索装置的结构的框图。
[0083]
图28是表示处理部的结构的图。
[0084]
图29是表示存储于存储部的信息的图。
具体实施方式
[0085]
以下,参考附图并对本发明的特征量计算方法、筛选方法及化合物创建方法的实施方式进行详细说明。
[0086]
<第1实施方式>
[0087]
图1是表示第1实施方式所涉及的筛选装置10(特征量计算装置、筛选装置)的结构的框图。筛选装置10为进行针对化合物(对象结构体)和/或口袋结构体(对象结构体)的特征量的计算及目标化合物的提取(筛选)的装置,并能够使用计算机来实现。如图1所示,筛选装置10具备处理部100(processor)、存储部200、显示部300及操作部400,并且相互连接而收发所需信息。针对这些构成要件能够采用各种设置方式,各构成要件可以设置于1处(1框体内、1室内等),也可以设置于隔开的位置而经由网络连接。并且,筛选装置10经由互联网等网络nw与外部服务器500及pdb(protein data bank:大型数据库)等外部数据库510连
接,并能够根据需要获取化合物的结构式、蛋白质的晶体结构等信息。
[0088]
<处理部的结构>
[0089]
图2是表示处理部100(processor)的结构的框图。处理部100具备信息输入部110、特征量计算部120、相似度计算部130、化合物提取部140、显示控制部150、cpu160(cpu:central processing unit)、rom170(rom:read only memory:只读存储器)及ram180(ram:random access memory:随机存取存储器)。
[0090]
信息输入部110经由未图示的磁光盘、半导体存储器等记录介质和/或网络nw输入化合物的结构式、目标蛋白质的x晶体结构及口袋位置等信息。特征量计算部120(对象结构体指定部、立体结构生成部、特征量计算部)计算出本发明所涉及的特征量(第1特征量、第1不变量化特征量、第2特征量、第2不变量化特征量、第3特征量、第3不变量化特征量)。相似度计算部130(相似度计算部)计算出所计算的特征量彼此的相似度。化合物提取部140(化合物提取部)从多个化合物根据相似度提取目标化合物。显示控制部150控制所输入的信息及处理结果在监视器310上的显示。对使用了处理部100的这些功能的特征量计算及目标化合物的筛选的处理的详细内容将进行后述。另外,基于这些功能的处理在cpu160的控制下进行。
[0091]
上述处理部100的各部的功能能够使用各种处理器(processor)来实现。在各种处理器中,例如包含有cpu,所述cpu为执行软件(程序)来实现各种功能的通用的处理器。并且,在上述各种处理器中,还包含有作为fpga(field programmable gate array:现场可编程门阵列)等在制造后能够变更电路结构的处理器的可编程逻辑设备(programmable logic device:pld)。而且,作为asic(application specific integrated circuit:专用集成电路)等具有为了执行特定的处理而专门设计的电路结构的处理器的专用电路等也包含于上述各种处理器中。
[0092]
关于各部的功能,可以由1个处理器来实现,也可以组合多个处理器来实现。并且,可以由1个处理器实现多个功能。作为由1个处理器构成多个功能的例,第1有如下方式,即,如以客户端、服务器等计算机为代表,由1个以上的cpu和软件的组合构成1个处理器,并通过该处理器实现多个功能。第2有如下方式,即,如以片上系统(system on chip:soc)等为代表,使用由1个ic(integrated circuit:集成电路)芯片实现系统整体的功能的处理器。如此,使用1个以上的上述各种处理器来作为硬件结构来构成各种功能。而且,更具体而言,这些各种处理器的硬件结构为组合了半导体元件等电路元件的电路(circuitry)。
[0093]
在上述处理器或者电路执行软件(程序)时,将欲执行的软件的处理器(计算机)能够读取的代码预先存储于rom170(参考图2)等非临时性记录介质中,从而处理器参考该软件。预先存储于非临时性记录介质的软件包含用于执行本发明所涉及的特征量计算方法、筛选方法及化合物创建方法的程序(特征量计算程序、筛选程序及化合物创建程序)。也可以在各种光磁记录装置、半导体存储器等的非临时性记录介质中记录代码而不是在rom170中。在进行使用了软件的处理时,例如将ram180用作临时存储区域,并且也能够参考例如存储于未图示的eeprom(electronically erasable and programmable read only memory:电子可擦和可编程只读存储器)中的数据。
[0094]
<存储部的结构>
[0095]
存储部200由dvd(digital versatile disk:数字通用光盘)、硬盘(hard disk)、
各种半导体存储器等非临时性记录介质及其控制部构成,且存储有图3所示的图像及信息。结构信息210包含化合物的结构式、目标蛋白质的立体结构及口袋位置。立体结构信息220为化合物和/或口袋结构体的立体结构的信息,可以由结构信息210产生,也可以输入已经立体化的信息。aas描述符230(第1特征量、第2特征量、第3特征量)为表示相对于化合物和口袋结构体等对象结构体的1种以上的探针的截面积的特征量,并通过后述特征量计算方法来计算。不变量化aas描述符240(第1不变量化特征量、第2不变量化特征量、第3不变量化特征量)为使aas描述符230针对化合物或者口袋结构体的旋转不变量化的特征量。相似度信息250为表示特征量彼此的相似度的信息,化合物提取结果260为表示根据相似度所提取的目标化合物的信息。
[0096]
图4为表示使针对n个(n为2以上的整数)化合物的结构信息210、立体结构信息220、aas描述符230及不变量化aas描述符240建立关联而被存储于存储部200的状态的图。在图4中,例如能够将结构式设为结构信息210,并将被立体化的结构式(后述)设为立体结构信息220。并且,在图4中,对于各化合物,针对20种氨基酸的每一个,将aas描述符230(记载为“va(r)”;a为表示氨基酸的种类的下标)与对应于其aas描述符230的不变量化aas描述符240(记载为“va(r)”;a为表示氨基酸的种类的下标、r=|r|;r为矢量r的绝对值)建立关联并进行存储。另外,如后述,aas描述符230及不变量化aas描述符240能够以最近距离、散射角、微分散射截面积等形式表述,但是在图4中为了方便,将这些表述统称为“va(r)”及“va(r)”。并且,关于aas描述符230及不变量化aas描述符240,可以按照用于筛选的描述符的数量来针对一部分的氨基酸进行存储而不是针对20种氨基酸整体。
[0097]
在存储部200中,可以存储多个如图4所示那样的信息的组(文库)。另外,在图4中示出了针对化合物的信息的存储状态,但是针对目标蛋白质也能够以相同的结构存储信息。并且,对使用了这种结构信息及立体结构信息的aas描述符和/或不变量化aas描述符的计算方法将进行后述。
[0098]
<显示部及操作部的结构>
[0099]
显示部300具备监视器310(显示装置),并能够显示所输入的图像、存储于存储部200的图像及信息、基于处理部100的处理的结果等。操作部400包括作为输入设备和/或定点设备的键盘410及鼠标420,用户能够经由这些设备及监视器310的画面进行本发明所涉及的特征量计算方法的执行及目标化合物的提取中所需的操作(后述)。用户能够执行的操作中例如包含有处理模式、欲计算的描述符的种类、用于筛选的描述符、相对于相似度的阈值的指定等。
[0100]
<筛选装置中的处理>
[0101]
在上述结构的筛选装置10中,能够按照用户经由操作部400进行的指示进行特征量(描述符)的计算和/或目标化合物的提取。以下,对各处理的详细内容进行说明。
[0102]
<特征量的计算>
[0103]
筛选装置10按照用户经由操作部400进行的指示,能够计算出aas描述符和/或不变量化aas描述符。
[0104]
<相对于化合物的aas描述符的计算>
[0105]
aas描述符为使氨基酸(丙氨酸、缬氨酸等20种)等探针与化合物(对象结构体)碰撞并散射时的微分散射截面积(截面积、散射截面积)。关于该微分散射截面积,能够通过由
筛选装置10进行模拟(本发明的特征量计算方法的执行)来计算。在模拟中,如图5所示,假设使氨基酸等探针902(探针)与配置于坐标系统的原点上的化合物900碰撞并散射的情况。
[0106]
由模拟获得的数据(标量)、即由以下式(1)获得的数据为目标描述符,如上所述,将该描述符称为“氨基酸散射描述符(aas描述符)”。另外,由于处于散射状态,因此氨基酸等探针的总能量(相互作用能+动能)为正。
[0107]
[数式1]dσ/dω(e,b,a)(1)
[0108]
其中,e为用于确定探针的入射能量的自变量,b为用于确定探针的碰撞直径的自变量,a为用于确定探针的种类的自变量。另外,在图5中对1个氨基酸与化合物散射的情况进行了说明,但是在上述模拟中,连接2个以上的氨基酸的肽也可以为探针。此时,式(1)中的“a”是指用于确定肽的种类的自变量。
[0109]
为了处理方便,能够将上述dσ/dω(e,b,a)构成为相对于化合物的旋转操作不变,并将这样处理的描述符称为“不变量化氨基酸散射描述符(不变量化aas描述符)”。例如,在所有角度对化合物进行平均,并相对于其平均化的化合物计算dσ/dω(e,b,a)而获得的量为相对于旋转操作不变的量,并且为“不变量化氨基酸散射描述符(不变量化aas描述符)”的一个表述。对aas描述符的不变量化将进行后述。
[0110]
另外,关于aas描述符及不变量化aas描述符,氨基酸为探针的一例,如后述其他物质也可以为探针。其中,探针为具有实数电荷且产生范德华力的多个点分开配置的结构体。在本发明中,如此将探针的范围扩展到除了氨基酸以外的物质时的特征量也称为“aas描述符”或者“不变量化aas描述符”。
[0111]
图6是表示针对化合物(对象结构体)的aas描述符的计算步骤的流程图。在步骤s100中,信息输入部110(处理器)按照用户经由操作部400等进行的指示输入化合物的结构式。由此,由所输入的化学式表示的化合物被指定为对象结构体(对象结构体指定工序)。
[0112]
特征量计算部120(处理器)对所输入的结构式进行三维化,从而生成基于多个原子(具有化学性质的多个单元结构体)的化合物的立体结构(步骤s102:立体结构获取工序)。结构式的三维化已知有各种方法,步骤s102中所使用的方法并无特别限定。图7是表示结构式的三维化的例的图,图7(a)部分表示所输入的结构式,图7(b)部分表示被三维化的结构式。另外,也可以获取(输入)已经被三维化的立体结构来代替如步骤s100、步骤s102那样输入结构式以将其三维化(立体结构获取工序)。特征量计算部120将被三维化的结构式的重心置于r(x,y,z)=0(坐标系统的原点)(步骤s102:立体结构获取工序)。
[0113]
特征量计算部120计算出氨基酸“a”(a为表示氨基酸的种类的数字;1至20)的各原子“μ”所感受到的相互作用能v

(r)(步骤s104;探针特征量计算工序)。另外,在v

(r)中,“r”为矢量。作为v

(r)的计算方法,能够采用分子动力学方法(md:molecular dynamics),但是并不限定于此。计算出v

(r)的氨基酸可以为预定的种类,也可以按照用户的指示来确定(只要为1种以上即可,也可以为多种)。
[0114]
特征量计算部120根据v

(r)计算出氨基酸的重心所感受到的相互作用能va(r)(步骤s106:探针特征量计算工序),并相对于va(r)以r=0((x,y,z)=(0,0,0))为中心取角度平均来计算va(r)(步骤s108:探针特征量计算工序)。r=|r|(r为矢量r的绝对值)、即va(r)中的r为v

(r)中的矢量r的绝对值。
[0115]
而且,特征量计算部120根据在步骤s106中计算出的va(r)计算出最近距离r
min,a

散射角θa作为上述入射能量e及碰撞直径b的函数(步骤s110:探针特征量计算工序)。如后述,该最近距离r
min,a
和散射角θa为aas描述符的一个表述。特征量计算部120根据最近距离r
min,a
和散射角θa计算出微分散射截面积dσ/dω(e,b,a)作为入射能量e及碰撞直径b的函数(步骤s112:探针特征量计算工序)。该微分散射截面积dσ/dω(e,b,a)也为aas描述符的一个表述。
[0116]
图8是表示针对图7所示的化合物的微分散射截面积的图。图8(a)部分为针对丙氨酸(氨基酸)的微分散射截面积(aas描述符、第1特征量)的图表,图8(b)部分为针对苯丙氨酸(氨基酸)的微分散射截面积(第1特征量)的图表。并且,图9是以其他形式表示针对图7所示的化合物的特征量(探针为丙氨酸)的图表。具体而言,图9(a)部分为表示最近距离r
min,a
(第1特征量)的图表,图9(b)部分为表示散射角θa的图表。
[0117]
<相对于口袋结构体的aas描述符的计算>
[0118]
在筛选装置10中,也能够指定与目标蛋白质键合的口袋结构体作为对象结构体,并计算出相对于该口袋结构体的特征量(aas描述符;第2特征量)。口袋结构体为与作为目标蛋白质的活性部位的口袋键合的对象结构体,“活性部位”是指通过口袋结构体的键合而目标蛋白质的活性被促进或者抑制的部位。图10是表示相对于口袋结构体的aas描述符的计算步骤的流程图,图11是表示目标蛋白质与口袋结构体的关系的概念图。
[0119]
在图10的流程图中,信息输入部110输入目标蛋白质的立体结构的实际测量及口袋的位置信息(步骤s200:对象结构体指定工序)。图11(a)部分表示目标蛋白质tp中的口袋po。通过步骤s200的处理,口袋结构体被指定为对象结构体。
[0120]
特征量计算部120在目标蛋白质的口袋上塞入多个虚拟球体(具有化学性质的多个单元结构体)(步骤s202:对象结构体指定工序、立体结构获取工序)。能够认为“虚拟球体”具有范德华半径、电荷等化学性质,“塞入虚拟球体”能够通过模拟(例如分子动力学方法)来进行。通过步骤s202,能够将所塞入的虚拟球体的集合(立体结构)作为口袋结构体(对象结构体)的立体结构而获得(步骤s204:立体结构生成工序)。图11(b)部分表示相对于目标蛋白质tp的口袋结构体ps的例。
[0121]
特征量计算部120使用所获取的立体结构计算出相对于口袋结构体的1种以上的氨基酸的截面积(第2特征量;aas描述符的一方式)(步骤s206:探针特征量计算工序)。实际上,能够计算出氨基酸如何被口袋结构体散射。另外,计算出第2特征量的氨基酸只要为1种以上即可(也可以为多种)。并且,关于第2特征量的计算,可以针对预定的种类的氨基酸进行,也可以针对按照用户的操作所设定的氨基酸进行。特征量计算部120将所计算的aas描述符作为aas描述符230与化合物的结构信息(结构信息210)、立体结构信息(立体结构信息220)建立关联并存储于存储部200(参考图3,图4;存储工序)。在已计算出后述的不变量化aas描述符的情况下,特征量计算部120将aas描述符与不变量化aas描述符建立关联。
[0122]
<将核酸碱基等作为探针的aas描述符的计算>
[0123]
在本发明中,作为医药的目标,能够使用作为除了蛋白质以外的生物高分子(化合物)的dna(deoxyribonucleic acid:脱氧核糖核酸)、rna(ribonucleic acid:核糖核酸)、细胞膜及多糖。在计算出针对这些目标化合物的特征量(第3特征量;aas描述符的一方式)的情况下,探针设成另一物质(各目标的组成部分)而不是氨基酸。具体而言,在目标为dna、rna、细胞膜及多糖的情况下,将探针分别设为1种以上的核酸碱基、1种以上的核酸碱基、1
种以上的脂质分子及1种以上的单糖分子。并且,在将这些作为探针计算出特征量时,可以考虑水、1种以上的离子。从局部来看,化合物的药效(与dna等目标的键合力)被表示为化合物与核酸碱基等(探针)之间的相互作用的结果,因此只要在化合物之间表示核酸碱基等的截面积的特征量相似,则表示这些化合物与目标的键合力相似。即,第3特征量相似的化合物显示出相似的药效。因此,能够通过第3特征量来准确判断化合物的化学性质。另外,关于第3特征量,能够以与第1、第2特征量的情况相同的方式计算(参考图5、图6及它们的说明等)。
[0124]
<aas描述符的不变量化>
[0125]
上述aas描述符表示氨基酸等的截面积,但是即使化合物相同,若发生旋转,则值也发生变化。因此,在第1实施方式所涉及的筛选装置10中,特征量计算部120(处理器)除了aas描述符以外或者代替aas描述符能够计算出“使aas描述符相对于化合物的旋转不变量化的不变量化aas描述符”(第1不变量化特征量、第2不变量化特征量、第3不变量化特征量)。另外,不管是化合物的情况,还是口袋结构体的情况,均能够以相同步骤进行不变量化。在使用了针对化合物的aas描述符(第1特征量、第3特征量)的情况下,可以获得针对化合物的不变量化aas描述符(第1不变量化特征量、第3不变量化特征量),在使用了针对口袋结构体的aas描述符(第2特征量)的情况下,可以获得针对口袋结构体的不变量化aas描述符(第2不变量化特征量)。
[0126]
根据上述相互作用能va(r)(参考步骤s106)计算出的最近距离r
min,a
及散射角θa、并且微分散射截面积dσ/dω(e,b,a)为不变量化之前的aas描述符的例。特征量计算部120通过使用对va(r)进行角度平均而获得的va(r)(r=|r|、r为矢量r的绝对值;参考步骤s108),能够计算出不变量化aas描述符(最近距离r
min,a
及散射角θa、并且微分散射截面积dσ/dω(e,b,a);第1~第3不变量化)。另外,aas描述符从最初开始针对平移是不变量的,不变量化的对象仅为旋转。
[0127]
特征量计算部120将所计算的不变量化aas描述符作为不变量化aas描述符240与化合物的结构信息(结构信息210)、立体结构信息(立体结构信息220)及原始的aas描述符230建立关联并存储于存储部200(参考图3,图4;存储工序)。另外,在使用针对2种不同的氨基酸的aas描述符计算出不变量化aas描述符的情况下,也能够具有多个aas描述符与不变量化aas描述符的建立关联。
[0128]
根据上述不变量化aas描述符,描述符相似的化合物显示出相似的药效(例如,与目标蛋白质的键合),因此准确表示对象结构体(化合物、口袋结构体、生物高分子)的化学性质。并且,根据对aas描述符进行不变量化而获得的不变量化aas描述符,例如通过使用针对2种不同的氨基酸的aas描述符进行不变量化,能够正确进行基于描述符的化合物的比较(药效判定)的同时,容易处理特征量,并且能够减少数据容量。而且,根据不变量化aas描述符,能够容易发现命中。
[0129]
<基于不变量化aas描述符的命中的发现容易度>
[0130]
通过以下步骤1~5,对基于不变量化aas描述符的命中的发现容易度进行了评价。
[0131]
(步骤1)相对于某一目标(目标蛋白质等),将x个命中化合物和y个不是命中的化合物进行混合。
[0132]
(步骤2)针对(x+y)个化合物整体计算出不变量化aas描述符。
[0133]
(步骤3)计算出每一个描述符的相似度。
[0134]
(步骤4)根据不变量化aas描述符的相似度对(x+y)个化合物进行分组。
[0135]
(步骤5)检查是否机械生成命中所聚集的组。
[0136]
针对相对于蛋白质abl1(激酶)所制作的组,将每一组的命中的发现容易度(=期待值;命中数
×
命中含有率)的例(与随机分组的情况的比较结果)示于图12中。另外,在图12(a)部分中,示出针对(1)不变量化aas描述符(探针为氨基酸;第1不变量化特征量)、(2)不变量化多离子(探针均为单原子离子的na
+
和cl-;第3不变量化特征量)、(3)不变量化aas描述符及离子(探针为氨基酸及na
+
和cl-;第4不变量化特征量)、(4)不变量化偶极子(探针为偶极子;第5不变量化特征量)、(5)不变量化aas描述符和偶极子(探针为氨基酸及偶极子;第6不变量化特征量)、(6)不变量化多离子和偶极子(探针为na
+
和cl-及偶极子;第7不变量化特征量)、(7)不变量化aas描述符、多离子及偶极子(探针为氨基酸、na
+
和cl-及偶极子;第8不变量化特征量)的命中数的期待值。并且,在图12(b)部分中,示出针对(1)不变量化aas描述符(探针为氨基酸;第1不变量化特征量、与图12(a)部分的(1)相同)、(8)不变量化单原子离子(探针为na
+
;第3不变量化特征量)、(9)不变量化aas描述符和单原子离子(探针为氨基酸和na
+
;第4不变量化特征量)、(10)不变量化单原子离子和偶极子(探针为na
+
和偶极子;第7不变量化特征量)、(11)不变量化aas描述符、单原子离子及偶极子(探针为氨基酸、na
+
及偶极子;第8不变量化特征量)的命中数的期待值。
[0137]
根据图12的结果,可知在使用了不变量化aas描述符的情况下,生成比随机的分组包含更多的命中的组。另外,在图12中,组号码根据分组方法(随机、不变量化aas描述符)而不同,因此分组的优劣是通过“是否包含有期待值高的(包含更多的命中的)组”来进行判断而不是通过比较相同组号码中的期待值来进行判断。
[0138]
<与目标蛋白质键合的化合物/不键合的化合物的不变量化aas描述符>
[0139]
根据在本发明中所使用的特征量(aas描述符、不变量化aas描述符、氨基酸散射描述符),例如如图12所说明,能够进行与目标蛋白质键合的目标化合物的提取和创建,但是除此以外,例如也能够进行不与目标蛋白质键合的目标化合物的提取和创建。图13(a)部分为根据不变量化aas描述符计算出的与目标蛋白质(与图12的例相同的蛋白质abl1)键合的化合物(第1目标化合物)的命中数的期待值(与随机分组的情况的比较)的例(探针为氨基酸),图13(b)部分为相同地根据不变量化aas描述符计算出的不与目标蛋白质键合的化合物(第2目标化合物)的命中数的期待值的例。如从图13可知,通过使用本发明所涉及的特征量,不仅针对与目标蛋白质键合的化合物(第1目标化合物),而且针对不与目标蛋白质键合的化合物(第2目标化合物)也能够容易发现命中。其中,键合力例如能够通过ic50(half maximal(50%)inhibitory concentration;50%抑制浓度)来测定,此时“键合/不键合”的阈值能够使用100~1000μm左右的值,但是也可以按照课题(评价哪一种特性)使用不同的指标和不同的值。
[0140]
另外,“不与特定蛋白质键合”是指“对没有毒性(毒性低)的化合物的描述有效”,因此利用aas描述符和不变量化aas描述符的相似度,能够搜索或者创建没有毒性(毒性低)的化合物。
[0141]
<特征量计算方法的效果>
[0142]
如上所述,在第1实施方式所涉及的筛选装置10(特征量计算装置、筛选装置)中,
使用本发明所涉及的特征量计算方法及执行此的程序(特征量计算程序),能够计算出准确表示对象结构体的化学性质的特征量(aas描述符、不变量化aas描述符)。
[0143]
<目标化合物的提取(筛选)>
[0144]
对使用了上述aas描述符及不变量化aas描述符的从多个化合物中的目标化合物(医药候选化合物)的提取进行说明。关于目标化合物的提取,有根据配体的描述符(aas描述符、不变量化aas描述符)进行的模式(第1模式)、根据目标蛋白质的口袋结构体的描述符(aas描述符、不变量化aas描述符)进行的模式(第2模式)及根据键合化合物(确认到与除了蛋白质以外的目标生物高分子键合的化合物)的描述符(aas描述符、不变量化aas描述符)进行的模式(第3模式)。能够按照用户经由操作部400进行的操作来选择通过哪一个模式进行提取。
[0145]
<配体输入的筛选>
[0146]
图14是表示使用了配体的aas描述符的筛选(第1模式)的步骤的流程图。若开始进行处理,则特征量计算部120计算出配体的aas描述符(步骤s300:筛选特征量计算工序)。另外,配体为确认到与目标蛋白质的键合的化合物,因此步骤s300中的aas描述符的计算能够通过图6的流程图所示的步骤来计算。
[0147]
如图4的上述内容,筛选装置10中,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与对应于该立体结构的aas描述符(第1特征量)建立关联并存储于存储部200。相似度计算部130计算出针对化合物的aas描述符与在步骤s400中计算出的配体的aas描述符的相似度(步骤s302:相似度计算工序)。在计算出相似度之后,化合物提取部140根据相似度提取目标化合物(步骤s304:化合物提取工序)。如上述,只要aas描述符相似,则显示出相似的药效(与目标蛋白质的键合),因此通过使用aas描述符的相似度,能够提取具有与配体相似的药效的化合物(即,作为医药候选的目标化合物)。另外,具体而言,基于相似度的目标化合物的提取(步骤s3404)能够通过“提取相似度为阈值以上的化合物”、“以相似度高到低的顺序提取化合物”等来进行。
[0148]
在图14中,对使用了aas描述符的筛选的步骤进行了说明,但是也能够以相同的步骤进行使用了不变量化aas描述符的筛选。具体而言,特征量计算部120通过图6的步骤及上述式(2)、上述式(3)计算出配体的不变量化aas描述符(第1不变量化特征量),并由相似度计算部130计算出与存储于存储部200的化合物的不变量化aas描述符的相似度。在计算出相似度之后,由化合物提取部140根据相似度提取目标化合物。基于相似度的目标化合物的提取的具体方式能够与aas描述符相同地进行。
[0149]
图15是表示配体输入的筛选结果的例的表。图15(a)部分表示设为使用aas描述符“提取相似度为阈值以上的化合物”的情况的结果,图15(b)部分表示设为使用不变量化aas描述符“以相似度高到低的顺序提取化合物”的情况的结果。另外,在图15(a)部分中,根据针对氨基酸1的aas描述符(与关于图4的说明相同地,将各种表述统称为“va(r)”)提取化合物,但是也可以根据针对其他氨基酸(氨基酸2~20)的aas描述符(例如,v2(r))提取化合物。并且,也可以分别计算出针对不同的氨基酸的多个aas描述符(例如,v1(r)和v2(r))的相似度(v1(r)彼此的相似度和v2(r)彼此的相似度),并根据此提取化合物。用于化合物的提取的aas描述符可以为1种,但是通过使用多种aas描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多种aas描述符的情况下,在这些描述符之间的氨基酸的组合并无特
别限定(例如,可以为v1(r)和v2(r),也可以为v3(r)和v4(r))。
[0150]
相同地,在图15(b)部分中,根据针对氨基酸1、氨基酸2的不变量化aas描述符(v1(r)、v2(r))提取化合物,但是进行不变量化aas描述符的计算的氨基酸可以为其他组合(例如,基于氨基酸3、氨基酸4的v3(r)、v4(r))。并且,可以根据氨基酸的组合不同的多个不变量化aas描述符(例如,v1(r)及v2(r)和v3(r)及v4(r))进行化合物的提取(例如,使用v1(r)、v2(r)的相似度和v3(r)、v4(r)的相似度)。用于化合物的提取的不变量化aas描述符可以为1种,但是通过使用多种不变量化aas描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多种不变量化aas描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定(例如,可以为v1(r)及v2(r)和v3(r)及v4(r),也可以为v1(r)及v2(r)和v1(r)及v3(r))。关于针对哪一个氨基酸计算出描述符及相似度,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
[0151]
另外,在图15(a)部分中,将相似度的阈值设为80%,(b)部分中,将提取个数设为100个,但是这些值为例示,能够按照筛选的精度等条件设定阈值及提取个数。能够按照用户经由操作部400进行的输入来进行设定。并且,与图15相反地,可以在使用了aas描述符的情况下,设为“以相似度高到低的顺序提取化合物”,在使用了不变量化aas描述符的情况下,设为“提取相似度为阈值以上的化合物”。化合物提取部140将如图15所示那样的提取结果作为化合物提取结果260存储于存储部200(参考图3)。
[0152]
<目标蛋白质输入的筛选>
[0153]
图16是表示使用了针对目标蛋白质的口袋结构体的aas描述符的筛选(第2模式)的步骤的流程图。若开始进行处理,则特征量计算部120计算出针对目标蛋白质的口袋结构体的aas描述符(步骤s400:筛选特征量计算工序)。步骤s400中的aas描述符的计算能够通过图11的流程图所示的步骤来计算。相似度计算部130计算出针对化合物的aas描述符与在步骤s400中计算出的针对口袋结构体的aas描述符的相似度(步骤s402:相似度计算工序)。在计算出相似度之后,化合物提取部140根据相似度提取目标化合物(步骤s404:化合物提取工序)。与上述输入配体的情况相同地,基于相似度的目标化合物的提取(步骤s404)具体能够通过“提取相似度为阈值以上的化合物”、“以相似度高到低的顺序提取化合物”等来进行。
[0154]
在使用不变量化aas描述符的情况下,也能够以与图16的流程图相同的步骤提取目标化合物。
[0155]
图17是表示目标蛋白质输入的筛选结果的例的表。图17(a)部分表示设为使用aas描述符“提取相似度为阈值以上的化合物”的情况的结果,图17(b)部分表示设为使用不变量化aas描述符“以相似度高到低的顺序提取化合物”的情况的结果。能够按照筛选的精度等条件设定相似度的阈值及提取个数。能够按照用户经由操作部400进行的输入来进行设定。并且,与图17相反地,可以在使用了aas描述符的情况下,设为“以相似度高到低的顺序提取化合物”,在使用了不变量化aas描述符的情况下,设为“提取相似度为阈值以上的化合物”。
[0156]
目标蛋白质输入的筛选的情况也与配体输入的筛选的情况(参考图14、图15及其说明)相同地,可以改变氨基酸的种类,也可以使用针对不同的氨基酸的多个描述符(aas描
述符、不变量化aas描述符)。用于化合物的提取的描述符可以为1种,但是通过使用多种描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多种描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定。关于针对哪一个氨基酸计算出描述符及相似度,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
[0157]
化合物提取部140将如图17所示那样的提取结果作为化合物提取结果260存储于存储部200(参考图3)。
[0158]
<输入除了蛋白质以外的目标生物高分子的筛选>
[0159]
在第1实施方式所涉及的筛选装置10中,也能够提取与除了蛋白质以外的目标生物高分子键合的目标化合物。此时,以与上述图14、图16的流程图相同的步骤,使用第3特征量进行筛选(第3模式)。
[0160]
<筛选装置的效果>
[0161]
如上所述,在第1实施方式所涉及的筛选装置10中,能够使用通过本发明所涉及的特征量计算方法(使计算机执行特征量计算方法的程序)计算出的特征量(aas描述符、不变量化aas描述符),并通过本发明所涉及的筛选方法(及使计算机执行该筛选方法的程序)有效进行医药候选化合物的筛选。
[0162]
<第2实施方式>
[0163]
对本发明的第2实施方式所涉及的化合物创建装置进行说明。图18是表示化合物创建装置20(特征量计算装置、化合物创建装置)的结构的框图。另外,针对与第1实施方式相同的要件标注相同的参考符号,并省略详细的说明。
[0164]
化合物创建装置20包含处理部101。处理部101构成为如图19那样,且包含信息输入部110、特征量计算部120(创建特征量计算部)、生成器构建部132(生成器构建部)、化合物立体结构生成部142(化合物立体结构生成部)、显示控制部150。信息输入部110、特征量计算部120、显示控制部150的功能分别与上述筛选装置10中的信息输入部110、特征量计算部120、显示控制部150相同。与筛选装置10的上述内容相同地,能够使用各种处理器(processor)来实现这些各部的功能。
[0165]
图20是表示存储于存储部201的信息的图。在存储部201中,存储有筛选装置10中的立体结构生成结果270来代替化合物提取结果260。与图4的上述内容相同地,存储于存储部201的信息相互建立关联地存储。
[0166]
<目标化合物的立体结构生成>
[0167]
对使用了上述aas描述符及不变量化aas描述符的目标化合物(医药候选化合物)的立体结构生成进行说明。基于化合物创建装置20的目标化合物的立体结构生成中,由于不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物的立体结构,从而能够有效创建医药候选化合物的立体结构。关于立体结构的生成,有根据配体的描述符(aas描述符、不变量化aas描述符)进行的模式(第1模式)、根据目标蛋白质的口袋结构体的描述符(aas描述符、不变量化aas描述符)进行的模式(第2模式)及根据键合化合物的描述符(aas描述符、不变量化aas描述符)进行的模式(第3模式)。能够按照用户经由操作部400进行的操作来选择通过哪一个模式进行立体结构的生成。
[0168]
<输入配体的立体结构生成>
[0169]
图21是表示输入配体时的立体结构生成步骤的流程图。若开始进行处理,则特征量计算部120计算出配体的描述符(aas描述符)(步骤s500:对象结构体指定工序、立体结构生成工序、创建特征量计算工序)。与第1实施方式相同地,步骤s500的处理能够使用本发明所涉及的特征量计算方法(及使计算机执行该特征量计算方法的程序)来进行(参考图6~图9及针对这些图的说明)。
[0170]
在步骤s502中,生成器构建部132通过机器学习来构建生成器(生成器构建工序)。以下,参考图22并对步骤s502的处理进行说明。
[0171]
(步骤1)如图22(a)部分所示,特征量计算部120针对多个化合物计算出将氨基酸作为探针的aas描述符(第1特征量),并制作使化合物910的结构式立体化后的结构式912与aas描述符914的配对。
[0172]
(步骤2)如图22(b)部分所示,生成器构建部132通过将化合物的立体结构(结构式912)设为训练数据且将aas描述符914设为解释变量的深层学习等机器学习来构建生成器916。机器学习的方法并不限定于特定的方法,例如可以为简单的全部键合的类神经网络,也可以为卷积类神经网络(cnn:convolutional neural network)和生成式对抗网络(gan:generative adversarial network)。其中,立体结构的生成精度取决于所使用的学习方法,因此优选按照立体结构的生成条件、要求精度等条件来选择学习方法。
[0173]
若上述步骤1、步骤2的处理结束,则返回到图21的流程图。化合物立体结构生成部142使用所构建的生成器从配体的aas描述符生成目标化合物(命中)的立体结构(被立体化的结构式)(步骤s504:化合物立体结构生成工序)。由此,能够获得具有与配体相似的药效(与目标蛋白质的键合)的化合物即医药候选化合物的立体结构。另外,提供相同的aas描述符的立体结构能够存在多个。化合物立体结构生成部142将所生成的立体结构作为立体结构生成结果270与aas描述符(aas描述符230)建立关联并存储于存储部201。按照用户经由操作部400进行的指示,显示控制部150可以将所生成的立体结构显示于显示器310。
[0174]
另外,在上述步骤中,计算出用于构建生成器的aas描述符的氨基酸可以为1种,也可以为多种。其中,通过计算出针对多种氨基酸的aas描述符并将其用于学习(生成器的构建),能够提高所生成的立体结构的精度。另外,在使用氨基酸的种类不同的多个aas描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定。关于针对哪一个氨基酸计算出aas描述符并将其用于学习,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
[0175]
<立体结构的生成例>
[0176]
图23对使用通过机器学习所构建的生成器生成的立体结构的例进行说明。图23(a)部分为立体结构的正确数据,图23(b)部分为使用生成器生成的立体结构的例。另外,在图23中作为创建对象的化合物为图7、图22中的化合物910。
[0177]
<训练数据的特征与所生成的立体结构的关系>
[0178]
通过上述步骤所生成的立体结构受到作为训练数据所提供的化合物的特征的影响。因此,通过选择作为训练数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。例如,通过提供具有容易合成的立体结构的化合物的aas描述符作为训练数据,能够生成具有与配体相似的药效且具有容易合成的立体结构的化合物。关于提供针对
哪一种化合物的aas描述符作为训练数据,能够根据欲生成的化合物的特征来进行选择。
[0179]
<使用了不变量化aas描述符的立体结构的生成>
[0180]
在图22~图23中,对使用了aas描述符(第1特征量)的立体结构的生成进行了说明。相对于此,在使用了不变量化aas描述符(第1不变量化特征量)的情况下,也与使用aas描述符的情况相同地,能够通过将不变量化aas描述符设为训练数据且将立体结构(被立体化的结构式)设为解释变量的机器学习(深层学习)生成目标化合物的立体结构。
[0181]
<输入目标蛋白质的立体结构生成>
[0182]
在化合物创建装置20中,除了基于上述配体输入的立体结构生成以外,也能够通过输入目标蛋白质来生成目标化合物的立体结构。此时,也与输入配体的情况相同地,能够进行使用了aas描述符(第2特征量)的立体结构生成及使用了不变量化aas描述符(第2不变量化特征量)的立体结构生成。
[0183]
图24是表示输入目标蛋白质时(设为使用aas描述符)的立体结构生成步骤的流程图。若开始进行处理,则特征量计算部120计算出目标蛋白质的口袋结构体的aas描述符(第2特征量)(步骤s600:对象结构体指定工序、立体结构生成工序、创建特征量计算工序)。与第1实施方式相同地,步骤s600的处理能够使用本发明所涉及的特征量计算方法来进行(参考图9及针对这些图的说明)。
[0184]
在步骤s602中,与输入配体的情况相同地,生成器构建部132通过机器学习(深层学习)来构建生成器(生成器构建工序)。关于生成器的构建,能够以与上述步骤1、步骤2相同的方式进行。具体而言,特征量计算部120针对口袋结构体计算出将氨基酸作为探针的aas描述符(第2特征量),并制作口袋结构体的立体结构与aas描述符的配对。生成器构建部132将aas描述符设为解释变量且将口袋结构体的立体结构设为训练数据,并构建生成器。化合物立体结构生成部142使用所构建的生成器从口袋结构体的aas描述符生成目标化合物(命中)的立体结构(被立体化的结构式)(步骤s604:化合物立体结构生成工序)。由此,能够获得具有与口袋结构体相似的药效(与目标蛋白质的键合)的化合物即医药候选化合物的立体结构。另外,提供相同的aas描述符的立体结构能够存在多个。化合物立体结构生成部142将所生成的立体结构作为立体结构生成结果270与aas描述符(aas描述符230)建立关联并存储于存储部201(参考图20)。按照用户经由操作部400进行的指示,显示控制部150可以将所生成的立体结构显示于显示器310。
[0185]
另外,在使用第2不变量化特征量(不变量化aas描述符)的情况下,也能够以相同的方式生成立体结构。
[0186]
<输入除了蛋白质以外的目标生物高分子时的立体结构的生成>
[0187]
在化合物创建装置20中,除了上述方式以外,也能够通过输入除了蛋白质以外的目标生物高分子来生成目标化合物的立体结构。此时,也与上述方式相同地,能够进行使用了aas描述符(第3特征量)的立体结构生成和使用了不变量化aas描述符(第3不变量化特征量)的立体结构生成。
[0188]
<基于结构多样性的化合物的创建>
[0189]
在上述方式中,使用由机器学习构成的生成器生成医药候选化合物的立体结构,但是如下所述,也能够根据结构多样性生成化合物的立体结构。
[0190]
<化合物创建方法的附加结构>
[0191]
以下所说明的化合物创建方法对应于上述本发明的第23~第27方式,但是相对于第23~第27方式(以下,称为“基本结构”),适当追加以下结构(以下,称为“附加结构”)。
[0192]
(附加结构:其1)
[0193]
在基本结构中,在候选结构采用工序中,作为第1采用处理,在候选结构的物理特性值与物理特性值的目标值的差分的绝对值为化学结构的物理特性值与物理特性值的目标值的差分的绝对值以下的情况下,进行候选结构采用处理,在候选结构的物理特性值与物理特性值的目标值的差分的绝对值大于化学结构的物理特性值与物理特性值的目标值的差分的绝对值的情况下,进行如下处理,即,根据候选结构的物理特性值与物理特性值的目标值的差分,通过第1函数计算出第1采用概率,并以第1采用概率采用候选结构。
[0194]
(附加结构:其2)
[0195]
在附加结构其1中,第1函数为相对于候选结构的物理特性值与物理特性值的目标值的差分的绝对值和化学结构的物理特性值与物理特性值的目标值的差分的绝对值的差分的单调递减函数。
[0196]
(附加结构:其3)
[0197]
在基本结构、附加结构其1至其2中的任一个中,在候选结构采用工序中,作为第2采用处理,进行如下处理,即,计算出结构组的结构多样性的增减量,根据增减量,通过第2函数计算出第2采用概率,并以第2采用概率采用候选结构。
[0198]
(附加结构:其4)
[0199]
在附加结构其3中,第2函数为相对于结构多样性的增减量的单调增加函数。
[0200]
(附加结构:其5)
[0201]
在基本结构、附加结构其1至其4中的任一个中,在候选结构获取工序中,在化学结构中追加或删除原子或原子团而生成对象结构,并将对象结构作为候选结构。
[0202]
(附加结构:其6)
[0203]
在基本方式、附加结构其1至其5中的任一个中,在控制工序中,在使化学结构发生变化的次数达到指定的次数的情况和/或候选结构的物理特性值达到目标值的情况下,判定为满足结束条件,并结束输入工序、候选结构获取工序、物理特性值计算工序及候选结构采用工序的处理。
[0204]
<化合物创建装置的结构>
[0205]
图25是表示进行基于结构多样性的化合物的立体结构创建时的化合物创建装置的结构的图。在该方式中,化合物创建装置20具有处理部103(processor)来代替图18、图19所示的处理部101。处理部103具有输入部105、候选结构获取部107、物理特性值计算部109、候选结构采用部111、控制部113、显示控制部115、cpu121、rom123及ram125。其他结构与图18相同。另外,可以设为如下:通过使用除了处理部101的结构以外还具备处理部103的结构的处理部,能够执行基于生成器的化合物创建和基于结构多样性的化合物的创建。
[0206]
<化合物创建方法的步骤>
[0207]
图26是表示基于结构多样性的化合物创建方法的步骤的流程图。
[0208]
<数据的输入>
[0209]
输入部105输入一个或多个化合物的化学结构(初期结构)、化学结构(初期结构)中的一个或多个物理特性值及物理特性值的目标值(步骤s1010:输入工序)。关于这些数
据,可以使用存储于存储部201的数据,也可以经由网络nw从外部服务器500及外部数据库510中获取。可以按照用户经由操作部400进行的指示输入来确定输入哪一种数据。初期结构可以为1个,也可以为多个。并且,物理特性值可以为1个,也可以为多个。
[0210]
<物理特性值及目标值>
[0211]
在基于结构多样性的化合物的创建中,能够将aas描述符(第1~第3特征量)和不变量化aas描述符(第1~第3不变量化特征量)的值设为“物理特性值”,这些物理特性值能够通过本发明的特征量计算方法进行计算。并且,能够将针对配体、口袋结构体、键合化合物等的aas描述符和不变量化aas描述符的值设为物理特性值的“目标值”。对具体例将进行后述。
[0212]
<候选结构的获取>
[0213]
候选结构获取部107使化学结构随机变化并获取候选结构(步骤s1020:候选结构获取工序)。此时,只要为使化学结构发生变化的方法,则可以使用任何方法。例如,能够使用如下方法:在化学结构中追加或删除原子或原子团而生成对象结构,并将对象结构作为候选结构。具体而言,该方法为化合物结构的生成方法,其具备:(a)准备评价合成适性的基准的化合物数据库及化合物结构(化学结构)的工序;(b)选择向化合物结构的原子或原子团的追加或者从化合物结构的原子的删除中的任一个的工序;(c)在选择向化合物结构的原子的追加的情况下,使新原子与从化合物结构中所包含的原子中选择的原子键合,或者在选择向化合物结构的原子的删除的情况下,删除从化合物结构中所包含的原子中选择的原子,并获取改变后的化合物结构的工序;(d)根据化合物数据库的信息来判断改变后的化合物结构的合成适性的工序;(e)在改变后的化合物结构具有合成适性的情况下,概率性地允许改变,在改变后的化合物结构不具有合成适性的情况下,概率性地放弃改变的工序;(f)直至经过了工序(e)的化合物结构满足结束条件为止,重复进行工序(b)~(e)的工序。另外,可以通过显示控制部115使所生成的候选结构显示在显示器310(显示装置)上。并且,在从后述步骤s1090返回到步骤s1020时,在用于评价合成适性的化合物数据库中追加一个或多个在上次生成的结构中物理特性值接近目标值的结构,在步骤s1020中,也能够容易逐渐生成具有接近目标值的物理特性值的结构。
[0214]
<物理特性值的评价>
[0215]
物理特性值计算部109计算出候选结构(在步骤s1020中发生变化的结构)的物理特性值(步骤s1030:物理特性值计算工序、创建特征量计算工序)。关于物理特性值的计算,优选使用与估算初期结构的物理特性值时相同的方法。
[0216]
<第1采用处理>
[0217]
候选结构采用部111判断物理特性值是否接近目标值(步骤s1040:候选结构采用工序)。具体而言,在将结构变化前的物理特性值设为f0、将结构变化后的物理特性值设为f1、将物理特性值的目标值设为f时,|f-f1|≤|f-f0|成立的情况下(候选结构的物理特性值与物理特性值的目标值的差分(第1差分)的绝对值为化学结构的物理特性值与物理特性值的目标值的差分(第2差分)的绝对值以下的情况下),物理特性值接近(不远离)目标值,因此进入步骤s1070并采用结构变化(第1采用处理)。另一方面,在为|f-f1|>|f-f0|的情况下(候选结构的物理特性值与物理特性值的目标值的差分(第1差分)的绝对值大于化学结构的物理特性值与物理特性值的目标值的差分(第2差分)的绝对值的情况下),进入步骤
s1050。
[0218]
在步骤s1050(候选结构采用工序)中,候选结构采用部111根据候选结构的物理特性值与物理特性值的目标值的差分,通过第1函数计算出第1采用概率(第1采用处理)。具体而言,候选结构采用部111提供d=|f-f1|-|f-f0|的单调递减函数p1(d),并估算概率p1=p1(d)。单调递减函数p1(d)相当于本发明中的“第1函数”(相对于候选结构的物理特性值与物理特性值的目标值的差分的绝对值和化学结构的物理特性值与物理特性值的目标值的差分的绝对值的差分的单调递减函数),概率p1相当于本发明中的“第1采用概率”。
[0219]
作为单调递减函数p1(d),能够使用各种函数,但是例如能够使用以下式(2)所表示的函数。σ为超参数,能够通过改变σ的值来调节单调递减的程度。可以通过用户经由操作部400进行的指示输入来变更参数的值。
[0220]
[数式2]
[0221]
p1(d)=exp[-d/σ]
ꢀꢀꢀ
(2)
[0222]
在n个目标(在步骤s1010中所输入的物理特性值为n个)的情况下,能够将表示各目标的指标设为i,例如使用以下式(3)及式(4)所表示的函数。
[0223]
[数式3]
[0224]
wi=exp[-di/σi]
ꢀꢀꢀ
(3)
[0225]
[数式4]
[0226][0227]
式(3)及式(4)所表示的函数为“只要有1个接近目标的物理特性值,则采用其结构变化”的基准,但是也能够使用其他各种函数。并且,更简单地说,也可以考虑将n个目标的物理特性值考虑为n维的矢量ff及ff,并从euclid距离|ff-ff|估算d=|ff-ff1|-|ff-ff0|以作为单目标的问题来求解的方法(ff、ff0、ff1、ff为矢量)。在采用该方针的情况下,优选预先根据现有的数据计算出各物理特性值的平均和方差,并实施标准化之后,计算出距离。
[0228]
求出概率p1之后,候选结构采用部111使用适当生成的随机数,以概率p1进入步骤s1070并采用结构变化,并以概率(1-p1)进入步骤s1055。即,候选结构采用部111以第1采用概率采用候选结构(第1采用处理)。如此进行概率的处理(即使在物理特性值远离目标值的情况下,也以概率p1采用结构变化)是为了防止落入局部极小值。局部极小值为“无论如何改变结构,物理特性值也远离目标值的状态”,为了脱离局部极小值而达到全局极小值,必须经过物理特性值远离目标值的结构变化。通过上述概率的处理,能够确保这种路径。
[0229]
<第2采用处理>
[0230]
在步骤s1050中未采用第1采用处理的结果候选结构的情况下(概率(1-p1)),候选结构采用部111进行第2采用处理以根据“通过化学结构的变化而由化学结构及候选结构构成的结构组的结构多样性是否增加”判断是否采用候选结构(步骤s1055、步骤s1060、步骤s1070)。以下对第2采用处理进行说明。另外,将表示结构的指标设为j,并将结构组表示为s={sj}。将提供结构组s的结构多样性的函数表述为v(s)。结构多样性越大,v(s)采用越大的值。
[0231]
<提供多个初期结构的情况>
[0232]
在提供n(>1)个初期结构的情况下,考虑采用或放弃n个化学结构中第k个化学结构的结构变化。在第m次试验中,根据结构变化前(m-1回目)的结构组sm-1={s(m-1)j}和结构变化后(第m次)的结构组sm={smj}定义第k个化学结构的结构变化后的结构组sk={s(m-1)0、s(m-1)1、
……
、smk、
……
、s(m-1)n},并估算dv=v(sk)-v(sm-1)。即,dv表示基于结构变化的结构多样性的增减量。在dv≥0的情况下(根据第k个结构变化而多样性提高的情况;在步骤s1055中为“是”),提供相对于dv(结构多样性的增减量)的单调增加函数p2(dv),并计算出概率p2=p2(dv)(步骤s1060:第2采用处理)。然后,使用适当生成的随机数,以概率p2进入步骤s1070(采用结构变化;第2采用处理),并以概率(1-p2)进入步骤s1080(放弃结构变化,返回到原始的结构;放弃处理)。单调增加函数p2(dv)相当于本发明中的“第2函数”,概率p2相当于本发明中的“第2采用概率”。
[0233]
在结构多样性增加的情况下,进行上述概率的处理(以通过单调增加函数p2(dv)计算出的概率p2计算出候选结构),这是因为在设为“在结构多样性增加的情况下必须采用结构变化”的情况下,尽管物理特性值远离目标值,但是采用结构变化的频度变得过高,其结果,有时向物理特性值的目标值的收敛变慢。通过进行上述概率的处理,能够加快物理特性值的收敛并有效搜索化合物的结构。
[0234]
另外,在步骤s1060中计算出的dv<0的情况下(多样性减少的情况;在步骤s1055中为“否”),进入步骤s1080(放弃结构变化,返回到原始的结构;放弃处理)。
[0235]
<提供1个初期结构的情况>
[0236]
另外,在初期结构为1个的情况下,将表示试验的指标设为t,考虑通过过去m次的试验所获得的结构组sprev={st-1、st-2、
……
、st-m}和追加考虑采用或放弃的结构st而获得的结构组scurr={st、st-1、
……
、st-(m-1)},计算出dv=v(scurr)-v(sprev),与初期结构为多个的情况相同地,通过单调增加函数p2(dv)计算出概率p2(步骤s1060:第2采用处理)即可。
[0237]
<提供结构组的结构多样性的函数>
[0238]
作为上述“提供结构组的结构多样性的函数”,例如可以考虑基于谷本系数(tanimoto系数)(表示化合物的相似度的指标之一)的如下定义(也能够有其他各种定义)。具体而言,若将结构s由位串(0或1的序列)的指纹(按照化合物的一定规则转换成固定长度的矢量,已知有各种生成方法)表示的结构设为fs,则谷本系数的定义由以下式(5)表示。
[0239]
[数式5]
[0240][0241]
其中,|fs|是在fs中为1的位数,|fs∩fs’|是在fs和fs’中共同为1的位数。在fs和fs’完全一致的情况下,ts,s’为1,在fs和fs’完全不一致的情况下,ts,s’为0。因此,ts,s’为表示结构s与结构s’的相似度的指标。由于欲求出的是非相似度,因此由以下式(6)定义结构s与结构s’的非相似度vs,s’。
[0242]
[数式6]
[0243]vs,s

=1-t
s,s

ꢀꢀꢀ
(6)
[0244]
能够使用该非相似度vs,s’,由以下式(7)定义结构组s的非相似度(即,结构组的结构多样性)。
[0245]
[数式7]
[0246][0247]
v(s)采用从0到1为止的值,值越大,表示结构组的结构多样性越高。
[0248]
并且,作为相对于结构多样性的增减量dv的单调增加函数p2(dv),例如能够使用以下式(8)所表示的函数。σv和cv为超参数,能够通过改变值来调节单调增加的程度。可以通过用户经由操作部400进行的指示输入来变更这些参数的值。
[0249]
[数式8]
[0250]
p2(dv)=cv(1-exp[-dv/σv])
ꢀꢀꢀ
(8)
[0251]
从函数形式明确可知,p2在dv

∞的极限下成为cv。因此,cv是指“在多样性充分提高的结构变化时采用其结构变化的概率”。
[0252]
<处理的重复>
[0253]
针对所提供的初期结构的每一个进行上述第1采用处理、第2采用处理及放弃处理,若针对所有化学结构结束上述处理,则结束1次试验。
[0254]
作为上述第1采用处理、第2采用处理及放弃处理的结果而采用或放弃候选结构之后,控制部113判断是否满足结束条件(步骤s1090:控制工序)。例如,在使化学结构发生变化的次数(试验次数)达到指定的次数的情况和/或候选结构的物理特性值达到目标值的情况下,能够判定为“满足结束条件”。在计算出多个化学结构和/或物理特性值的情况下,可以设为“只要有1个达到目标值的化学结构和/或物理特性值,则结束计算”,也可以设为“直至所有结构和/或物理特性值达到目标为止重复进行试验”。控制部113直至满足结束条件为止(在步骤s1090中为“否”的期间),重复进行从步骤s1020至步骤s1080为止的处理(输入工序、候选结构获取工序、物理特性值计算工序、候选结构采用工序),满足结束条件之后(在步骤s1090中为“是”),结束化合物创建方法的处理(步骤s1100)。
[0255]
<基于结构多样性的立体结构创建的效果>
[0256]
如上所述,通过根据结构多样性创建立体结构的化合物创建方法,能够促进从局部极小值的脱离,并且加快物理特性值的收敛,因此能够有效搜索具有所期望的物理特性值的化合物的结构。
[0257]
<具体的物理特性值、特征量等>
[0258]
对上述方式的基于结构多样性的立体结构创建(化合物创建)中的具体的物理特性值和特征量进行说明。
[0259]
在创建出与目标蛋白质键合的目标化合物的立体结构的情况下(第23方式),使用第5方式所涉及的特征量计算方法计算出的特征量(第1特征量、aas描述符)为“物理特性值”,针对配体的第1特征量为“物理特性值的目标值”。
[0260]
在创建出与目标蛋白质键合的目标化合物的立体结构的情况下(第24方式),使用第6方式所涉及的特征量计算方法计算出的特征量(第1不变量化特征量、不变量化aas描述符)为“物理特性值”,针对配体的第1不变量化特征量为“物理特性值的目标值”。
[0261]
在创建出与目标蛋白质键合的目标化合物的立体结构的情况下(第25方式),使用
第8方式所涉及的特征量计算方法计算出的特征量(第2特征量、aas描述符)为“物理特性值”,针对确认到与作为目标蛋白质的活性部位的口袋的键合的口袋结构体的第2特征量为“物理特性值的目标值”。
[0262]
在创建出与目标蛋白质键合的目标化合物的立体结构的情况下(第26方式),使用第9方式所涉及的特征量计算方法计算出的特征量(第2不变量化特征量、不变量化aas描述符)为“物理特性值”,针对确认到与作为目标蛋白质的活性部位的口袋的键合的口袋结构体的第2不变量化特征量为“物理特性值的目标值”。
[0263]
在创建出与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构的情况下(第27方式),使用第11方式所涉及的特征量计算方法计算出的特征量(第3特征量、aas描述符)为“物理特性值”,针对作为确认到与除了蛋白质以外的目标生物高分子键合的化合物的键合化合物的第3特征量为“物理特性值的目标值”。
[0264]
<化合物创建装置的效果>
[0265]
如上所述,在第2实施方式所涉及的化合物创建装置20中,能够使用通过本发明所涉及的特征量计算方法计算出的特征量(aas描述符、不变量化aas描述符),并通过本发明所涉及的化合物创建方法(及使计算机执行该方法的化合物创建程序)有效创建医药候选化合物的立体结构。
[0266]
<第3实施方式>
[0267]
上述第1实施方式为进行特征量的计算及基于此的筛选的方式,第2实施方式为进行特征量的计算及基于此的目标化合物的立体结构创建的方式,但是除了特征量的计算以外,也可以进行筛选和目标化合物的立体结构创建这两个。因此,在第3实施方式所涉及的医药候选化合物搜索装置30(特征量计算装置、筛选装置、化合物创建装置;参考图27)中,具有图27所示的处理部102来代替图1所示的筛选装置10的处理部100、图18所示的化合物创建装置20的处理部101或者图25所示的处理部103。如图28所示,处理部102具有通信控制部110a(通信控制部)、特征量计算部120(特征量计算部)、相似度计算部130(相似度计算部)、生成器构建部132(生成器构建部)、化合物提取部140(化合物提取部)、化合物立体结构生成部142(化合物立体结构生成部)、显示控制部150(显示控制部)、cpu160、rom170及ram180,能够进行特征量的计算、筛选及化合物的立体结构创建。并且,医药候选化合物搜索装置30将这些处理中所需的信息和处理的结果等存储于存储部202中。具体而言,如图29所示,与存储于存储部200及存储部201的信息(参考图3、图20)相对应地存储于存储部202。
[0268]
其他要件与图1所示的筛选装置10、图18所示的化合物创建装置20相同,因此标注相同的参考符号并省略详细的说明。另外,在进行基于结构多样性的化合物的创建的情况下,处理部102具有对应于处理部103(参考图25)的各部,并将对应于基于结构多样性的化合物的创建的信息(物理特性值、目标值、创建出的立体结构等)存储于存储部202。
[0269]
通过上述结构,在第3实施方式所涉及的医药候选化合物搜索装置30中,也与筛选装置10、化合物创建装置20相同地,能够计算出准确表示对象结构体的化学性质的特征量,且有效进行医药候选化合物的筛选,并有效创建医药候选化合物的立体结构。
[0270]
以上,对本发明的实施方式进行了说明,但是本发明并不限定于上述方式,如以下所例示,能够进行各种变形。
[0271]
<可处理的医药的目标>
[0272]
在本发明中,作为医药的目标,除了蛋白质以外,也能够使用dna(deoxyribonucleic acid)、rna(ribonucleic acid)、细胞膜、多糖。其中,需要将蛋白质时的探针(氨基酸)变更为其他物质。具体而言,在dna的情况下,将氨基酸变更为核酸碱基,在rna的情况下,将氨基酸变更为核酸碱基,在细胞膜的情况下,将氨基酸变更为脂质分子,在多糖的情况下,将氨基酸变更为单糖分子。以下,对本发明中通过该变更也可处理dna、rna、细胞膜、多糖的原因进行说明。
[0273]
蛋白质、dna、rna、细胞膜、多糖统称为生物高分子,并由固有的组成部分组成。具体而言,蛋白质的组成部分为氨基酸,dna的组成部分为核酸碱基,rna的组成部分相同地为核酸碱基,细胞膜的组成部分为脂质分子,多糖的组成部分为单糖分子。与蛋白质相同地,在dna、rna、细胞膜、多糖中也具有作为活性部位的口袋,因此在医药的目标为dna、rna、细胞膜、多糖的情况下,本发明也能够通过将在蛋白质的情况下所示的实施方式中的氨基酸变更为目标的组成部分来进行应对。另外,对在化合物或者口袋结构体的周围的氨基酸、核酸碱基、脂质分子、单糖分子的聚集程度进行定量时,也能够考虑水。
[0274]
<可处理的活性>
[0275]
在本发明中,除了“基于化合物的对目标生物分子的单独的活性”等通常的活性以外,也能够针对“基于化合物的除了目标生物分子以外对由其他生物分子组成的复合体的细胞的活性”进行使用。
[0276]
符号说明
[0277]
10
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
筛选装置
[0278]
20
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物创建装置
[0279]
30
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
医药候选化合物搜索装置
[0280]
100
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理部
[0281]
101
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理部
[0282]
102
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理部
[0283]
103
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理部
[0284]
105
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
输入部
[0285]
107
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
候选结构获取部
[0286]
109
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
物理特性值计算部
[0287]
110
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
信息输入部
[0288]
110a
ꢀꢀꢀꢀꢀꢀꢀꢀ
通信控制部
[0289]
111
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
候选结构采用部
[0290]
113
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
控制部
[0291]
115
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
显示控制部
[0292]
120
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
特征量计算部
[0293]
121
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
cpu
[0294]
123
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
rom
[0295]
125
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ram
[0296]
130
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
相似度计算部
[0297]
132
ꢀꢀꢀꢀꢀꢀꢀꢀ
生成器构建部
[0298]
140
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物提取部
[0299]
142
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物立体结构生成部
[0300]
150
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
显示控制部
[0301]
160
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
cpu
[0302]
170
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
rom
[0303]
180
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
ram
[0304]
200
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储部
[0305]
201
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储部
[0306]
202
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储部
[0307]
210
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
结构信息
[0308]
220
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
立体结构信息
[0309]
230
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aas描述符
[0310]
240
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
不变量化aas描述符
[0311]
250
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
相似度信息
[0312]
260
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物提取结果
[0313]
270
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
立体结构生成结果
[0314]
300
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
显示部
[0315]
310
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
监视器
[0316]
400
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
操作部
[0317]
410
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
键盘
[0318]
420
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
鼠标
[0319]
500
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
外部服务器
[0320]
510
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
外部数据库
[0321]
900
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物
[0322]
902
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
探针
[0323]
910
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
化合物
[0324]
912
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
结构式
[0325]
914
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
aas描述符
[0326]
916
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
生成器
[0327]
nw
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
网络
[0328]
po
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
口袋
[0329]
ps
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
立体结构
[0330]
s100~s112
ꢀꢀꢀꢀꢀꢀꢀꢀ
特征量计算方法的各步骤
[0331]
s200~s206
ꢀꢀꢀꢀꢀꢀꢀꢀ
特征量计算方法的步骤
[0332]
s300~s304
ꢀꢀꢀꢀꢀꢀꢀꢀ
化合物提取方法的各步骤
[0333]
s400~s404
ꢀꢀꢀꢀꢀꢀꢀꢀ
化合物提取方法的各步骤
[0334]
s500~s504
ꢀꢀꢀꢀꢀꢀꢀꢀ
化合物创建方法的各步骤
[0335]
s600~s604
ꢀꢀꢀꢀꢀꢀꢀꢀ
化合物创建方法的各步骤
[0336]
s1010~s1100
ꢀꢀꢀꢀꢀꢀ
化合物创建方法的各步骤
[0337]
tp
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
目标蛋白质
[0338]bꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
碰撞直径
[0339]
rmin
ꢀꢀꢀꢀꢀꢀꢀꢀ
最近距离
[0340]
θa
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
散射角

相关内容

热门资讯

消防知识心得体会 消防知识心得体会(精选6篇)  当我们有一些感想时,有这样的时机,要好好记录下来,它可以帮助我们了解...
《爱的教育》读书心得体会 《爱的教育》读书心得体会  《爱的教育》读书心得体会(精选32篇)  当细细地品读完一本名著后,大家...
感恩的心得体会 关于感恩的心得体会(精选14篇)  当我们经过反思,对生活有了新的看法时,好好地写一份心得体会,这样...
安全生产警示教育心得体会 安全生产警示教育心得体会  为有效发挥事故案例的警示教育作用,强化安全生产底线思维、红线意识,推动安...
工学交替的心得 工学交替的心得  “工学交替”模式,是让学生第一学年在学校学习基本的专业知识和技能,第二学年由学校组...
教育的意义心得体会 教育的意义心得体会(通用17篇)  心中有不少心得体会时,将其记录在心得体会里,让自己铭记于心,通过...
第一次讲课心得 第一次讲课心得(精选24篇)  当我们有一些感想时,可以通过写心得体会的方式将其记录下来,这么做可以...
公司新员工践行《员工手册》心... 公司新员工践行《员工手册》心得体会进入公司到现在将近一个月的时间里,我在公司领导、同事们的培养和帮助...
观看“美育云端课堂”心得体会... 观看“美育云端课堂”心得体会最新5篇大全  心中有不少心得体会时,写心得体会是一个不错的选择,这样我...
小学教师师德师风心得体会 小学教师师德师风心得体会(通用10篇)  教师既是知识种子的传播者,又是文明之树的培育者,既是人类灵...