×
辽宁省生物大分子计算模拟工程中心

生物大分子数据库及信息处理研究

中心已建成自己的专业网站(http://ccsipb.lnu.edu.cn/),开发了禽流感病毒NS1蛋白二级数据库(http://ccsipb.lnu.edu.cn/ns1)、禽流感病毒NS1蛋白三维结构二级数据库(http://ccsipb.lnu.edu.cn/ns1/pdb)、细菌标准菌株核糖体16S rRNA序列二级数据库(http://ccsipb.lnu.edu.cn/16sdb)、标准16S rRNA进化树构建工具(http://ccsipb.lnu.edu.cn/16stree)、种系特异性引物设计工具LSPrimer(http://ccsipb.lnu.edu.cn/primer),中心的网站正逐渐完善使之成为生物大分子计算模拟与信息处理的专业网站。这些数据库已通过网络的形式公开发布,为从事流感病毒学和细菌分类学研究者提供便利的数据搜索源,同时我们提供相应标准计算软件、在线序列比对及相似性分析等计算工具。这些数据库的建设为深入开展相关研究课题奠定良好的前期基础。

1)禽流感病毒NS1蛋白质二级数据库(http://ccsipb.lnu.edu.cn/ns1),该数据库涵盖了禽流感病毒NS1蛋白的所有序列信息。数据库主要包括:对禽流感病毒NS1蛋白的简介,禽流感病毒NS1蛋白数据的导航、快速查询、高级搜索、序列比对、常用链接等功能模块。用户可以按照病毒的宿主类型、发现年份、亚型,通过高级搜索功能对NS1蛋白序列进行提取和相似性比对,通过相似性搜索结果找出不同病毒株NS1蛋白氨基酸序列的差异,从而对一定的病毒株的抗宿主能力提供线索从而对一定的抗宿主病毒株的抗病毒能力提供线索。在此数据库的基础上建立了一个序列蛋白质相似性的比对平台,通过相似性比对结果找出不同病毒株NS1蛋白氨基酸序列的差异,从而对一定的抗宿主病毒株的抗病毒能力提供线索,方便用户迅速获得自己所需的禽流感病毒株NS1蛋白的数据资料,并对其进行生物信息学研究,为进一步研究相关课题打下坚实基础。

2)禽流感病毒NS1蛋白三维结构二级数据库(http://ccsipb.lnu.edu.cn/ns1/ pdb),收集了文献中测定的A型流感病毒三维结构数据,为用户提供各结构的测定方法、分辨率、氨基酸序列、来源菌株、参考文献等信息,并提供在线三维结构可视化服务,用户可以直接在数据库网站观察分析NS1蛋白的三维结构特征。

3)细菌标准菌株核糖体16S rRNA序列二级数据库(http://ccsipb.lnu.edu.cn/ 16sdb),目前国际上已有的几个细菌核糖体16S rRNA序列二级数据库并没有对存在其中的序列数据进行严格的筛选,存在大量非标准菌株和不完善的数据,而标准菌株在细菌分类学中有关键的作用,需要有一个完善的标准菌株16S rRNA序列数据库。我们采用人工收集,逐个检验的方法采集了DSMZ确定的细菌列表中的所有细菌标准菌株的16S rRNA基因序列,构建了细菌标准菌株核糖体16S rRNA序列二级数据库。

4)微生物系统发育分析系统(http://ccsipb.lnu.edu.cn/16stree),目前微生物系统发育分析的方法很多,通过不同的方法得到的结果也不尽相同,根据系统发育的各种方法,采用我们研发的细菌标准菌株核糖体16S rRNA序列二级数据库作为序列数据,编写软件将由各个方法构建得到的发育树进行整合,从而为微生物系统发育分析提供一个更加全面和相对准确的结果。本分析软件内置标准16srRNA数据库,内置NCBI BLAST工具,用户无需配置BLAST参数,可自动计算BLAST结果,在线自动进行序列比对、内置Clustal工具,用户无需配置Clusatl参数,可自动计算Clustal结果,在线自动生成NJ、MP、ML、UPGMA、FM五种算法的一致树,根据Bootstrap值计算生成同时拥有进化距离与Bootstrap值的系统发育树,内置系统发育树编辑器,可在线编辑系统发育树并支持PNG、BMP、PDF、SVG等多种图像格式。本软件的开发解决了原Phylip生成的系统发育树的无法同时标示进化距离与Bootstrap值的问题,为细菌系统发育的研究提供了完善可靠的基础分析工具。

5)谱系特异性引物设计软件(http://ccsipb.lnu.edu.cn/primer),在物种分类鉴定、系统分类学、分子生态学等应用和研究中,PCR仍然是最常用的识别分子标记的技术。随着越来越多的物种的基因组已经完成测序,针对于环境中特定类群生物的区系分布、特定功能基因的多样性和表达模式分析等系统的研究正在逐渐增多。但这些研究面临的最大挑战,是很难找到一个可以从环境DNA样品中只扩增特定种系物种(已知物种或未知物种)的特定基因片段的PCR引物。设计这样的引物存在很多困难:一方面,引物必须尽可能的扩增出属于目的种系的物种的基因,另一方面又必须能分辨出与目的种系的物种非常接近的物种的基因。为了设计出这样的引物,我们设计了谱系特异性引物设计软件。本软件可用于近缘物种鉴别的PCR引物的设计。本软件可使用两类近缘物种同一基因的多条序列(例如16S rDNA序列,线粒体DNA),快速设计出对目标种系具有高度特异性且敏感性高的PCR引物,降低了种系特异性PCR引物设计的难度,本软件获得国家软件著作权(2013SR119553)。

6)药物分子的致癌性、致突变性和肝毒性预测工具开发,化合物的致癌性作为一种严重的毒性效应,已经成为药物开发过程中的重要问题。我们开发了新的基于集成学习方法的化合物致癌性预测工具,该工具可以依据化合物的二维结构通过机器学习系统预测该化合物是否具有致癌性,其总体准确率为70.1%,该模型优于目前文献中报道的致癌性预测模型。目前我们已经将该模型开发为可以通过网络访问的web服务,供相关研究人员使用。网址为:http://ccsipb.lnu.edu.cn/toxicity/CarcinoPred-EL。目前本服务器已为研究人员提供了5万多个化合物的致癌性预测服务。 同时本项目还研究了化合物的致突变性和肝毒性的预测方法,并取得了较好的结果,也开发了相关预测网站,分别为http://ccsipb.lnu.edu.cn/toxicity/MutagenPred-EL/和http://ccsipb.lnu.edu.cn/toxicity/LiverToxPred-EL/

辽宁省生物大分子计算模拟工程中心