生物信息学论文完结版 下载本文

内容发布更新时间 : 2024/5/21 20:21:00星期一 下面是文章的全部内容请认真阅读。

生物信息学论文

学院:生命科学技术学院

专业:生物科学 班级:2013级 老师:高亚梅 学生:蔡欣月 学号:20134083003

黑龙江八一农垦大学

链孢霉GH5-1及GH6-3基因生物信息学分析

蔡欣月(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)

【摘要】目的:分析和预测链孢霉菌GH5-1和GH6-3基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测链孢霉菌GH5-1和GH6-3基因并预测该基因编码蛋白结构的特征和功能。结果:GH5-1基因全长2006bp,编码区具有390个氨基酸,在GenBank同源序列中,其与endoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH5-1保守域。GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14。预测GH5-1编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是16.92%、33.85%、49.23%,2个GTPase结构域。GH5-1蛋白为亲水蛋白,无跨膜区,有信号肽。GH6-3基因全长1914bp,编码区具有419个氨基酸,在GenBank同源序列中,其与exoglucanase 3 [Neurospora crassa OR74A]基因氨基酸序列一致性达到100%,且有GH6-3保守域。GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51。预测GH6-3编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是29.59%、16.71%、53.75%,1个GTPase结构域。GH6-3蛋白为亲水蛋白,有跨膜区,无信号肽。结论:成功预测GH5-1和GH6-3基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。

【关键词】链孢霉菌;糖基水解酶家族5(GH5-1);糖基水解酶家族6(GH6-3)生物信息学

链孢霉菌又称脉孢菌、串珠菌、红色面包菌,俗称红霉菌,是食用菌生产中重要的竞争性杂菌之一。其广泛分布在自然界土壤中和和禾本科植物上,尤其在玉米芯上极易发生[1]。通过空气、土壤、腐烂植物、谷物等进行传播、在食用菌生产中,链孢菌和绿菌是生产中最常见的病原菌。链孢霉在高温高湿条件下最易发生,是夏季食用菌生产中危害严重的病原菌,该病原菌生活力强、生长迅速、繁殖快、分生孢子多、易传播,几乎会感染所有熟料栽培的食用菌,并且一旦感染很难彻底消灭,给生产造成较大的经济损失,严重危害所有食用菌的母种、原种、栽培种,以及香菇、木耳、银耳、银耳、灵芝等熟料菌简[2]。目前链孢霉菌的全基因组序列已经获得,但有关其蛋白和基因的各类研究仍为数较少,本文通过对链孢霉GH5-1和GH6-3基因及编码蛋白质进行生物信息学分析,分析其基本生化及结构特征,为下一步对其进行克隆表达和应用奠定基础。

一、材料与方法

1.1材料

通过ExPASy 数据库的UniProtKB(www.expasy.org或www.uniprot.org/uniprot)获得链孢霉菌的GH5-1与GH6-3基因序列。GH5-1基因编号为NCU00762,NCBI的登录号为XM_959066.2,其他物种的GH5-1的氨基酸序列均来自Genbank,登录号见表1。GH6-3基因编号为NCU09680,NCBI的登录号为XM_952322.2,其他物种的GH6-3的氨基酸序列均来自Genbank,登录号见表2。

1.2方法

利用美国国家生物技术信息中心(NCBI,www.ncbi.nlm.nih.gov)的基本局部比对搜索工具(BLAST,www.ncbi.nlm.nih.gov/blast/),运用Blastx完成基因同源性分析。

应用ORF finder(http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。

利用保守结构域(www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)分析预测其保守域。

通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,www.expasy.org)所提供的蛋白组学和分析工具:Protparam、Proscale程序分析GH5-1及GH6-3蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH5-1及GH6-3的跨膜区;SignalP程序预测GH5-1及GH6-3蛋白的信号肽,

- 1 -

黑龙江八一农垦大学

GOR超链接分析GH5-1及GH6-3的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。

利用SMART(http://smart.embl-heidelberg.de/)分析预测其结构域。

二、结果

2.1GH5-1及GH6-3基因序列的分析

BLASTx分析结果表明,GH5-1与多个物种的GH5基因同源,其中与endoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似度达58%(图1)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长2006bp,编码区为678?—1850bp,编码390个氨基酸,起始密码子ATG,终止密码子TAA(图2)。CCD分析发现有GH5-1保守域。

图1 GH5-1基因BLASTx同源性分析

图2 GH5-1基因开放阅读框分析

BLASTx分析结果表明,GH6-3与多个物种的GH6基因同源,其中与exoglucanase 3 [Neurospora crassa OR74A]的同源性最高,一致性达100%,相似性达65%(图3)。ORF Finder获得其开放阅读框编码氨基酸序列,该基因全长1914bp,编码区为22—1281bp,编码419个氨基酸,起始密码子ATG,终止密码子TAA(图4)。CCD分析发现有GH6-3保守域。

图3 GH6-3基因BLASTx同源性分析

- 2 -