phylip构建进化树详细操作过程 下载本文

内容发布更新时间 : 2024/5/3 3:43:01星期一 下面是文章的全部内容请认真阅读。

一、获取序列

将要比对的序列放到一个fasta文件中,文件内容类似如下: >gi|213627058|gb|热带爪蟾BC170657.1| Xenopus tropicalis ABO blood group (transferase A, alpha 1-3-N-acetylgalactosaminyltransferase; transferase B, alpha 1-3-galactosyltransferase), mRNA (cDNA clone MGC:197384 IMAGE:9039915), complete cds

MVAFFCSLSWYAVKDRKWDPSIQHSCEEYWFRINGQKENRLQRMLYPKPETLKPPRTDVLTVSPWLAPIVWEGSFNTEILNNQFRQKGWRVGLTTFAIKKYIRFLKPFIETAEKFFMVGLPVNYYVFTDQASNVTDLNIIVGTGRQIIILEVPSYERWQDVTMRRMQMISDVCQQRFASEVDYLVCVDVDMRFQDHVGVEILSDVFGTLHPAFFVKGRDKFTYERRPESQAYIPEDEGDFYYAGGYFGGKVEEVYKLTNHCHHAMLTDKANNIEAIWHDESYLNSYFLYNKKPTKILSPEYLWNEMDGTAFYLRKIRFIALQKNMAEVRT >gi|homo

MAEVLRTLAGKPKCHALRPMILFLIMLVLVLFGYGVLSPRSLMPGSLERGFCMAVREPDHLQRVSLPRMVYPQPKVLTPCRKDVLVVTPWLAPIVWEGTFNIDILNEQFRLQNTTIGLTVFAIKKYVAFLKLFLETAEKHFMVGHRVHYYVFTDQPAAVPRVTLGTGRQLSVLEVRAYKRWQDVSMRRMEMISDFCERRFLSEVDYLVCVDVDMEFRDHVGVEILTPLFGTLHPGFYGSSREAFTYERRPQSQAYIPKDEGDFYYLGGFFGGSVQEVQRLTRACHQAMMVDQANGIEAVWHDESHLNKYLLRHKPTKVLSPEYLWDQQLLGWPAVLRKLRFTAVPKNHQAVRNP

注意PHYLIP在DOS下运行,文件名不能超过10位,超过的会自动截留前面10位。

二、多序列比对

目前一般应用CLASTAL X进行,打开ClustalX 2.1,load sequence——save as (phylip)——Do complete alignment——获得*.Phy和*.dnd两个文件,生成的指导树文件(DND文件)可以直接用TREEVIEW打开编辑,形式上和最终生成的进化树类似,但是注意不是真正的进化树。 三、构建进化树

把文件拷贝到PHYLIP的exe文件夹目录下 1.N-J法建树

依次应用PHYLIP软件中的SEQBOOT.EXE、DNADIST.EXE、NEIGHBOR.EXE和CONSENSE.EXE打开。具体步骤如下: (1)打开seqboot.exe

输入文件名:输入你用CLASTALX生成的PHY文件(*.phy); 按 R; 输入1000;

Random number seed(must be odd): 本人一般设为5; 按Y;

得到outfile(在phylip的exe文件夹内),outfile改名为2; (2)打开Dnadist.EXE(若为蛋白序列,打开PROTDIST) 输入2; 按M; 再按D; 输入1000; 按Y;

得到outfile(在phylip的exe文件夹内),改名为3;

(3)打开Neighboor.EXE 输入3; 按M;

输入1000; 按Y;

得到outfile和outtree(在phylip的exe文件夹内),改outtree为4,outfile改为402;

(4)打开consense.exe 输入402 按Y;

得到outfile和outtree(在phylip的exe文件夹内)。

2、建MP或者ML树,将上述步骤中的Dnadist改为Dnapars或者Dnaml,运行后直接得到outfile和outtree,分别改名为4和402后,用consense.exe运行402即得最后结果。

四、进化树编辑和阅读

Outtree可直接用treeview、PHYLODRAW、NJPLOT等软件打开编辑。TREEVIEW可以显示BOOTSTRAN值,序列较多(60条以上)的时候打开直接显示有明显的重叠,可以在打印预览中显示,或输出为EMF WMF图片文件看,但是序列较多时BOOTSTRAN值的显示位置比较乱,和序列名称有重叠。

PHYLODRAW的编辑功能较强,可以自由调节X、Y轴的长度。输出格式为BMP、PS格式。缺点是不能直接显示BOOTSTRAN值,包括打开TREEVIEW输出的NEX文件,而且输出的BMP文件不全,类似截屏文件,我用PHOTOSHOP进行拼接合成,添加BOOTSTRAN值和注解符号等。据说也可以将PS文件用记事本打开,改变其中的字号,然后通过ADOBE DISTRILLOR将PS转化为PDF,就可以解决问题。如果发现还有重叠,可以再次改变PS文件中的字号大小,直到合适为止。

NJPLOT可以显示BOOTSTRAN值和分值长度。但是不能调节图片X、Y轴的长度。