PAML操作 下载本文

内容发布更新时间 : 2025/1/6 15:23:57星期一 下面是文章的全部内容请认真阅读。

PAML软件的一些简单的具体的使用操作

1. 首先用Clustal X进行序列比对:要保证:保证核苷酸序列是三的倍数,没有终止密码子,核苷酸序列的第一位是密码子的第一位。假设序列名为cox1.fas

2. 使用DAMBE软件进行转换成PML格式。 打开要换换的文件,然后“file” “save and convert sequence format”,在保存类型中选择“Yang’s PAML”。那么此时的序列名为“cox1.PML”, 这样就可以得到文件“*.PML”,然后就直接把后缀改成“*.nuc”。那么此时的序列名为“cox1.nuc” 这样就完成了文件格式的转换。 3. 打开PAML软件的文件夹,找到文件名是“bin”的文件夹,打开之后,找到程序“codeml.exe”,把该程序复制到D盘的根目录下。(这一步并不是必要的,只是要把用到的几个程序放在同一个目录下) 4. 在你使用ClustalX进行序列比对的时候,会生成一棵进化树,适用treeview软件可以打开,你需要的是把文件的后缀名改称“*.trees”。即树的文件名是“cox1.trees”,这就完成了树的格式的转换。

5. 然后再PAML4的文件夹中找到一个后缀是“*.ctl”的文件,把文件名改成“cox1.ctl”,复制到和“codeml.exe”相同的地方。 6. 要对codeml.ctl文件中的各个选项的值进行修改,具体内容如下: seqfile = cox1.nuc 按你自己的文件名进行修改,就可以了, treefile = cox1.trees

outfile = mlc * main result file name ,

noisy = 9 * 0,1,2,3,9: how much rubbish on the screen , verbose = 0 * 0: concise; 1: detailed, 2: too much runmode = 0

seqtype = 1 * 1:codons; 2:AAs; 3:codons-->AAs

CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table clock = 0

aaDist = 0 * 0:equal, +:geometric; -:linear, 1-6:G1974,Miyata,c,p,v,a

aaRatefile = wag.dat * only used for aa seqs with model=empirical(_F) *

dayhoff.dat,jones.dat,wag.dat,am.dat, or your own

model = 0,这是使用的最简单的模型, * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branches * models for AAs or codon-translated AAs:

* 0:poisson, 1:proportional, 2:Empirical, 3:Empirical+F 28 * 6:FromCodon, 7:AAClasses, 8:REVaa_0,9:REVaa(nr=189)

NSsites = 0 3 1 2 7 8 ,依次选取了6个模型。也可以选其中的两个,但必须是0和3,1和2,7和8。相互配对

icode = 4 * 0:universal code; 1:mammalian mt; 2-10:see below如果是核基因的话就选0。

fix_kappa = 0 kappa = 5 fix_omega = 0 omega = 0.2 getSE = 0 RateAncestor = 0 Small_Diff = .5e-6

cleandata = 1 * remove sites with ambiguity data (1:yes, 0:no)?

method = 0 * 0: simultaneous; 1: one branch at a time 最后保证在同一个文件夹内同时具有:三个文件

“codeml.exe”,“cox1.nuc”“cox1.trees”,这时候你双击 codeml.exe,就可以运行程序。

如果不能正确运行的话,你可以通过运行cmd,在dos情况下,运行codeml.exe,这样会有错误提示,知道你错在哪里了。 常见命令解释:

1. Baseml.ctl的命令说明:

noisy用来控制输出结果的多少,如果模型适用的运算比较多的话,noisy的值可以选择的比较大,verbose可以控制结果文件中结果的多少。

runmode = 0 表明在树的结构文件中估算树的拓扑结构。这个选项是我们通常情况下选择的,基本上可以满足我们的需要。