MEGA计算序列间遗传距离 下载本文

内容发布更新时间 : 2024/11/14 14:34:55星期一 下面是文章的全部内容请认真阅读。

contain unambiguous nucleotides or amino acids.

* 工具栏其它快捷图标的含义及对应的菜单命令如下:

对应于“Data→Export data”菜单命令,可将序列比对结果以“*.meg”格式文件输出保存。点击该图标后会弹出“Text File Editor and Format Convertor”窗口,点击“Save a file(Ctrl+S)”图标

即可将文件保存到指定的位置,文件名可自己拟定。

与上面的图标功能相同。

对应于“Statistics→Desplay Results in Excel(XL)”菜单命令。

对应于“Statistics→Desplay Results in Comma-delimited(CSV)”菜单命令。 对应于“Data→Set up/Select Taxa & Groups”菜单命令,点击该图标后会弹出“Select/Edit Taxa Groups”窗口,在该窗口中可对需要分析的分类单元进行分组或选择已划分的全部或部分组进行分析。

对应于“Data→Set up/Select Genes & Domains”菜单命令。

对应于“Display→Use Identical Symbol”菜单命令;该图标凸显时导入的序列全部以碱基符号显示;

* 点击该图标使其凹显(

)时,导入的序列将会以第一条序列为参照,凡是与第一条

序列相同的碱基则以一致性符号“.”显示,不相同的碱基以碱基符号显示;输出时可根据需要选择显示形式。

对应于“Data→Translate/Untranslate T”菜单命令,突出显示,表示序列正在以核苷酸的形式显示(如下图),点击该图标后可将核苷酸序列翻译成蛋白质序列显示出来,图标变为凹陷显示

对应于“Data→Translate/Untranslate T”菜单命令,凹陷显示,表示序列正在以氨基酸的形式显示,点击该图标后可将蛋白质序列恢复成核苷酸序列显示出来,图标变为凸出显示形式

对应于“Display→Find Sequence (Ctrl+F)”菜单命令,可以查找序列。

3. 计算DNA序列碱基组成

在“View Sequence Data”窗口(即数据处理窗口)中点击“Satistics→Desplay Results in Text Editor”,将统计结果设置为在“Text File Editor and Format Convertor”窗口中显示(也可以根据需要将统计结果设置为以“Excel”形式或“Comma-delimited format”形式显示);

点击“Satistics→Nucleotide Composition”,软件将会在内置文本编辑器(built-in text editor)“Text File Editor and Format Convertor”窗口中显示碱基组成分析结果,保存文件备用(分析结果包括碱基总数,每种碱基的百分比,各碱基在密码子第1位、第2位、第3位的使用频率)。

* “Text Editor and Format Convertor”窗口最小化隐藏后可点击MEGA主窗口中的“Text Editor and Format Convertor”图标

和随之显示在主窗口左下角的该窗口的最小化图标

来恢复,也可点击主窗口中的“File→Text Editor…… F3”

菜单命令,然后点击显示在主窗口左下角的该窗口的最小化图标来恢复。

4. 计算密码子使用情况:

点击“Satistics→Codon Usage”,软件将会在“Text File Editor and Format Convertor”窗口中显示密码子使用分析结果,保存文件备用(分析结果包括碱基总数,每种碱基的百分比,各碱基在密码子第1位、第2位、第3位的使用频率)。

* 计算“密码子使用”情况时,必须先指定密码子在序列中的起点(第一位、第二位、第三位或其它位置),具体操作见“序列遗传距离的计算”中的“2. 指定序列数据的起始及终止位点”。

5. 计算碱基对频率(Nucleotide Pair Frequencies)

点击“Satistics→Nucleotide Pair Frequency→Directional(16 Pairs)或Undirectional(10 Pairs)”,统计结果将显示在“Text Editor and Format Convertor”窗口中,保存备用即可。

* 用此菜单命令计算获得的转换/颠换比值(R)将作为后面利用PAUP软件进行系统发育分析时确定是否对数据进行加权的参考依据。

* Directional (16 Pairs)是指定向的替换;Undirectional(10 Pairs)是指不定向的替换。

6. 碱基替换模式检验

用此数据处理窗口中的“Statistical→Nucleotide Pair Frequency→……”菜单命令计算的“转换/颠换值”是转换/颠换位点的数量比值,而用主窗口中的“Pattern→……”菜单命令可以计算有关碱基替换模型的一些其它统计数值(statistical quantities)

(1)序列间替换模式的同质性检验(Test of the homogeneity of Substitution Patterns between Sequences.)

点击“Pattern→Test Substitution Pattern Homogeneity……”菜单命令,在弹出来的分析选择(Analysis Preferences)窗口中设置相关选项:“Gap/Missing”选项一般选“Pairwise Deletion”,“Codon Positions”可根据需要选择密码子第一位、第二位、第三位或任意两位的组合或全选;设置完成后点击窗口右下角的“Compute”按钮,计算结果将会在一个新窗口中显示保存结果备用。

该菜单命令计算所得的数值(statistical quantities)表示:根据序列间碱基组成偏倚差异程度推断时拒绝零假说(null hypothesis,即序列以相同的替换模式进化)的概率。用Monte Carlo test (1000 replicates)估算P-值,P-值显示在表格的左下方(below the diagonal);P-值小于0.05使被认为显著(用黄色标记)。每对序列对的平均位点差异系数显示在表格的右上方(above the diagonal)[The probability of rejecting the null hypothesis that sequences have evolved with the same pattern of substitution, as judged from the extent of differences in base composition biases between sequences (Disparity Index test, [1]). A Monte Carlo test (1000 replicates) was used to estimate the P-values [1], which are shown below the diagonal. P-values smaller than 0.05 are considered significant (marked with yellow highlights) The estimates of the disparity index per site are shown for each sequence pair above the diagonal. ]

(2)序列间碱基组成偏倚差异估算(Estimates of Base Composition Bias Difference between Sequences)

点击“Pattern→Compute Composition Distance……”菜单命令,其它操作与“序列间替换模式的同质性检验”相同。

(3)序列间碱基组成净差估算(Estimates of Net Base Composition Bias Disparity between Sequences)

点击“Pattern→Compute Pattern Disparity Index……”菜单命令,其它操作与“序列间替换模式的同质性检验”相同。

(4)核苷酸替换模式的最大复合似然法估算(Maximum Composite Likelihood Estimate of the Pattern of Nucleotide Substitution)

点击“Pattern→Compute Substitution Pattern (4×4)……”或“Pattern→Compute Transition/Transversion Bias (R)……”菜单命令,其它操作与“序列间替换模式的同质性检验”相同。

* 用此菜单命令计算所得的“总体转换/颠换偏倚”(The overall transition/transversion bias)值R是根据转换/颠换速率(The transition/transversion rate tatios)计算出来的,与根据“碱基对频率”计算中的“转换/颠换”位点数计算出来的R值不同。