Arlequin操作说明 下载本文

内容发布更新时间 : 2024/4/28 17:37:37星期一 下面是文章的全部内容请认真阅读。

Fig

“Number of permutations”:产生的随机序列突变的样本的数目。这个数目可以大于几千。16000可以保证会有少于1%的不同。P值标准误的估算可以通过程序批处理的手段实现。

“Number of initial conditions”:设置EM程序开始重复估算样本似然值的随机初始状态的数目。 此界面其它选项同上述操作。

选择主操作界面左上方树形结构中的“Linkage disequilibrium”的“Hardy-weinberg”选项,操作主界面变为如下图所示:

Fig

“Hardy-weinberg equilibrium”:检测一个随机配子单位产生的倍数基因型的理论。这个检测仅适用于基因型数据。每个基因座分别检验。

“Number of steps in Markov chain”:搜索的最大次数,100000或更大的数值是允许的。 “Number of dememorization steps”:在开始比较观测到的可选择的数据同观测到的数据的可能性之前,进行运算的次数。几千次的运算对于达到一个随机的起始点是必须的。

选择主操作界面左上方树形结构中的“Neutrality test”的“Infinite-allele models”选项,操作主界面变为如下图所示:

Fig

“Ewens-Watterson neutrality test”:此理论基于一个处于平衡状态的人群的Ewens样本抽样理论。此检测通常限定基因的数目小于2000,等位基因的数目小于1000。

“Number of random samples”:产生的随机样本的数目,一般把数值取在几千或更大。 “Chakraborty`s test of population amalgamation”:检验人群中性选择、同质性、连锁平衡的一种方法。当样本的异质性被怀疑时可采用此方法,它利用观测到的纯质性(纯合基因)来估算人群的突变参数θHom。对于此参数的估计值可以用来计算观测到的k等位基因的可能性,和从一个稳定群体抽出中性样本的可能性。这种方法对人群的融合和异质性不敏感。

选择主操作界面左上方树形结构中的“Neutrality test”的“Infinite-site models”选项,操作主界面变为如下图所示:

Fig

Tajima`s test of selective neutrality:通过比较人群参数θ两个估计值的大小而得,一个估计值是基于样本中分离位点的数目,另一个估计值是基于不同单倍型之间平均配对差异的平均值。在无限位点模型中,如果是中性突变,则这两个参数应该相等。自然选择、人群的不稳定、位点之间突变速率的不同都会导致这两个值的差异。低的Tajima’s D值(有时是负值)和配对差异的钟型分布,可以作为一个古代群体扩张的证明。

Fu`s Fs test of selective neutrality :基于一个给定数目的样本中所观察到的k值或更多等位基因的可能性,它以观测到的配对差异的平均数为条件。这个检验对有人群扩张所造成的群体不平衡比较敏感。

选择主操作界面左上方树形结构中的“Genetic stucture”的“AMOVA/MSN”选项,操作主界面变为如下图所示:

Fig

“AMOVA/MSN”:分子差异性分析及最小支撑树的构建。

AMOVA(analysis of molecular variance)是指对分子差异性的分析。它通过对所研究群体进行不同层次的归类和划分,可界定不同的遗传结构并进行统计学检验,从而估计出群体间、群体内以及个体间不同层次所表现的差异占总变异的多少。这种方法可以讨论不同海拔高度、不同语系、以及地理群体间是否存在相应的遗传变异。

“Locus by locus AMOVA”:每个基因座单独进行分子差异性的分析。 “Include in individual level for genotypic data”:包括个体之间基因分歧度协方差组成和相关的固定指数。因此,它计算观测到的基因间的差异。这是检测Hardy-Weinberg平衡失调的另一种途径。选择这个选型仅对配子片断已知的基因型数据有效。

“Number of permutations”:用来检测协方差组成和固定指数的置换数的值。如果数值为0,则不会有任何检测结果。一个较为正确的结果至少要进行几千次检验。

“Compute minimum spanning network among haplotypes”:利用分子差异计算并绘制单倍型之间的系统树。

“Euclidian square distances”的选择:1)“Use project distance matrix”,利用数据文件中的距离矩阵,如果可能的话。2)“Compute distance matrix”,根据选定的距离模型计算距离矩阵,在数据文件中事先被定义的距离矩阵将会被忽略。单倍型数据和基因型数据都可以产生这样的矩阵。3)“Use conventional F-statistics”,如果激活了这个选项,我们将利用一个下三角矩阵(对角线处是0)来作为非下三角矩阵元素。这意味着所有不确定单倍型之间的距离将会被认作是确定的,这意味着此项将会影响等位基因频率的遗传结构。4)“Distance between haplotype”:选择一种距离模型去计算单倍型之间的遗传距离。不同类型的数据要用不同的Euclidean 距离模型去计算分析。

“Gamma α value”:当选择允许不同位点之间有不等进化速率时,设置gamma功能的图形参数α的值。