内容发布更新时间 : 2024/12/27 19:10:53星期一 下面是文章的全部内容请认真阅读。
Ntsys2.1 软件使用详细说明 一. 数据处理方法 1.1:excel5/95 格式数据 1)首先得到 0/1 数据,输入 excel 中,格式如图所示: 其中 1 表示数据格式为 rectangular data matrix,12 表示数据共 12 行(本例中表示 12 个 个体) ,30 表示数据共 30 列(本例中表示 30 个位点) ,0 表示无缺失数据(若有缺失,则用 1 表示,缺失值可用-999 或其它数字代替) 。
2)格式及数据输入正确后,点击另存为 excel5/95 格式,命名为 aflp01.xls。 3) 采用 NTedit 数据编辑器打开所保存的文件 file>open file in a grid, 在文件类型中选择 excel 格式,找到要分析的文件并打开,查看是否有错误,或需要修改的地方,没有问题后, 保存为.nts 格式。 1.2:txt 格式数据 1)另一种数据处理方法,首先在 excel 中得到数据,如下图(注意:第一行与第一种 方法不同,1 表示数据格式为 rectangular data matrix;12B 表示共 12 行(本例中表示 12 个 个体,行标签位于数据主体的开始,B 表示 Beginning of each row) ,30L 表示共 30 列(本 例中表示 30 个位点,L:label 表示列标签) ,0 表示无缺失) 。
或者如下图格式(其中第一行为 1 12L 30L 0,解释略;第二行为每行的行标签;第三 行为每列的列标签;第四行起为数据主体。 ) :
2)格式及数据都处理好之后,点文件另存为,保存为文本文件.txt 格式。 3)得到 txt 格式文件后,即可直接用 ntsys 进行分析(只要格式正确,ntsys 可以对 txt
文件进行分析,而不用再转换或保存成.nts 格式) 。 1.3:直接采用 NTedit 进行数据的输入和保存 1)对于数据量不大的数据,可以直接采用 NTedit 进行数据的输入,如图所示:
2)数据输入好后,点击 file>save file 将数据保存.nts 格式。 二. 计算遗传距离矩阵或相似性矩阵(distance matrix or similarity matrix) 对于 0/1 数据和定性数据:打开 ntsys 软件,在 similarity 模块中选择 simqual,input file 中输入要分析的文件名称, 如 aflp01.nts, 计算方法中矩阵系数 coefficient 选择 dice, output file 命名输出文件名称如 aflp01-dice。之后点 compute,得到相似性矩阵。 x 表选中) 注:1.本例中由于个体是按行排列的,所以要在 By rows?进行勾选(□ 。如果 个体是按列进行排列的,则不勾选。 2.系数可根据要求选择不同的系数,如 DICE,J,SM,PHI 等。 3. DICE,J 只能得到相似性矩阵,可以采用 1-dice 系数,或者 1-J 系数得到距离矩阵。 4.simqual 只针对定性数据或二元数据 (0/1) , 对于其它数据如 DNA 数据则采用 simgend 进行遗传距离计算,对于定量数据或间隔数据则采用 simint 计算距离矩阵。
三. 聚类分析(clustering) 3.1 SAHN 进行 upgma 聚类分析 1) 在得到相似性矩阵或距离矩阵文件之后,采用 clustering 模块中的 SAHN,input file 选 择 相 似 性 矩 阵 文 件 , 如 aflp01-dice.nts , output file 命 名 输 出 文 件 的 名 称 , 如 aflp01-dice-upgma.nts, 聚类方法中选择 upgma, in case of ties 选择 find 或者 warn, 点击 compute 得到结果,在程序左下角可以看到 图标,点击即可得到聚类结果。
2)Upgma 聚类结果如图所示,在该图中可点击 options 菜单对聚类图的文字格式和线 条样式等进行修改,以得到满意的图片。 3)Cophenetic 相关性检验 Upgma 聚类分析之后,为了检验聚类结果的好坏,一般要进行 cophenetic correlation 分 析,操作如下:在 clustering 模块中选择 Coph,如下图,input tree 中输入聚类分析得到的结 果文件,如 aflp01-dice-upgma.nts,在输出文件中命名 aflp01-coph.nts,点击 compute,得到 cophenetic 值文件。计算完成后在 graphics 模块中选择 MxComp,在 input file 1(x)中选择 相似性矩阵文件,如 aflp01-dice.nts,在 input file 2(y)中选择 coph 计算得到的文件,如 aflp01-coph.nts,number of permutation 可选择 1000 次,或不选。点击 compute。
计算结束后得到分析结果, 会出现矩阵比较图 matrix comparison 和 correlation test 结果, 如下面的两个图所示(相关性系数为 r=0.842,说明聚类结果较好) 。 4)upgma 聚类分析 batch 上述的分析步骤可以采用 batch 进行批处理分析,命令如下(将下面的命令保存到文本 文件,再保存成*.ntb 格式) : \the distance matrix *sahn o=dice.nts r=tree.nts cm=upgma \*coph o=tree.nts r=coph.nts \聚类分析-Njoin 1)得到距离矩阵:Simqual 只能得到各种相似性矩阵,如 DICE 或 J 相似性矩阵,但 进行 NJ 聚类分析是,需要距离矩阵数据,可以采用 1-相似性矩阵的方法得到距离矩阵(采
用 excel 进行,但比较麻烦,还没有找到快捷的方法。transf 命令中好像没有 1-矩阵的操作, 只有矩阵 -1 的操作,好像也没有负值变成正值的操作) 。当然也可以采样其它的命令如 simgend 或 simint 得到 DIST、欧式或其它距离矩阵之后进行 NJ 分析;或者采用其它的分析 软件如 Genalex 软件得到距离矩阵用于 ntsys 分析。 2)打开 ntsys 的 clustering 模块,选择 Njoin 命令,input file 中输入距离矩阵文件,命 名保存的 tree 和 graph 文件,in case of ties 中选择 find,maximum no. tied trees 中的数字不 能小于 OTUs 的个数。点击 compute,即得到 nj 聚类树。
四. PCoA 分析或 PCA 分析 4.1 PCoA 分析 1)在得到相似性或距离矩阵之后,在 output&transf 模块中选择 Dcenter 命令,input 和 output 中分别输入要分析的数据和结果文件的名称。点击 compute 进行分析,将数据进行 Dcenter 转换。之后在 ordination 模块中选择 eigen,选择要分析的文件,如 dcent.nts,numer ofdimensions 中选择 3 或者 2(分别得到三维或二维图形, ) ,命名 eigenvactor 和 eigenvalue 文件名称,点击 compute,得到分析结果。分析完成后界面上会出现 图标,点击进去可 查看二维和三维图形,并可进行修改保存等操作。
2)在得到 eigenvactor 文件后,可采用 graphics 模块下的 mod3d 命令,显示 pcoa 分析 图,input file 中选择保存的 eigenvactor 文件,plot by rows 不选,进行分析,如下图所示。
3)进行 mod3d 分析时可以在 plot symbol input file 中可输入样本分组文件,如下图所示 (其中 1 1 20L 0 表示数据类型为 1;共 1 行,20 列数据;0 表无缺失,数据主体为 1 1 1 1 1 1 1 2 2 2 2 2 2 等,表示哪个个体定义的分组为 1,那个为分组 2 等等) 。
在定义分组进行分析后,得到的二维或三维 plot 图中,可以在 plot option 中对各个分组 显示采用的图标以及字体大小等参数进行修改,如图所示。当然 plot symbol input file 也可 以不输入,即全部个体为同一分组。 注:上述分析采用的是 0/1 或者定性数据,在采用数量或连续数据进行分析时,要先采 用 output&transf 模块中的 stand 命令对数据进行标准化处理,然后在采用 simint 命令分析得 到相似或不相似矩阵,然后采样 Dcenter 命令对数据进行中心化处理,之后在采用 eigen 命 令进行分析。
4)PCoA 分析 batch 命令
五. 相关性分析(mantel test) 1)Mantel test 可对两个矩阵的相关关系进行检验,这是由于对于某一特点的研究对象, 可能有不同角度的特征描述, 如根据表型数据得到表型距离矩阵, 根据分子数据得到遗传距 离矩阵,或者根据样本间地理位置得到地理距离矩阵,得到这些矩阵数据之后,我们可能会 想了解不同描述间有没有相关关系(如遗传距离与地理距离之间相关性) ,这时即可进行矩 阵的相关性分析。 2)具体操作如下:首先根据其它的软件如 AFLPdat 或 Genalex 等软件根据地理位置计 算地理距离矩阵(例如 X) ,打开 ntsys 软件,根据 simint 命令计算遗传距离矩阵(如 Y) , 之后在 graphics 模块下选择 MxComp,input file 中选择要比较的距离矩阵文件,进行分析。
分析结果如下图所示:
3)mantel test 分析 batch 命令: \Compare mdist with gdist, 1000 random permutations *mxcomp x=mdist.nts y=gdist.nts np=1000