Plot hcluster tree(层次聚类树)

利用树枝结构描述和比较多个样本间的相似性和差异关系。首先使用描述群落组成关系和结构的算法计算样本间的距离,即根据beta多样性距离矩阵进行层次聚类(Hierarchical cluatering)分析[1],使用非加权组平均法UPGMA(Unweighted pair group method with arithmetic mean)算法构建树状结构,得到树状关系形式用于可视化分析。


输入:


样本距离矩阵文件,由分析模块 "Generate distance matrix from OTU Table in biom format" 生成。

        Bio1 Bio2 Bio3 Bio4 Bio5

Bio1 0       0.1984      0.238883 0.222763 0.259351

Bio2 0.1984      0       0.127324 0.153768 0.160351

Bio3 0.238883 0.127324 0       0.194398 0.147496

Bio4 0.222763 0.153768 0.194398 0       0.20812

Bio5 0.259351 0.160351 0.147496 0.20812    0


其他参数默认。


输出:


newick-formatted树文件,newick是一种树状的标准格式文件,可被多种建树软件识别,例如:PHYLIP、TREEVIEW、ARB。

注:如需对样本进行分组画图,可将该文件作为高级分析中模块"Plot Tree using Newick tree format file"的输入,支持多种树状图展示方式。


样本相似度树状图:

注:多样本相似度树状图,利用树枝结构描述和比较多个样本间的相似性和差异关系。树枝长度代表样本间的距离,末端竖线表示样本聚在一起相似度较高。



分析模块引用R语言(v2.12.1)进行相关的作图。


相关文献如下所示:

Xiao-Tao Jiang ,Xin Peng, et al.Illumina Sequencing of 16S rRNA Tag Revealed Spatial Variations of Bacterial Communities in a Mangrove Wetland. Microb Ecol (2013) 66:96–104.DOI 10.1007/s00248-013-0238-8.