Get Unifrac Distance Matrix(获得Unifrac距离矩阵)

UniFrac分析利用各样本序列间的进化信息来比较环境样本在特定的进化谱系中是否有显著的微生物群落差异。UniFrac可用于beta多样性的评估分析,即对样本两两之间进行比较分析,得到样本间的unifrac距离矩阵。其计算方法为:首先利用来自不同环境样本的OTU代表序列构建一个进化树,Unifrac度量标准根据构建的进化树枝的长度计量两个不同环境样本之间的差异,差异通过0-1距离值表示,进化树上最早分化的树枝之间的距离为1,即差异最大,来自相同环境的样本在进化树中会较大几率集中在相同的节点下,即它们之间的树枝长度较短,相似性高。如果两个环境较相似,则会共享不同的进化树枝,当所有树枝都被共享时,unifrac距离即为0。因为重复的序列不会影响进化树的树枝长度,所以unweighted unifrac度量方法没有计入不同环境样本的序列相对丰度,由于不同菌落的相对丰度可以更严格的描述群落的变化,使用weighted unifrac算法在计算树枝长度时将序列的丰度信息进行加权计算,因此unweighted unifrac可以检测样本间变化的存在,而weighted unifrac可以更进一步定量的检测样本间不同谱系上发生的变异。


输入:

biom格式的OUT Table文本文件。

newick-formatted树文件,可由分析模块 "Construt phylogenetic tree by OTU represent seqs" 生成。


输出:

unweighted unifrac distance matrix

weighted unifrac distance matrix


示例:(un)weighted unifrac distance matrix

         S1              S2              S3               S4              S5

S1     0                0.1984        0.238883    0.222763    0.259351

S2     0.1984       0                 0.127324    0.153768    0.160351

S3     0.238883   0.127324    0                 0.194398    0.147496

S4     0.222763   0.153768    0.194398    0                 0.20812

S5     0.259351   0.160351    0.147496    0.20812      0

注:第一行和第一列均为样本。


分析模块引用了Qiime(v1.9.0)中的beta_diversity.py脚本。


相关文献如下所示:

Tanya Yatsunenko, Federico, et al. Human gut microbiome viewed across age and geography. Nature 486, 222–227 (14 June 2012) doi:10.1038.nature11053.

Micah Hamady, Catherine Lozupone and Rob Knight. Fast UniFrac: facilitating high-throughput phylogenetic analyses of microbial communities including analysis of pyrosequencing and PhyloChip data. The ISME Journal (2010) 4, 17–27; doi:10.1038/ismej.2009.97.

QIIME allows analysis of high-throughput community sequencing data J Gregory Caporaso, Justin Kuczynski, Jesse Stombaugh, Kyle Bittinger, Frederic D Bushman, Elizabeth K Costello, Noah Fierer, Antonio Gonzalez Pena, Julia K Goodrich, Jeffrey I Gordon, Gavin A Huttley, Scott T Kelley, Dan Knights, Jeremy E Koenig, Ruth E Ley, Catherine A Lozupone, Daniel McDonald, Brian D Muegge, Meg Pirrung, Jens Reeder, Joel R Sevinsky, Peter J Turnbaugh, William A Walters, Jeremy Widmann, Tanya Yatsunenko, Jesse Zaneveld and Rob Knight; Nature Methods, 2010; doi:10.1038/nmeth.f.303