Make Distance Boxplots(组间距离关系盒形图)

分析模块,输入样品间距离矩阵和样品分组信息表,比较不同样品分组的组内和组间的距离分布差异,进行Boxplot作图,同时采用two-sample t-tests判断样本组间的显著性差异。

箱式图的作用:识别数据异常值;粗略估计和判断数据特征;比较几批数据的形状,同一数轴上,几批数据的箱形图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息一目了然。

箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。简单箱线图由五部分组成,分别是最小值、中位数、最大值和两个四分位数。

输入:

1、样品间的距离矩阵。

示例:

         T4    T5    T6    T7    T8    T9

T4     0       13.309806490621    12.8328319481701 44.2547040240155 103.615826419947 34.7080813217134

T5     13.309806490621    0       14.2688425759815 43.6970358825701 101.844088884956 35.9702984636113

T6     12.8328319481701 14.2688425759815 0       42.8295191815047 104.165822252793 31.1348591290974

T7     44.2547040240155 43.6970358825701 42.8295191815047 0       82.0937169482593 33.0949750872802

T8     103.615826419947 101.844088884956 104.165822252793 82.0937169482593 0       102.176434778739

T9     34.7080813217134 35.9702984636113 31.1348591290974 33.0949750872802 102.176434778739 0

2、样品分组信息表。

示例:

T4     group1

T5     group1

T6     group1

T7     group2

T8     group2

T9     group2

输出:

样本距离箱线分析图:

示例:

注:第一四分位数 (Q1),又称“下四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。

第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。

第三四分位数 (Q3),又称“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。