Create Sample Correlation Matrix(样品相关性系数计算)

分析模块,输入FPKM矩阵,进行相关性系数分析。样品间基因表达水平相关性是检验试验可靠性和样本选择是否合理的重要指标。相关性系数越接近1,表明样品之间表达模式的相似度越高,样品间的差异基因也越少。样品间的相关性反应了样品间的相似度,即不同处理或组织的样品在表达水平方面的相似度。生物学重复间的样品的相关系数应大于生物学重复外的样品的相关系数。相关系数的计算方法有三种:A. Pearson correlation; B. Spearman rank correlation; C. Kendalls τ。

输入:

1FPKM矩阵(FPKM Matrix)。

示例:

        T4    T5    T6    T7    T8    T9

BM590_A0001         390.11      379.54      386.52      288.73      372.47      327.73

BM590_A0002         350.06      310.51      328.78      175.32      249.21      210.62

BM590_A0003         222.52      219.54      209.39      174.45      97.20        240.38

BM590_A0004         406.46      494.13      414.62      825.09      2678.41    555.67

BM590_A0005         605.70      755.09      643.55      1184.73    2980.14    568.58

BM590_A0006         306.72      311.16      351.08      282.26      204.19      310.56

……

2、样品分组信息表(可选)。

示例:

T4     group1

T5     group1

T6     group1

T7     group2

T8     group2

T9     group2

输出:

1、样本间相关系数热图。

示例:

注:如果提供分组文件,那么,同一组内的样品,在上方和左方,用同一种颜色标识。

2、样本间相关系数矩阵。

示例:

         T4    T5    T6    T7    T8    T9

T4     1       0.980267121061908        0.989702507965223        0.588861743971407        0.592989580812111         0.658682346369658

T5     0.980267121061908        1       0.98607374755974 0.587386501154351        0.595003551006885        0.676990163241074

T6     0.989702507965223        0.98607374755974 1       0.586922106842373        0.587649536735791        0.702699562941688

T7     0.588861743971407        0.587386501154351        0.586922106842373        1       0.953749773519016         0.676021042137711

T8     0.592989580812111        0.595003551006885        0.587649536735791        0.953749773519016        1         0.65034522903531

T9     0.658682346369658        0.676990163241074        0.702699562941688        0.676021042137711        0.65034522903531 1

分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,hclust函数进行样品间的聚类。