Plot heatmap with tree(热图)

分析模块,输入差异基因FPKM矩阵,绘制热图,并对样品和基因进行聚类,输出可视化作图结果。Heatmap可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。

分析模块默认对fpkm进行log2fpkm+1)变换;基因和样本间距离公式均为欧式距离;采用的聚类方法均为hclustercomplete算法)。

输入:

1、差异基因FPKM矩阵(过滤FPKM矩阵中,非差异表达基因对应的行)。

示例:

        T4    T5    T6    T7    T8    T9

BM590_A0004         406.46      494.13      414.62      825.09      2678.41    555.67

BM590_A0005         605.70      755.09      643.55      1184.73    2980.14    568.58

BM590_A0015         382.41      435.68      435.09      667.24      1664.78    511.53

BM590_A0021         305.80      347.07      323.75      151.16      57.04        252.18

BM590_A0025         82.60        71.30        83.22        95.78        311.02      96.31

BM590_A0028         389.64      441.62      387.26      1020.02    5531.28    345.31

BM590_A0046         295.72      291.23      379.24      308.84      92.26        517.02

……

2、样品分组信息表(可选)。

示例:

T4    group1

T5    group1

T6    group1

T7    group2

T8    group2

T9    group2

输出:

1、绘制热图的数据(经过变换后,最终用于作图和计算的数据)。如果不进行变换,则与输入的FPKM矩阵一致。

示例:

        T4    T5    T6    T7    T8    T9

BM590_A0004         8.67051462793045 8.9516635548292    8.6991212694417    9.69015515723112 11.3876996421428         9.12067852550685

BM590_A0005         9.24483950114555 9.56241416340833 9.33214846760773 10.2115598189921 11.541648413283         9.15375467876268

BM590_A0015         8.5827441552687    8.7704326467881    8.7684820980667    9.38422253293016 10.7019821608354         9.0014926423626

BM590_A0021         8.26115467261557 8.44323366394447 8.34318571544788 7.24944534108584 5.85897561429202         7.98401963308582

BM590_A0025         6.38543103719352 6.17592374206376 6.39609097039437 6.59663703410207 8.2854946963496         6.60451616514653

BM590_A0028         8.60969587286274 8.78992483126367 8.60087927282804 9.99579541103276 12.4336584607436         8.43592023697522

BM590_A0046         8.21295836272829 8.19096048095368 8.57076649652761 8.27537959625362 6.54318652456517         9.01686398912248

2、样本和基因聚类结果热图。

示例:

注:图中每列表示一个样本,每行表示一个基因,图中的颜色表示基因在该组样本中表达量的大小。具体表达量大小变化趋势请见左上方的Color Key

左侧为基因聚类的树状图,右侧为基因的名称,两个基因分支离的越近,说明它们在所有样品中的表达趋势越接近。

上方为样本聚类的树状图,下方为样本的名称,两个样本分支离的越近,说明它们所有基因的表达模式越接近。

如果提供分组文件,那么,同一组内的样品,在上方用同一种颜色标识。

分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,dist函数进行距离计算,hclust函数进行样品和基因间的聚类。