分析模块,输入差异基因FPKM矩阵,绘制热图,并对样品和基因进行聚类,输出可视化作图结果。Heatmap可以用颜色变化来反映二维矩阵或表格中的数据信息,它可以直观地将数据值的大小以定义的颜色深浅表示出来。 分析模块默认对fpkm进行log2(fpkm+1)变换;基因和样本间距离公式均为欧式距离;采用的聚类方法均为hcluster(complete算法)。 输入: 1、差异基因FPKM矩阵(过滤FPKM矩阵中,非差异表达基因对应的行)。 示例: T4 T5 T6 T7 T8 T9 BM590_A0004 406.46 494.13 414.62 825.09 2678.41 555.67 BM590_A0005 605.70 755.09 643.55 1184.73 2980.14 568.58 BM590_A0015 382.41 435.68 435.09 667.24 1664.78 511.53 BM590_A0021 305.80 347.07 323.75 151.16 57.04 252.18 BM590_A0025 82.60 71.30 83.22 95.78 311.02 96.31 BM590_A0028 389.64 441.62 387.26 1020.02 5531.28 345.31 BM590_A0046 295.72 291.23 379.24 308.84 92.26 517.02 …… 2、样品分组信息表(可选)。 示例: T4 group1 T5 group1 T6 group1 T7 group2 T8 group2 T9 group2 输出: 1、绘制热图的数据(经过变换后,最终用于作图和计算的数据)。如果不进行变换,则与输入的FPKM矩阵一致。 示例: T4 T5 T6 T7 T8 T9 BM590_A0004 8.67051462793045 8.9516635548292 8.6991212694417 9.69015515723112 11.3876996421428 9.12067852550685 BM590_A0005 9.24483950114555 9.56241416340833 9.33214846760773 10.2115598189921 11.541648413283 9.15375467876268 BM590_A0015 8.5827441552687 8.7704326467881 8.7684820980667 9.38422253293016 10.7019821608354 9.0014926423626 BM590_A0021 8.26115467261557 8.44323366394447 8.34318571544788 7.24944534108584 5.85897561429202 7.98401963308582 BM590_A0025 6.38543103719352 6.17592374206376 6.39609097039437 6.59663703410207 8.2854946963496 6.60451616514653 BM590_A0028 8.60969587286274 8.78992483126367 8.60087927282804 9.99579541103276 12.4336584607436 8.43592023697522 BM590_A0046 8.21295836272829 8.19096048095368 8.57076649652761 8.27537959625362 6.54318652456517 9.01686398912248 2、样本和基因聚类结果热图。 示例: 注:图中每列表示一个样本,每行表示一个基因,图中的颜色表示基因在该组样本中表达量的大小。具体表达量大小变化趋势请见左上方的Color Key。 左侧为基因聚类的树状图,右侧为基因的名称,两个基因分支离的越近,说明它们在所有样品中的表达趋势越接近。 上方为样本聚类的树状图,下方为样本的名称,两个样本分支离的越近,说明它们所有基因的表达模式越接近。 如果提供分组文件,那么,同一组内的样品,在上方用同一种颜色标识。 分析模块引用R语言(v3.2.1)中的cor函数进行相关系数计算,dist函数进行距离计算,hclust函数进行样品和基因间的聚类。
|