GO level statistic about GO annotation file(GO注释结果

分析模块,输入GO注释信息文件,统计注释到给定level GO上的基因数,输出统计结果。

!!对于主要物种,软件团队从Ensemble网站上,下载并整理了对应物种的GO注释信息。访问,VG软件官方网站:(http://www.vgenomics.cn/),进行下载。


输入:


GO注释信息文件,其中,第一列为基因名,第二列为对应的GO注释结果(以“ ; ”符号分隔)。

示例:

BM590_A0001         GO:0003688;GO:0005524;GO:0006275;GO:0006270;GO:0005737

BM590_A0002         GO:0003677;GO:0006260;GO:0055114;GO:0005737;GO:0003887

BM590_A0003         GO:0003697;GO:0006281;GO:0005524;GO:0006260;GO:0009432;GO:0005737

BM590_A0004         GO:0008152;GO:0003824

BM590_A0005         GO:0051287;GO:0055114

……


输出:


注释到给定level GO上的基因数统计结果。

示例:

##total input seqs number with gos: 2321

namespace        description        number     percent     id      level(shortest distance from root node)

molecular_function  binding     1102         0.474795 GO:0005488    level-01

biological_process     regulation of biological process          275  0.118483 GO:0050789    level-01

biological_process     locomotion       15     0.006463 GO:0040011    level-01

biological_process     localization       417  0.179664 GO:0051179    level-01

molecular_function  transporter activity   236  0.101680 GO:0005215    level-01

biological_process     reproductive process          2       0.000862 GO:0022414    level-01

……

注:

每一列,从左到右,依次为:GO从属的功能三大类(分子功能、细胞组成、生物过程);GO功能描述;注释到对应GO上的基因数目;注释到对应GO上的基因数目与拥有GO注释基因总数的比值;GO编号;GO等级(与根节点最短路径的距离)。

这里,cellular_component,biological_process,molecular_function三大分支的GO等级为:level-00



分析模块引用了goatools(v0.5.7)软件(https://github.com/tanghaibao/goatools/)。


相关文献如下所示:

Haibao Tang et al. (2015). GOATOOLS: Tools for Gene Ontology. Zenodo. 10.5281/zenodo.31628.



GO(Gene Ontology) 是基因本体论联合会建立的数据库,适用于各物种,对基因和蛋白功能进行限定和描述。利用 GO 数据库,可以将基因按照它们参与的生物学过程、构成细胞的组分,实现的分子功能等进行分类。因此GO注释更加便于我们理解基因背后所代表的生物学意义。

!!更新GO结构关系和描述信息数据库,通过Gene Ontology官网链接http://geneontology.org/ontology/go-basic.obo),下载最新的go-basic.obo文件,覆盖软件根目录database文件夹下的同名文件。