NR Annotation with BLAST+ blastp/blastx(NR数据库注释)

功能简介

分析模块,利用blastp/blastx程序,输入Fasta格式的蛋白/核酸序列文件,与NR数据库进行比对,输出NR数据库注释结果。

GO注释分析需要用到NR库XML格式的比对结果文件,比对时的默认参数设置适用于blast2go。

注意

数据库比对需要大量的时间,如果输入的序列条数过多,会导致blast程序进入假死状态。建议,每次输入的序列数目不要太多。如果,序列条数过多,将序列 文件切割成多个小文件,进行分析。


输出格式

Column

NCBI name

Description

1

Score

Score

2

E-Value

E-Value

3

HSP-Len

Length of Match

4

%-Ident

Percentage of Identical Bases in Match

5

%-Simil

Percentage of Similar Bases in Match

6

Query-Name

Query Name

7

Num-Rds

---

8

Q-Len

Total Length of Query Sequence

9

Q-Begin

Starting Position of Match in Query

10

Q-End

Ending Position of Match in Query

11

Q-Frame

Query Frame

12

Hit-Name

Hit Name

13

H-Len

Total Length of Hit Sequence

14

H-Begin

Starting Position of Match in Hit

15

H-End

Ending Position of Match in Hit

16

H-Frame

Hit Frame

17

Description

Hit Description


分析模块,引用了 ncbi-blast-2.2.31+ 软件(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.2.31/)

相关文献如下所示:

Camacho, Christiam and Coulouris, George and Avagyan, Vahram and Ma, Ning and Papadopoulos, Jason and Bealer, Kevin and Madden, Thomas L (2009). BLAST+: architecture and applications. In BMC Bioinformatics, 10 (1), pp. 421.