Fasta Statistics(fasta序列统计)

分析模块,输入FASTA格式序列文件,输出统计信息。

输入:

FASTA格式的序列数据文件:

>OTU1

GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCG ……

>OTU2

GTAGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCG ……

>OTU3

GTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCG ……

……

输出:

统计信息文件:

GC_content      54.9

len_N50    449

len_max   451

len_mean 439

len_median       449

len_min    425

num_A     12097

num_C     9885

num_G     15955

num_N     0

num_T      9093

num_bp    47030

num_bp_not_N         47030

num_seq  107

包含的信息:

Lengths: n50, min, max, median and average

Number of base pairs: A, C, G, T, N, Total and Total_not_N

Number of sequences

GC content in %

关于FASTA格式文件,请参考维基百科:https://en.wikipedia.org/wiki/FASTA_format