Filter sequences by length(按长度过滤fasta序列)

分析模块,根据限定的序列长度信息(Minimal length and Maximum length),输出指定长度范围内的序列。

注:扩增子测序中,通常在MiSeq PE两端数据组装之后,OTU聚类之前,过滤长度太短的测序片段。一般情况下,用于过滤参考序列中,长度过短的序列。

输入:

FASTA格式的序列数据文件:

>seq1

TCATTTAATGAC

>seq2

ATGGC

>seq3

TCACATGATGCCG

>seq4

ATGGAAGC

设置Minimal length10,  Maximum length0

输出:

序列长度信息文件:

>seq1

TCATTTAATGAC

>seq3

TCACATGATGCCG

关于FASTA格式文件,请参考维基百科:https://en.wikipedia.org/wiki/FASTA_format