Select representative seqs(获得对应分类学水平代表序列)

分析模块输入OTU代表序列文件、OTU Table文件、OTU分类学注释文件。根据选定的分类学水平,输出对应水平的代表序列文件。

假设,为了获得属水平的代表序列。如果,多个OTU对应同一个属,则选取在所有样品中,丰度最高的OTU代表序列作为对应属水平的代表序列。

输入:

1fasta格式的OTU代表序列文件:

>OTU1

GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGA ……

>OTU2

GTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTG ……

……

2OTU Table文件:

OTU ID     10     11     12

OTU1        10842       7265         11259

OTU2        6660         5505         7994

OTU3        3212         1769         7230

OTU4        4143         2548         2328

3、分类学注释文件:

OTU1        d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Rhizobiales; f__Bradyrhizobiaceae; g__Bradyrhizobium

OTU2        d__Bacteria; p__Firmicutes; c__Bacilli; o__Lactobacillales; f__Streptococcaceae; g__Lactococcus

OTU3        d__Bacteria; p__Proteobacteria; c__Alphaproteobacteria; o__Sphingomonadales; f__Sphingomonadaceae; g__Sphingomonas

OTU4        d__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__Micromonosporaceae; g__Rugosimonospora

输出:

对应水平的代表序列文件:

>Bradyrhizobium

GTGGGGAATATTGGACAATGGGCGCAAGC……

>Lactococcus

GTAGGGAATCTTCGGCAATGGACGAAAGT……

>Sphingomonas

GTGGGGAATATTGGACAATGGGCGAAAGC……

>Rugosimonospora

GTGGGGAATATTGCACAATGGGCGGAAGC……

……