LEfSe formatting(格式化LEfSe输入)

分析模块生成LEfSe分析的输入配置文件,需提供:样品分组条件、样品子分组条件、样品丰度和分类学信息。


输入:


1、包含分类学信息的biom格式的OUT Table文件,可通过分析模块 "Convert table to biom with taxonomy assignment information" 得到。


2、class design文件,定义样品的class分类,即生物条件或类群。

示例:

Bio1 mucosal

Bio2 mucosal

Bio3 mucosal

Bio4 mucosal

Bio5 mucosal

Bio6 mucosal

Bio7 non_mucosal

Bio8 non_mucosal

Bio9 non_mucosal

Bio10        non_mucosal


3、subclass design文件(可选),定义样品的subclass分类。默认分组条件与class design文件一致。该文件需确保sample->subclass->class之间的包含对应关系,举例说明:Bio1属于oral,Bio1属于mucosal,那么oral就属于mucosal,这样的话,Bio9就不能属于oral。

示例:

Bio1 oral

Bio2 oral

Bio3 gut

Bio4 gut

Bio5 gut

Bio6 gut

Bio7 skin

Bio9 skin

Bio8 nasal

Bio10        nasal


输出:


LEfSe分析输入配置文件。


注:分类学等级对应的结果依赖于进行分类学注释时所采用的数据库。不同的数据库,等级对应的结果不同。在选择Taxonomy level的时候,根据需要进行选择,一般到属水平。

例如,对于Greengenes 数据库,使用如下的分类学等级: Level 1 = Kingdom (e.g Bacteria), Level 2 = Phylum (e.g Actinobacteria), Level 3 = Class (e.g Actinobacteria), Level 4 = Order (e.g Actinomycetales), Level 5 = Family (e.g Streptomycetaceae), Level 6 = Genus (e.g Streptomyces), Level 7 = Species (e.g mirabilis). "