Load paired-end library data in selected sample di

功能简介

分析模块,在选定样品目录下创建一个PE文库目录,导入History Panel中的PE原始测序数据,利用Trimmomatic PE进行剪切和过滤。从而,得到该样品的优化序列。注意,文库名称由数字、字母、下划线组成,并且开头和结尾不能是下划线。如果文库目录已存在,则无法创建,并提示文库目录已存在错误。


示例

选择样品:"MySample_2016",输入文库名称:"SBS",选择History Panel中对应的原始测序数据,设置文库大小:"300"。然后,执行分析模块,将会在样品目录 "MySample_2016" 包含的 "PE_libs" 目录下,创建一个名为"SBS-300"的目录,同时创建两个目录"raw"和"clean",分别用于存放原始数据和优化数据。

执行该操作后,目录结构为:

data root directory

---- MySample_2016

---- SE_libs

---- PE_libs

---- SBS-300('-'符号前面为文库名称,后面为文库大小)

---- raw

---- SBS-300_1.fq (R1端原始数据)

---- SBS-300_2.fq (R2端原始数据)

---- clean

---- SBS-300_1.fq (R1端经过剪切、过滤的优化数据)

---- SBS-300_2.fq (R2端经过剪切、过滤的优化数据)


说明

Trimmomatic是一个针对Illumina高通量测序的reads trim工具,支持paired-end(双末端)和single-end(单末端)数据。

Trimmomatic剪切和过滤,包括如下步骤:

ILLUMINACLIP: Cut adapter and other illumina-specific sequences from the read

SLIDINGWINDOW: Perform a sliding window trimming, cutting once the average quality within the window falls below a threshold

LEADING: Cut bases off the start of a read, if below a threshold quality

TRAILING: Cut bases off the end of a read, if below a threshold quality

MINLEN: Drop the read if it is below a specified length

CROP: Cut the read to a specified length

HEADCROP: Cut the specified number of bases from the start of the read

细菌基因组测序 ,PE-150bp测序,建议使用默认参数设置进行质量控制。


分析模块引用了 Trimmomatic v0.36 软件(http://www.usadellab.org/cms/index.php?page=trimmomatic)。

相关文献如下所示

Bolger, A.M., Lohse, M., & Usadel, B. (2014). Trimmomatic: A flexible trimmer for Illumina Sequence Data. Bioinformatics, btu170.