ReRun SE Data QC for selected SE library(选择一个对应样品目

功能简介

分析模块,选择一个对应样品目录下的SE文库目录,重新运行质量控制过程,从而,得到该SE文库的优化序列。


示例

选择样品:"MySample_2016",选择文库:"BS20",设置相应的质控参数。执行分析模块,运行完毕后,将会生成新的优化序列。

执行该操作后,目录结构为:

data root directory

---- MySample_2016

---- SE_libs

---- BS20

---- raw

---- BS20.fq (原始数据,保持不变)

---- clean

---- BS20.fq (重新运行QC后的优化数据,原数据被覆盖)

---- PE_libs


说明

Trimmomatic是一个针对Illumina高通量测序的reads trim工具,支持paired-end(双末端)和single-end(单末端)数据。

Trimmomatic剪切和过滤,包括如下步骤:

ILLUMINACLIP: Cut adapter and other illumina-specific sequences from the read

SLIDINGWINDOW: Perform a sliding window trimming, cutting once the average quality within the window falls below a threshold

LEADING: Cut bases off the start of a read, if below a threshold quality

TRAILING: Cut bases off the end of a read, if below a threshold quality

MINLEN: Drop the read if it is below a specified length

CROP: Cut the read to a specified length

HEADCROP: Cut the specified number of bases from the start of the read

细菌基因组测序 ,SE测序,建议使用默认参数设置进行质量控制。


分析模块引用了 Trimmomatic v0.36 软件(http://www.usadellab.org/cms/index.php?page=trimmomatic)。

相关文献如下所示

Bolger, A.M., Lohse, M., & Usadel, B. (2014). Trimmomatic: A flexible trimmer for Illumina Sequence Data. Bioinformatics, btu170.