ReRun PE Data QC for selected PE library(选择一个对应样品目

功能简介

分析模块,选择一个对应样品目录下的PE文库目录,重新运行质量控制过程,从而,得到该PE文库的优化序列。


示例

选择样品:"MySample_2016",选择文库:"SBS-300",设置相应的质控参数。执行分析模块,运行完毕后,将会生成新的优化序列。

执行该操作后,目录结构为:

data root directory

---- MySample_2016

---- SE_libs

---- PE_libs

---- SBS-300

---- raw

---- SBS-300_1.fq (R1端原始数据,保持不变)

---- SBS-300_2.fq (R2端原始数据,保持不变)

---- clean

---- SBS-300_1.fq (R1端重新运行QC后的优化数据,原数据被覆盖)

---- SBS-300_2.fq (R2端重新运行QC后的优化数据,原数据被覆盖)


说明

Trimmomatic是一个针对Illumina高通量测序的reads trim工具,支持paired-end(双末端)和single-end(单末端)数据。

Trimmomatic剪切和过滤,包括如下步骤:

ILLUMINACLIP: Cut adapter and other illumina-specific sequences from the read

SLIDINGWINDOW: Perform a sliding window trimming, cutting once the average quality within the window falls below a threshold

LEADING: Cut bases off the start of a read, if below a threshold quality

TRAILING: Cut bases off the end of a read, if below a threshold quality

MINLEN: Drop the read if it is below a specified length

CROP: Cut the read to a specified length

HEADCROP: Cut the specified number of bases from the start of the read

细菌基因组测序 ,PE-150bp测序,建议使用默认参数设置进行质量控制。


分析模块引用了 Trimmomatic v0.36 软件(http://www.usadellab.org/cms/index.php?page=trimmomatic)。

相关文献如下所示

Bolger, A.M., Lohse, M., & Usadel, B. (2014). Trimmomatic: A flexible trimmer for Illumina Sequence Data. Bioinformatics, btu170.