read coverage per BED region(目标区域覆盖度统计)

分析模块,输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的覆盖度信息。

关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。

关于BED格式的介绍,参考:(http://asia.ensembl.org/info/website/upload/bed.html)。


输入:


1、坐标排序过的bam比对结果文件。


2、bed区间信息文件。

示例:

chr1  2000         4000

chr2  13500       15000

chr3  23000       25000


输出:


bed文件内,每个区间内比对结果的覆盖度信息。

chr1  2000         4000         4251         2000         2000         1.0000000

chr2  13500       15000       3296         1500         1500         1.0000000

chr3  23000       25000       4365         2000         2000         1.0000000

注:

追加的第四列为,bed区间内比对上的reads总数

追加的第五列为,bed区间内,被覆盖到的碱基总数

追加的第六列为,bed区间长度

追加的第七列为,bed区间覆盖率,计算方式为:第五列的值除以第六列的值。



分析模块引用了bedtools v2-2.20.1软件中的coverage命令进行覆盖度信息的统计(http://bedtools.readthedocs.io/en/latest/)。


相关文献如下所示:

Quinlan AR and Hall IM, 2010. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics. 26, 6, pp. 841–842.