BAM IdxStats(统计BAM具体比对信息)

分析模块,输入按坐标排序过的bam比对结果文件,建立索引,并统计比对结果中,参考基因组每条序列的具体比对信息。

关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。


输入:


坐标排序过的bam比对结果文件。


输出:


参考基因组每条序列的具体比对信息。

示例:

chr1  248956422       6039680  0

chr2  242193529       4663430  0

chr3  198295559       3836263  0

chr4  190214555       2749138  0

chr5  181538259       3051550  0

chr6  170805979       2918637  0

chr7  159345973       3114113  0

chr8  145138636       2338216  0

注:从左到右分别为,reference sequence name(参考基因组序列名称), sequence length(参考基因组序列长度),  mapped reads(比对上的reads总数)和unmapped reads(比对不上的reads总数)



分析模块引用了SAMtools v0.1.19软件中的idxstats命令进行比对信息的统计(http://samtools.sourceforge.net/)。


相关文献如下所示:

Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]

Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]