BAM Flagstat(统计BAM比对结果)

分析模块,输入bam格式的比对结果文件,对整体输入数据的比对结果进行统计。

关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。


输入:


bam格式的比对结果文件。


输出:


比对结果统计信息。

示例:

20607872 + 0 in total (QC-passed reads + QC-failed reads)                #reads总数

0 + 0 duplicates                                                                                         #PCR duplication reads总数。

19372694 + 0 mapped (94.01%:-nan%)                                                  #reads比对率

20607872 + 0 paired in sequencing                                                        #属于PE read的reads总数。

10301155 + 0 read1                                                                                   #PE read中Read 1 的reads 总数。

10306717 + 0 read2                                                                                   #PE read中Read 2 的reads 总数。

11228982 + 0 properly paired (54.49%:-nan%)                                    #完美比对的reads总数。PE两端reads比对到同一条序列,且根据比对结果推断的插入片段大小符合设置的阈值。

18965125 + 0 with itself and mate mapped                                           #PE两端reads都比对上参考序列的reads总数

407569 + 0 singletons (1.98%:-nan%)                                                   #PE两端reads,其中一端比上,另一端没比上的reads总数

3059705 + 0 with mate mapped to a different chr                                #PE read中,两端分别比对到两条不同的序列的reads总数

1712129 + 0 with mate mapped to a different chr (mapQ>=5)           #PE read中,两端分别比对到两条不同的序列,且mapQ>=5的reads总数



分析模块引用了SAMtools v0.1.19软件中的flagstat命令进行比对结果的统计(http://samtools.sourceforge.net/)。


相关文献如下所示:

Li H.*, Handsaker B.*, Wysoker A., Fennell T., Ruan J., Homer N., Marth G., Abecasis G., Durbin R. and 1000 Genome Project Data Processing Subgroup (2009) The Sequence alignment/map (SAM) format and SAMtools. Bioinformatics, 25, 2078-9. [PMID: 19505943]

Li H A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics. 2011 Nov 1;27(21):2987-93. Epub 2011 Sep 8. [PMID: 21903627]