SAM Restore Coordinate(SAM文件坐标还原)

分析模块,输入sam比对结果文件和bed区间信息文件,将比对结果在目标序列上的坐标,还原成染色体上的坐标,并输出坐标还原后的sam文件。

关于SAM/BAM格式的介绍,参考分析模块 "Map with BWA" 的帮助文档,或者参考:(https://samtools.github.io/hts-specs/SAMv1.pdf)。


输入:


1、sam格式的比对结果文件。

示例:

3782_4324_1:0:0_3:0:0_1       69     chr1:2000-4000        1782         0       *       =       1782         0         CAATGCCCCATTAGCTGGGCTAATTTCTTGTCGGAGTGCCTTAACTGGCTGAGACCGTTTATTCGGGCTC         2222222222222222222222222222222222222222222222222222222222222222222222    RG:Z:Sample_A1

3782_4324_1:0:0_3:0:0_1       137  chr1:2000-4000        1782         37     70M =       1782         0         CTGCGCACGGTAAGTTCTTCGGTATCGCCGCGCGCATCGATCCACGGCTGGCGTCGTTTTGCCAGCCCTT         2222222222222222222222222222222222222222222222222222222222222222222222    RG:Z:Sample_A1     XT:A:U     NM:i:1         SM:i:37    AM:i:0      X0:i:1       X1:i:0       XM:i:1      XO:i:0       XG:i:0       MD:Z:54A15

……


2、bed格式的区间信息文件。

示例:

chr1  2000         4000

chr2  13500       15000

chr3  23000       25000


输出:


坐标还原后的sam文件。

示例:

3782_4324_1:0:0_3:0:0_1       69     ch1   3782         0       *       =       1782         0         CAATGCCCCATTAGCTGGGCTAATTTCTTGTCGGAGTGCCTTAACTGGCTGAGACCGTTTATTCGGGCTC         2222222222222222222222222222222222222222222222222222222222222222222222    RG:Z:Sample_A1

3782_4324_1:0:0_3:0:0_1       137  chr1 3782         37     70M =       1782         0         CTGCGCACGGTAAGTTCTTCGGTATCGCCGCGCGCATCGATCCACGGCTGGCGTCGTTTTGCCAGCCCTT         2222222222222222222222222222222222222222222222222222222222222222222222    RG:Z:Sample_A1     XT:A:U     NM:i:1         SM:i:37    AM:i:0      X0:i:1       X1:i:0       XM:i:1      XO:i:0       XG:i:0       MD:Z:54A15