VCF Restore Coordinate(VCF文件坐标还原)

分析模块,输入vcf变异信息文件和bed区间信息文件,将突变在目标序列上的坐标,还原成染色体上的坐标,并输出坐标还原后的vcf文件。

关于VCF格式的详细介绍,参考:(http://www.1000genomes.org/wiki/Analysis/variant-call-format/)。


输入:


1、vcf格式的变异信息文件。

示例:

#CHROM          POS  ID     REF ALT QUAL       FILTER    INFO         FORMAT          Sample_A1

chr1:2000-4000        88     .        T       C      1169.77    . AC=1;AF=0.500;AN=2;BaseQRankSum=1.332;DP=143;Dels=0.00;ExcessHet=3.0103;FS=0.617;HaplotypeScore=39.9093;MLEAC=1;MLEAF=0.500;MQ=48.22;MQ0=0;MQRankSum=-0.629;QD=8.18;ReadPosRankSum=-1.219;SOR=0.665  GT:AD:DP:GQ:PL    0/1:68,75:143:99:1198,0,1047

chr1:2000-4000        235  .        C      A      2939.77    .        AC=2;AF=1.00;AN=2;BaseQRankSum=-1.433;DP=140;Dels=0.00;ExcessHet=3.0103;FS=0.000;HaplotypeScore=43.8028;MLEAC=2;MLEAF=1.00;MQ=50.17;MQ0=0;MQRankSum=-0.935;QD=21.15;ReadPosRankSum=1.558;SOR=0.333 GT:AD:DP:GQ:PL    1/1:1,138:140:99:2968,393,0

……


2、bed格式的区间信息文件。

示例:

chr1  2000         4000

chr2  13500       15000

chr3  23000       25000


输出:


坐标还原后的vcf文件。

示例:

#CHROM          POS  ID     REF ALT QUAL       FILTER    INFO         FORMAT          Sample_A1

chr1  2088         .        T       C      1169.77    . AC=1;AF=0.500;AN=2;BaseQRankSum=1.332;DP=143;Dels=0.00;ExcessHet=3.0103;FS=0.617;HaplotypeScore=39.9093;MLEAC=1;MLEAF=0.500;MQ=48.22;MQ0=0;MQRankSum=-0.629;QD=8.18;ReadPosRankSum=-1.219;SOR=0.665  GT:AD:DP:GQ:PL    0/1:68,75:143:99:1198,0,1047

chr1  2235         .        C      A      2939.77    .        AC=2;AF=1.00;AN=2;BaseQRankSum=-1.433;DP=140;Dels=0.00;ExcessHet=3.0103;FS=0.000;HaplotypeScore=43.8028;MLEAC=2;MLEAF=1.00;MQ=50.17;MQ0=0;MQRankSum=-0.935;QD=21.15;ReadPosRankSum=1.558;SOR=0.333 GT:AD:DP:GQ:PL    1/1:1,138:140:99:2968,393,0

……