Clean VCF file for BSA Analysis

分析模块,输入包含两个混池样品变异信息的VCF文件(混池间的个体性状存在极端差异),过滤VCF文件中,大于2个等位基因的位点和分型存在缺失的位点。

过滤后的VCF结果文件,其中的变异信息用于计算两个混池样品的SNP-Index。在后续的BSA分析中,SNP-Index用于确定候选区域。

关于VCF格式的详细介绍,参考:(http://www.1000genomes.org/wiki/Analysis/variant-call-format/)。


输入:


需要过滤的vcf文件。


输出:


1、过滤后的vcf结果文件。


2、包含所有染色体名称的列表文件。

示例:

Chr01

Chr02

Chr03

Chr04

Chr05

Chr06

Chr07

Chr08

Chr09

Chr10

Chr11

scaffold4

scaffold51

scaffold227

scaffold159

scaffold191