读取、过滤、规范化、合并、查询和注释 VCF/BCF 变异文件。Toolkit for viewing, filtering, normalizing, merging, querying, and annotating VCF/BCF variant files.
.vcf, .vcf.gz, .bcfmamba install -c bioconda bcftools
查看压缩 VCF:
bcftools view cohort.vcf.gz | less -S
按区域或样本抽取:
bcftools view -r chr1:100000-200000 -s sampleA,sampleB cohort.vcf.gz -Oz -o subset.vcf.gz
bcftools index -t subset.vcf.gz
过滤低质量变异:
bcftools view -i 'QUAL>=30 && INFO/DP>=10' input.vcf.gz -Oz -o filtered.vcf.gz
规范化多等位和左对齐:
bcftools norm -f reference.fa -m -both input.vcf.gz -Oz -o normalized.vcf.gz
提取表格:
bcftools query -f '%CHROM\t%POS\t%REF\t%ALT\t%QUAL\n' input.vcf.gz > variants.tsv
view:查看、过滤、子集化 VCF/BCF。query:按格式字符串导出字段。filter:按表达式标记或过滤记录。norm:拆分多等位、左对齐、参考校验。annotate:添加或删除 INFO/FORMAT 注释。concat / merge:拼接同一样本的分染色体文件,或合并不同样本集合。bcftools index 要求输入通常是 bgzip 压缩的 .vcf.gz,普通 gzip 不够。concat 适合同一样本、不同区域;merge 适合不同样本、同一坐标体系。norm -f 依赖参考基因组,参考版本和染色体命名必须和 VCF 一致。