轻量 FASTA/FASTQ 命令行工具,适合抽样、截取、格式转换和基础处理。Lightweight toolkit for common FASTA/FASTQ operations.
mamba install -c bioconda seqtk
FASTQ 转 FASTA:
seqtk seq -a reads.fq.gz > reads.fa
随机抽样 100000 条 reads:
seqtk sample -s 42 reads.fq.gz 100000 > reads.subsample.fq
按 ID 列表提取序列:
seqtk subseq reference.fa ids.txt > subset.fa
反向互补:
seqtk seq -r input.fa > reverse_complement.fa
seq:格式转换、过滤、反向互补。sample:随机抽样。subseq:按名称或区域列表提取。-a:输出 FASTA。-q:按质量过滤 FASTQ。-s:随机种子。sample 对压缩输入可用,但输出通常需要自行压缩。subseq 的 ID 需要和 FASTA header 中的主 ID 对齐。