高性能 FASTA/FASTQ 命令行工具箱,适合统计、筛选、抽样、格式转换和序列操作。Fast FASTA/FASTQ toolkit for statistics, filtering, sampling, conversion, and sequence operations.
mamba install -c bioconda seqkit
统计 FASTA/FASTQ:
seqkit stats *.fq.gz
按 ID 列表提取:
seqkit grep -f ids.txt sequences.fa.gz > selected.fa
FASTQ 转 FASTA:
seqkit fq2fa reads.fq.gz > reads.fa
随机抽样:
seqkit sample -p 0.1 -s 42 reads.fq.gz > reads.10pct.fq
反向互补:
seqkit seq -r -p primers.fa > primers.revcomp.fa
stats:序列数量、长度、N50 等统计。grep:按 ID、name、序列模式筛选。seq:格式转换、大小写、反向互补。sample:随机抽样。split / split2:拆分大文件。-j:线程数。grep -f 默认匹配序列 ID/name,不是序列内容;按序列匹配需看 -s。