NCBI SRA 数据下载与 FASTQ 转换工具集,常用 prefetch 下载 .sra 缓存,再用 fasterq-dump 转换为 FASTQ。Toolkit for downloading and converting SRA sequencing reads.
.sramamba install -c bioconda sra-tools
下载一个 run:
prefetch SRR12345678 --output-directory sra_cache
转换为双端 FASTQ:
fasterq-dump sra_cache/SRR12345678/SRR12345678.sra \
--split-files --threads 8 --outdir fastq
转换后压缩:
pigz -p 8 fastq/SRR12345678_*.fastq
批量处理 accession 列表:
while read acc; do
prefetch "$acc" --output-directory sra_cache
fasterq-dump "sra_cache/$acc/$acc.sra" --split-files --threads 8 --outdir fastq
done < runs.txt
prefetch:下载 SRA run 到本地缓存。fasterq-dump:将 SRA 转为 FASTQ。--split-files:双端 reads 输出为 _1 和 _2 文件。--threads:线程数。--outdir:输出目录。--temp:指定临时目录。fasterq-dump 临时空间需求可能明显大于最终 FASTQ。--split-files 也只会生成一个 FASTQ。