NCBI BLAST+ 命令行工具,用于核酸或蛋白序列相似性搜索。Command-line suite for nucleotide and protein similarity search.
mamba install -c bioconda blast
构建核酸数据库:
makeblastdb -in reference.fa -dbtype nucl -out db/reference
运行 blastn:
blastn -query query.fa -db db/reference \
-outfmt "6 qseqid sseqid pident length mismatch gapopen qstart qend sstart send evalue bitscore" \
-evalue 1e-5 -num_threads 8 -out blastn.tsv
运行 blastp:
blastp -query proteins.fa -db uniprot_sprot \
-outfmt 6 -max_target_seqs 10 -num_threads 8 -out blastp.tsv
只取最佳 hits:
blastn -query query.fa -db db/reference -outfmt 6 \
-max_target_seqs 1 -max_hsps 1 -out best_hits.tsv
makeblastdb:构建本地数据库。blastn / blastp / blastx:不同 query/subject 类型的搜索。-outfmt 6:输出 TSV。-evalue:E-value 阈值。-max_target_seqs:限制每条 query 的目标数量。-num_threads:线程数。-max_target_seqs 的解释与版本和搜索策略有关,严格筛选建议结合排序和后处理。nucl/prot 必须和命令匹配。