纠正错误 / Fix 添加实例 / Add example
文件格式 / Formats

MMseqs2

高性能序列搜索和聚类工具,适合大规模蛋白或核酸数据集。High-performance toolkit for sequence search, clustering, and taxonomy workflows.

速览 | Quick Look

安装 | Install

mamba install -c bioconda mmseqs2

常用命令 | Common Commands

快速搜索:

mmseqs easy-search query.fa target.fa result.tsv tmp --threads 8

序列聚类:

mmseqs easy-cluster proteins.fa cluster_result tmp \
  --min-seq-id 0.9 -c 0.8 --threads 8

创建数据库并搜索:

mmseqs createdb query.fa queryDB
mmseqs createdb target.fa targetDB
mmseqs search queryDB targetDB resultDB tmp --threads 8
mmseqs convertalis queryDB targetDB resultDB result.tsv

关键参数 | Key Options

常见坑 | Pitfalls

参考 | References