高性能 RNA-seq spliced aligner,常用于 bulk RNA-seq reads 到基因组比对。High-performance RNA-seq spliced aligner widely used for mapping reads to a genome.
mamba install -c bioconda star
构建 genome index:
STAR --runMode genomeGenerate \
--runThreadN 16 \
--genomeDir star_index \
--genomeFastaFiles genome.fa \
--sjdbGTFfile genes.gtf \
--sjdbOverhang 149
双端 RNA-seq 比对并输出排序 BAM:
STAR --runThreadN 16 \
--genomeDir star_index \
--readFilesIn sample_R1.fq.gz sample_R2.fq.gz \
--readFilesCommand zcat \
--outSAMtype BAM SortedByCoordinate \
--outFileNamePrefix star/sample.
生成基因计数:
STAR --quantMode GeneCounts --genomeDir star_index \
--readFilesIn R1.fq.gz R2.fq.gz --readFilesCommand zcat \
--runThreadN 16 --outFileNamePrefix star/sample.
--runMode genomeGenerate:构建索引。--genomeDir:索引目录。--sjdbGTFfile:注释文件,用于 splice junction。--sjdbOverhang:一般设为 read length - 1。--readFilesCommand zcat:读取 gzip FASTQ。--outSAMtype BAM SortedByCoordinate:直接输出坐标排序 BAM。sjdbOverhang 应按 reads 长度设置;不同读长项目最好分开建索引或折中评估。