Skip to content

KevinZ的小窝

Menu
  • Home
  • Categories
Menu

从 fasta 创建用于 GATK WGS 流程的 interval list

Posted on 2026年 2月 5日 by KevinZhou
# 用 fasta 创建 faidx 和 dict 索引
gatk CreateSequenceDictionary -R genecode_GRCh38.p14.genome.fa
samtools faidx genecode_GRCh38.p14.genome.fa

# 用 fadix 索引文件生成参考基因组的 bed 文件
awk -v FS="\t" -v OFS="\t" '{print $1 FS "0" FS ($2-1)}' genecode_GRCh38.p14.genome.fa.fai > genecode_GRCh38.p14.genome.bed
# 移除 blacklist,如果有其他区域需要移除,同样操作
bedtools subtract -a genecode_GRCh38.p14.genome.bed -b /home/zhoukaiwen/database/gatk_bundle/hg38/hg38.blacklist.bed > genecode_GRCh38.p14.genome.interval.bed
# 从 bed 格式转换到 interval list 格式
gatk BedToIntervalList -I genecode_GRCh38.p14.genome.interval.bed -O genecode_GRCh38.p14.genome.interval_list -SD genecode_GRCh38.p14.genome.dict
2026 年 2 月
一 二 三 四 五 六 日
 1
2345678
9101112131415
16171819202122
232425262728  
« 12 月    

俺家的猫~

胖达~

© 2026 KevinZ的小窝 |

粤ICP备2023017690号

|

粤公网安备 44010402003004号