# 用 fasta 创建 faidx 和 dict 索引
gatk CreateSequenceDictionary -R genecode_GRCh38.p14.genome.fa
samtools faidx genecode_GRCh38.p14.genome.fa
# 用 fadix 索引文件生成参考基因组的 bed 文件
awk -v FS="\t" -v OFS="\t" '{print $1 FS "0" FS ($2-1)}' genecode_GRCh38.p14.genome.fa.fai > genecode_GRCh38.p14.genome.bed
# 移除 blacklist,如果有其他区域需要移除,同样操作
bedtools subtract -a genecode_GRCh38.p14.genome.bed -b /home/zhoukaiwen/database/gatk_bundle/hg38/hg38.blacklist.bed > genecode_GRCh38.p14.genome.interval.bed
# 从 bed 格式转换到 interval list 格式
gatk BedToIntervalList -I genecode_GRCh38.p14.genome.interval.bed -O genecode_GRCh38.p14.genome.interval_list -SD genecode_GRCh38.p14.genome.dict