遺伝研スパコン上でレファレンス配列のインデックスファイル(.fai)を作成する

NCBIなどからリファレンス配列をダウンロードした際に、scaffoldのIDやcontigのIDなどを知りたい場合がある。


その際に便利なのが、インデックスファイル(.fai)。


インデックスファイル(.fai)はSamtools faidxを実行することで作成できます。


www.htslib.org


基本のコマンドは以下。

samtools faidx ref.fasta


遺伝件スパコン上で動かす際は、例えばsamtools version1.9を使用する場合は、以下になる。

singularity exec /usr/local/biotools/s/samtools:1.9--h91753b0_8 \
samtools faidx \
/home//reference/ref.fasta


ここで注意なのが、Fastaファイルのパスは絶対パスを使用すること。


でないと、以下のようなエラーがでる。

[E::fai_build3_core] Failed to open the file