PLINKでSNPをフィルタリングする方法(その1)

www.cog-genomics.org




遺伝統計ソフトのPLINK 1.90は、SNPのフィルタリングだけでなく、主成分分析や連鎖解析など、様々な解析に使用可能。


マイナーアリル頻度(MAF)やジェノタイピング率(Call rate)で、SNPをフィルタリングするコードの例が以下である。

plink \
--ped input.ped \   # インプットファイルのパス
--map input.map \   # インプットファイルのパス
--out out \   # アウトプットファイル名
--recode \   # PED形式で出力
--threads 30 \   # スレッド数
--allow-extra-chr \   # ヒト以外の染色体も許容
--maf 0.05 \   # マイナーアリル頻度の指定
--geno 0.1 \   # ジェノタイピング率の指定
--hwe 0.05   # ハーディーワインベルグからの逸脱