PLINKでSNPをフィルタリングする方法(その1)
遺伝統計ソフトのPLINK 1.90は、SNPのフィルタリングだけでなく、主成分分析や連鎖解析など、様々な解析に使用可能。
マイナーアリル頻度(MAF)やジェノタイピング率(Call rate)で、SNPをフィルタリングするコードの例が以下である。
plink \ --ped input.ped \ # インプットファイルのパス --map input.map \ # インプットファイルのパス --out out \ # アウトプットファイル名 --recode \ # PED形式で出力 --threads 30 \ # スレッド数 --allow-extra-chr \ # ヒト以外の染色体も許容 --maf 0.05 \ # マイナーアリル頻度の指定 --geno 0.1 \ # ジェノタイピング率の指定 --hwe 0.05 # ハーディーワインベルグからの逸脱