【お詫び】現在アップデート版が出ているようなのですが、いまアップデートしてエラーが出ると大変なことになるので、自分が10 月にダウンロードしたTassel5 についての説明を書きます。ごめんなさい。
このソフトウェアはかなり多機能なのですが、自分が使った部分だけ説明していきます。
Tassel はインターフェース付きのソフトウェアなので、いつも通りサイトからインストールし、アプリを開きます。
1.Data>sort genotype file>vcf でvcf ファイルに名前を付けて保存し直す
そのままFile>open で開けるvcf ファイルもたまにありますが、基本的にはsort しないとダメっぽいです。
今回はpopulations.snp-sorted.vcf として保存しています。
OK でファイルが生成されます。
2.この新しく生成されたファイルをFile>Open as>vcf で開く
3.Filter>Sites
- Minimum Count:このラインより多い個体が持つSNP を残す、という最低ライン。今回は2個体以上が持つSNP を残すため、2に設定。
- Minimum Frequency マイナーSNP を何%まで持つか。
細かい説明はTassel source wiki(https://bitbucket.org/tasseladmin/tassel-5-source/wiki/UserManual/FilterMenu/FilterMenu)で確認
4.Filter>Taxa>Minimum proportion of sites present
SNP のうち何割を持っている個体を残すか。今回は0.8 に設定。
5.File>sava.as>vcf として保存
これでフィルタリングはおしまい。
正直、stacks のvcf を使った場合、populations の段階で相当フィルタリングかけているので、ほとんど個体数は変わらないと思います。