しばらくNGSのデータ解析から離れていたが、久々に解析する案件が出てきた。これからしばらくは何件かあるかもしれない。
というわけで、すっかり浦島太郎状態。でもNextflowというものがあることを知り、使ってみるとこれがすごく便利。
インストール方法はここにあるのだけれど、基本的には必要なツール類は例えばDockerにまとめられていて、single-endのRNAseq解析だと、
nextflow run nf-core/rnaseq \
--input samplesheet.csv \
--outdir output \
--genome GRCh37 \
-profile docker
で、fastqcによるシークエンスの品質チェック、アラインメントから発現量解析まで全部やってくれる。いつも遺伝子のアノテーションファイルがどうだの、アラインメントソフトのパラメータがどうだの、いろいろ面倒なことが一切ない。ま、デフォルトのツールが本当に用途に合っているのかどうかは確認が必要だとは思うけれど…。