Win_app - nibb-gitc/gitc2021mar-rnaseq GitHub Wiki

windows WSLでの環境構築

  • GITC準備編で使用する各ソフトウェアを、Windows10 で使用するための設定方法です。

  • なお、事前に Windows Subsystem for Linux (WSL)がインストールされていることが前提です。WSL/WSL2 のいずれでも構いません。

  • 使用したディストリビューションは Ubuntu 20.04.2 LTS です。

  • ダウンロードするだけのソフトウェアなどについては、ここの例ではパスを通していません。

    • 必要に応じてパスが通っている場所にコピーするか、~/bin ディレクトリを作ってコピーした上に ~/.bash_profile を編集してバスを通す などの操作をしてください。
    • 常にカレントディレクトリを気にしながら作業しましょう

  1. WSLとWindowsのディレクトリ位置
  • WSLを起動するとカレントディレクトリが /mnt/c/Users/(Windowsのユーザー名) になります。これはWindowsでいうところの 「C:\ユーザー\ユーザー名」 にあたります。

  • WSLでのホームフォルダは /home/ユーザー名 であり、起動時のカレントディレクトリとは異なります。

  • lsコマンドで確認すると、デスクトップやダウンロードが見えます。 Windowsのデスクトップに置いたファイルをWSLで扱いたい場合、以下のディレクトリを参照します。

/mnt/c/Users/ユーザー名/Desktop/
  1. Ubuntuの更新
  • WSL上で以下のコマンドを順番に実行します。
sudo apt update
sudo apt dist-upgrade  #(更新されたファイルをDLしてアップデートします。時間がかかる場合があります)
  1. 続けて各種ソフトウェアのインストール
sudo apt install ncbi-blast+
sudo apt install diamond-aligner
sudo apt install bowtie2
sudo apt install samtools
sudo apt install cutadapt
sudo apt install salmon
sudo apt install stringtie
sudo apt install hisat2
  1. stringtie から、prepDE.py および prepDE.py3 をダウンロードしておく

  2. gffreadgit および make コマンドでインストール

  • 同じ gffread ディレクトリ内にインストールされます
git clone https://github.com/gpertea/gffread
cd gffread
make release
  1. gffcomparegit および make コマンドでインストール
  • 同じ gffcompare ディレクトリ内にインストールされます
git clone https://github.com/gpertea/gffcompare
cd gffcompare
make release
  1. Perlのパッケージ管理ソフト:CPAN のインストール
sudo perl -MCPAN -e shell
 (問いかけにはすべてyesをタイプしてEnterキーを押す)
  1. 以下はCPANを起動した状態、 cpan[1]> というプロンプトが出ている状態で実行すること。出ていない場合は、sudo perl -MCPAN -e shell と実行してCPANを起動する
  • TransDecoder に必要な Escape.pm パッケージをインストール
cpan[1]> install URI::Escape
  • CPAN を終了
cpan[2]> q
  1. TransDecodergitコマンドでダウンロードしておく
  • ダウンロードしたディレクトリ内のTransDecoder.LongOrfsTransDecoder.Predict がそのままソフトウェアとなる
git clone https://github.com/TransDecoder/TransDecoder
(cd TransDecoder)
  1. seqkit から seqkit_linux_amd64.tar.gz をダウンロードして解凍する。
  • 下記のコマンドでseqkitソフトウェアができる
 tar zxvf seqkit_linux_amd64.tar.gz
  1. NCBI SRA toolkit から Ubuntu Linux64 bit architecture をダウンロードして解凍する。
  • 下記のコマンドでできる sratoolkit.2.10.9-ubuntu64/bin の下にソフトウェアができる
tar zxvf sratoolkit.2.10.9-ubuntu64.tar.gz
  1. miniconda を利用して BUSCO をインストール 4GBの空き容量が必要です
    • Minicondaは、Pythonの環境構築パッケージである Anacondaの縮小版です。必要最低限の物がパッケージされています
    • Anaconda (Wikipedia)
    • Miniconda(本家)
  • 作業ディレクトリ miniconda を作成し、その中で作業します。
mkdir miniconda
cd miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
 (インストール、問いかけにはすべてyesをタイプしてEnterキーを押す)
  • ホームディレクトリのminiconda3/bin 内 ~/miniconda3/bin にインストールされます。
~/miniconda3/bin/conda init `basename ${SHELL}`
~/miniconda3/bin/conda config --set auto_activate_base false

(ここでUbutuを再起動するとcondaへのパスが設定されている)

conda activate base
  1. conda環境が起動した状態(プロンプト前に (base) と出ている状態)でBUSCOをインストールします。この作業には時間がかかります(30分〜)。
conda install -c bioconda -c conda-forge busco=5.0.0
  1. インストールが終了したら、conda を終了しておきます。BUSCOを利用する時に再度起動します。
conda deactivate base (終了)
conda activate base (起動)
busco

聴講生の方へ:

  • 以降のソフトのインストールはオプションとします
  1. eggnog-mapper のインストール 50GBの空き容量が必要です。
  • pip3 をインストール
sudo apt install python3-pip
  1. pip3 で eggnog-mapper をインストール(依存関係にある numpy, biopython, psutil も自動でインストールされます)
pip3 install eggnog-mapper
  1. eggnog-mapper のデータを保存するディレクトリとして、${HOME}/eggnog-mapper-data を作成し、環境変数 EGGNOG_DATA_DIR を設定
mkdir ${HOME}/eggnog-mapper-data
export EGGNOG_DATA_DIR="${HOME}/eggnog-mapper-data"
  1. 以下のページから download_eggnog_data.py を保存して実行
python3 download_eggnog_data.py
  1. InterProScan 25GBの空き容量が必要です
  • インストール方法をここでは解説しません。
  • Installation requirements を見て余裕があればインストールしてみてください。