win_app - nibb-gitc/gitc2025mar-rnaseq GitHub Wiki

Windows WSLでの環境構築

  • RNA-seq入門で使用する各ソフトウェアを、Windows10,11 で使用するための設定方法です。
  • 使用したディストリビューションは Ubuntu 20.04.2 LTS です。
  • ダウンロードするだけのソフトウェアなどについては、ここの例ではパスを通していません。
    • 必要に応じてパスが通っている場所にコピーするか、~/bin ディレクトリを作ってコピーした上に ~/.bash_profile を編集してバスを通す などの操作をしてください。
    • 常にカレントディレクトリを気にしながら作業しましょう

  1. WSLとWindowsのディレクトリ位置
  • WSLを起動するとカレントディレクトリが /mnt/c/Users/(Windowsのユーザー名) になります。これはWindowsでいうところの 「C:\ユーザー\ユーザー名」 にあたります。

  • WSLでのホームフォルダは /home/ユーザー名 であり、起動時のカレントディレクトリとは異なります。

  • lsコマンドで確認すると、デスクトップやダウンロードが見えます。 Windowsのデスクトップに置いたファイルをWSLで扱いたい場合、以下のディレクトリを参照します。

/mnt/c/Users/ユーザー名/Desktop/
  1. Ubuntuの更新
  • WSL上で以下のコマンドを順番に実行します。
sudo apt update
sudo apt dist-upgrade  #(更新されたファイルをDLしてアップデートします。時間がかかる場合があります)
  1. 続けて各種ソフトウェアのインストール
sudo apt install ncbi-blast+
sudo apt install diamond-aligner
sudo apt install bowtie2
sudo apt install samtools
sudo apt install cutadapt
sudo apt install salmon
sudo apt install stringtie
sudo apt install hisat2
  1. stringtie のページに行き、 prepDE.py をクリック、「Raw」ボタンを押してからブラウザの「ページを別名で保存」してダウンロードする。 prepDE.py3 も同様にダウンロードしておく。

  2. gffreadgit および make コマンドでインストール

  • 同じ gffread ディレクトリ内にインストールされます
git clone https://github.com/gpertea/gffread
cd gffread
make release
  1. gffcomparegit および make コマンドでインストール
  • 同じ gffcompare ディレクトリ内にインストールされます
git clone https://github.com/gpertea/gffcompare
cd gffcompare
make release
  1. Perlのパッケージ管理ソフト:CPAN のインストール
sudo perl -MCPAN -e shell
 (問いかけにはすべてyesをタイプしてEnterキーを押す)
  1. 以下はCPANを起動した状態、 cpan[1]> というプロンプトが出ている状態で実行すること。出ていない場合は、sudo perl -MCPAN -e shell と実行してCPANを起動する
  • TransDecoder に必要な Escape.pm パッケージをインストール
cpan[1]> install URI::Escape
  • CPAN を終了
cpan[2]> q
  1. TransDecodergitコマンドでダウンロードしておく
  • ダウンロードしたディレクトリ内のTransDecoder.LongOrfsTransDecoder.Predict がそのままソフトウェアとなる
git clone https://github.com/TransDecoder/TransDecoder
(cd TransDecoder)
  1. seqkit から seqkit_linux_amd64.tar.gz をダウンロードして解凍する。
  • 下記のコマンドでseqkitソフトウェアができる
 tar zxvf seqkit_linux_amd64.tar.gz
  1. NCBI SRA toolkit から Ubuntu Linux64 bit architecture をダウンロードして解凍する。
  • 下記のコマンドでできる sratoolkit.3.0.0-ubuntu64/bin の下にソフトウェアができる
tar zxvf sratoolkit.3.0.0-ubuntu64.tar.gz
  1. Trinityrnaseq
  • このアプリケーションはパソコンでの動作を推奨しませんのでインストールは不要です

以降のソフトのインストールはオプションとします。PCの容量等を確認して適宜インストールをお願いします。

  1. BUSCO をインストール 4GBの空き容量が必要です
  • 先にAugustusのインストール
sudo apt install augustus augustus-data augustus-doc
  • BUSCOに必要なpythonライブラリをインストール
sudo apt install python3-pip
sudo pip3 install pandas
sudo pip3 install biopython
sudo pip3 install sepp
  • BUSCO インストール
cd
git clone https://gitlab.com/ezlab/busco.git
cd busco/
python3 setup.py install
  • 上記まで完了した状態で、~/busco/bin/busco が buscoのアプリケーションです
  1. eggnog-mapper のインストール 50GBの空き容量が必要です。
  • pip3 をインストール
sudo apt install python3-pip
  1. pip3 で eggnog-mapper をインストール(依存関係にある numpy, biopython, psutil も自動でインストールされます)
pip3 install eggnog-mapper
  1. eggnog-mapper のデータを保存するディレクトリとして、${HOME}/eggnog-mapper-data を作成し、環境変数 EGGNOG_DATA_DIR を設定
mkdir ${HOME}/eggnog-mapper-data
export EGGNOG_DATA_DIR="${HOME}/eggnog-mapper-data"
  1. 以下のページから download_eggnog_data.py を保存して実行
python3 download_eggnog_data.py
  1. InterProScan 80GBの空き容量が必要です
  • インストール方法をここでは解説しません。
  • Installation requirements を見て余裕があればインストールしてみてください。