homework - nibb-gitc/gitc2020jun-rnaseq GitHub Wiki
Preparation 宿題
受講生は、必ず以下の宿題を行なった上で、トレーニングコースにのぞんでください。
宿題を行うにあたって、2月に開催したゲノムインフォマティクス・トレーニングコース 準備編 「UNIX・R・NGSの基礎」が参考になるでしょう。
RNA-seq全般に関する宿題
RNA-seqの主な目的を、2つ挙げなさい。
UNIXに関する宿題
トレーニングコースでのほとんどの操作はUNIX環境のコマンドラインで行います。UNIXのコマンドライン操作に慣れ、基本的なコマンドは把握しておいて下さい。トレーニングコース準備編のUNIX入門を全て把握する事が理想ではありますが、短期間で完全にマスターする事は困難です。本コース受講に際しては、最低限以下の内容までは把握して臨んでください。
-
UNIXの階層型ディレクトリの構造を理解する。(PDF版UNIXコーステキスト p9-14上に該当)
-
次のコマンドに習熟しておく。テキストの該当ページを参照。
ファイル操作系
ls, cd, mkdir, pwd, cp
テキストデータ処理系
less, cat, head, tail, wc, grep
Rに関する宿題
コースではRを使った解析を行います。Rの基本的な操作に慣れておいてください。
習熟度の目安としては、plotによる散布図の作製まで(PDF版R入門コーステキスト p1-40上に該当)は最低限マスターしておくこと。
統計学に関する宿題
- ベクトルとは何か?
- ある3遺伝子の発現量を測定した1サンプルのデータをベクトルとして表現(想像)し、複数サンプルを比較することを想像してください。ベクトル間の違いはどのように比較しうるか考えてください。
- 2つのベクトル間のユークリッド距離とは何か調べなさい。
- 主成分分析の「主成分」とは何か調べなさい。
- Rコンソールで library(edgeR) を実行し、
要求されたパッケージ limma をロード中です
次のパッケージを付け加えます: ‘limma’
以下のオブジェクトは ‘package:BiocGenerics’ からマスクされています:
plotMA
もしくは、類する出力が得られることを確認しなさい。
NGS基本フォーマット・基本ツールに関する宿題
以下の問題資料中で空欄となっているデータ形式名、およびコマンド行を埋めて完成させて下さい。この資料はコース中に使います。
IGV に関する宿題
IGV (NGSデータ可視化ソフトウェア)実習は自身で用意しているパソコンを使って行います。
- 用意したパソコンにIGVをインストールし、起動を確認せよ。詳細は、セットアップのページを参照のこと。