homework - nibb-gitc/gitc2020jun-rnaseq GitHub Wiki

Preparation 宿題

受講生は、必ず以下の宿題を行なった上で、トレーニングコースにのぞんでください。

宿題を行うにあたって、2月に開催したゲノムインフォマティクス・トレーニングコース 準備編 「UNIX・R・NGSの基礎」が参考になるでしょう。

RNA-seq全般に関する宿題

RNA-seqの主な目的を、2つ挙げなさい。

UNIXに関する宿題

トレーニングコースでのほとんどの操作はUNIX環境のコマンドラインで行います。UNIXのコマンドライン操作に慣れ、基本的なコマンドは把握しておいて下さい。トレーニングコース準備編のUNIX入門を全て把握する事が理想ではありますが、短期間で完全にマスターする事は困難です。本コース受講に際しては、最低限以下の内容までは把握して臨んでください。

  1. UNIXの階層型ディレクトリの構造を理解する。(PDF版UNIXコーステキスト p9-14上に該当)

  2. 次のコマンドに習熟しておく。テキストの該当ページを参照。

ファイル操作系

ls, cd, mkdir, pwd, cp

テキストデータ処理系

less, cat, head, tail, wc, grep

Rに関する宿題

コースではRを使った解析を行います。Rの基本的な操作に慣れておいてください。

習熟度の目安としては、plotによる散布図の作製まで(PDF版R入門コーステキスト p1-40上に該当)は最低限マスターしておくこと。

統計学に関する宿題

  1. ベクトルとは何か?
  2. ある3遺伝子の発現量を測定した1サンプルのデータをベクトルとして表現(想像)し、複数サンプルを比較することを想像してください。ベクトル間の違いはどのように比較しうるか考えてください。
  3. 2つのベクトル間のユークリッド距離とは何か調べなさい。
  4. 主成分分析の「主成分」とは何か調べなさい。
  5. Rコンソールで library(edgeR) を実行し、
 要求されたパッケージ limma をロード中です

 次のパッケージを付け加えます: ‘limma’

 以下のオブジェクトは ‘package:BiocGenerics’ からマスクされています:

     plotMA 

もしくは、類する出力が得られることを確認しなさい。

NGS基本フォーマット・基本ツールに関する宿題

以下の問題資料中で空欄となっているデータ形式名、およびコマンド行を埋めて完成させて下さい。この資料はコース中に使います。

IGV に関する宿題

IGV (NGSデータ可視化ソフトウェア)実習は自身で用意しているパソコンを使って行います。