homework - nibb-gitc/gitc2018july-rnaseq GitHub Wiki

Preparation 宿題

受講生は、必ず以下の宿題を行なった上で、トレーニングコースにのぞんでください。

宿題を行うにあたって、7月に開催した、ゲノムインフォマティクス・トレーニングコース 2018夏 準備編 「UNIX・R・NGSの基礎」 が、参考になるでしょう。

RNA-seq全般に関する宿題

RNA-seqの主な目的を、2つ挙げなさい。

UNIXに関する宿題

トレーニングコースでのほとんどの操作はUNIX環境のコマンドラインで行います。UNIXのコマンドライン操作に慣れ、基本的なコマンドは把握しておいて下さい。トレーニングコース準備編のUNIX入門を全て把握する事が理想ではありますが、短期間で完全にマスターする事は困難です。本コース受講に際しては、最低限以下の内容までは把握して臨んでください。

  1. UNIXの階層型ディレクトリの構造を理解する。(印刷版UNIXコーステキスト p5-9上、PDF版UNIXコーステキスト p9-17 に該当)
  2. 次のコマンドに習熟しておく。テキストの該当ページを参照。

ファイル操作系

ls, cd, mkdir, pwd, cp

テキストデータ処理系

less, cat, head, tail, wc, grep

Rに関する宿題

コースではRを使った解析を行います。Rの基本的な操作に慣れておいてください。

習熟度の目安としては、plotによる散布図の作製まで(印刷版Rコーステキスト p57-76上、PDF版Rコーステキスト p1-39に該当)は最低限マスターしておくこと。

統計学に関する宿題

  1. 検定における帰無仮説の役割は何か?
  2. p値とは何か?
  3. 多変量解析の第一の目的は高次元データを低次元に圧縮することである。ここで言う低次元の定義は何か?

これら3点について予習し、統計の基礎、多変量解析を学ぶ下地作り、不明な点のあぶり出しを行って本コースに臨んで下さい。

次に、受講生のレベルを把握するために、以下のアンケートご協力お願いします。(テストではありません)。

NGS基本フォーマット・基本ツールに関する宿題

以下の問題資料中で空欄となっているデータ形式名、およびコマンド行を埋めて完成させて下さい。この資料はコース中に使います。