homework - nibb-unix/gitc201905-unix GitHub Wiki

宿題

受講生は、必ず以下の宿題を学んだ上で、トレーニングコースにのぞんでください。

UNIXに関する宿題

トレーニングコースでのほとんどの操作はUNIXのコマンドラインで行います。UNIXのコマンドラインに慣れていない受講生は、テキストの以下の部分に目を通し、基本的なコマンドは把握しておいて下さい。

UNIX基礎(予習用)

. 上のテキストに目を通す

. UNIXの階層型ディレクトリの構造を理解する(テキスト p8-9 に該当)

. UNIXのコマンド入力画面で、以下のコマンドを順に実行してみましょう (テキスト p10-11 に該当)

  • Macをお使いの場合は「アプリケーション - ユーティリティ - ターミナル」を起動して使うこと

  • Windowsをお使いの場合は Windows UNIX環境構築ガイド を参考のこと

  • $ は入力待ちプロンプトです。その後ろを入力して、リターンで実行します
  • 返ってくる結果から、それぞれ何か行われているか考えてみてください

$ pwd

$ ls

$ ls -l

$ cd /

$ pwd

$ cd ~

$ pwd


Rに関する宿題

コースではR初心者向けの講義を行います。Rについての前提知識は不要ですが、以下の手順を実行した上で参加して下さい。その際、必要に応じて予習用テキストを参照して下さい。

R入門(予習用)

. (まだの方は)あなたのマシンにRをインストールして下さい。

  • http://www.r-project.org/にアクセスして、左のメニューからCRANを選び、日本のミラーサイトのどれか を選択してから、指示に従って自分のマシン向けのRをダウンロードして インストールします。

. Rを起動し、コンソールから以下のコマンドを順に実行しなさい。

  • 返ってくる結果から、それぞれどういう処理がなされているか考えなさい。 ただし、> は R のプロンプトで、その後を入力して、リターンで実行します。
 > 0:20

 > 0:20/20

 > 0:20/20*pi

 > sin(0:20/20*pi)

 > plot(sin(0:20/20*pi))

 > plot(sin(0:20/20*pi), type="l")      (typeは小文字のエル)
  • なお、場合によってプロンプトが + に変わることがあります。これは括弧の 数が合わないなどの理由でコマンドが完結していないことを示すので、追加の 「括弧とじる」を入力してコマンドを完結させるか、Escapeキーを入力して打ち切ってから入力し直して下さい。
  • 3番目のコマンドまで入力したところで、次に進んで下さい。

. 履歴をたどる練習

  • このように、直前に実行したコマンドを少しずつ変更しながら再実行すること は、実際のデータ解析でもよくありますが、そういう場合はヒストリ (履歴) 編集の機能を使うのが便利です。上矢印および下矢印キーを押して コマンドの 履歴を前後にたどれることを確認しなさい。また、右矢印、 左矢印キーを使っ てコマンドを編集できることを確認しなさい。これらを 使って、4番目以降のコ マンドを入力して実行して下さい。

テキスト処理に関する宿題

コースではテキスト処理に関するコマンドを使用します。その際に、「正規表現」というものを使います。 この「正規表現」とは、どのようなものを指すのか、調べて下さい。 例えば、以下は正規表現の例です。何を表しているでしょうか?

1) [ACGT][ACGT][ACGT]

2) .*

3) ^@

次世代シーケンスデータに関する宿題

FASTQフォーマットは、次世代シーケンサーの出力するシーケンスデータとして最も広く使われているデータフォーマットです。

. どのような形式のフォーマットか調べてください。

. FASTQでは各リードについて主に2つの情報が記述されています。その2つの情報とは何でしょうか?

お問い合わせ

質問は以下のメールアドレスまで。

[email protected]

以上