homework - nibb-unix/gitc202502-unix GitHub Wiki

宿題

参加者の皆さんは、必ず以下の宿題を学んだ上で、トレーニングコースにのぞんでください。

UNIXに関する宿題

トレーニングコースでのほとんどの操作はUNIXのコマンドラインで行います。UNIXのコマンドラインに慣れていない方は、テキストの以下の部分に目を通し、基本的なコマンドは把握しておいて下さい。

UNIX基礎(予習用)

  1. 上のテキストに目を通す
  2. UNIXの階層型ディレクトリの構造を理解する(テキスト p6-7 を参照)
  3. UNIXのコマンド入力画面で、以下のコマンドを順に実行してみましょう (テキスト p8-9 を参照)
    • Macをお使いの場合は「ターミナル」(アプリケーション -> ユーティリティ) を起動して使います

    • Windowsをお使いの場合は Windows10 UNIX環境構築ガイド または Windows11 UNIX環境構築ガイド を参考のこと

      • $ は入力待ちプロンプトです。その後ろを入力して、リターンで実行します
      • 返ってくる結果から、それぞれ何か行われているか考えてみてください
$ pwd

$ ls

$ ls -l

$ cd /

$ pwd

$ cd ~

$ pwd
  1. UNIXにおける「環境変数」とは何か調べてきてください。

Rに関する宿題

コースではR初心者向けの講義を行います。Rについての前提知識は不要ですが、以下の手順を実行した上で参加して下さい。その際、必要に応じて予習用テキストを参照して下さい。

R入門(予習用)

(まだの方は)あなたのマシンにRをインストールして下さい。

  • http://www.r-project.org/にアクセスして、左のメニューからCRANを選び、日本のミラーサイトのどれかを選択してから、指示に従って自分のマシン向けのRをダウンロードしてインストールします。

Rを起動し、コンソールから以下のコマンドを順に実行しなさい。

  • 返ってくる結果から、それぞれどういう処理がなされているか考えなさい。 ただし、> は R のプロンプトで、その後を入力して、リターンで実行します。
 > 0:20

 > 0:20/20

 > 0:20/20*pi

 > sin(0:20/20*pi)

 > plot(sin(0:20/20*pi))

 > plot(sin(0:20/20*pi), type="l")      (typeは小文字のエル)
  • なお、場合によってプロンプトが + に変わることがあります。これは括弧の数が合わないなどの理由でコマンドが完結していないことを示すので、追加の 「括弧とじる」を入力してコマンドを完結させるか、Escapeキーを入力して打ち切ってから入力し直して下さい。
  • 3番目のコマンドまで入力したところで、次に進んで下さい。

履歴をたどる練習

  • このように、直前に実行したコマンドを少しずつ変更しながら再実行することは、実際のデータ解析でもよくありますが、そういう場合はヒストリ (履歴) 編集の機能を使うのが便利です。上矢印および下矢印キーを押してコマンドの履歴を前後にたどれることを確認しなさい。また、右矢印、 左矢印キーを使ってコマンドを編集できることを確認しなさい。これらを使って、4番目以降のコマンドを入力して実行して下さい。

次世代シーケンスデータに関する宿題

FASTQフォーマットは、次世代シーケンサーの出力するシーケンスデータとして最も広く使われているデータフォーマットです。

  1. どのような形式のフォーマットか調べてください。
  2. FASTQでは各リードについて主に2つの情報が記述されています。その2つの情報とは何でしょうか?

統計学に関する宿題

  1. t検定を行うには2群の平均値、平均標準誤差、自由度が必要である。ここで
  • 平均標準誤差とは何か?標準偏差との違いに着目して予習してください。
  • 自由度とは何か?予習してください。
  1. 本講義では、負の二項分布まで確率分布についての解説を進めたい。負の二項分布を説明するにはポアソン分布を、ポアソン分布を説明するには二項分布を理解する必要がある。二項分布の式

$$ P(k) = _nC_k p^k (1-p)^{n-k} $$

は事象 k が起きる確率 $$p^k$$k が起きない確率 $$(1-p)^{n-k}$$$$_nC_k$$ で記述されている。ここで $$_nC_k$$ とは何を表しているか?あらかじめ勉強して講義に臨んでください。

AI解析入門に関する宿題

AI解析入門の講義において、Google Colab上での操作体験・実行を行います。Google Colabを使用できない場合は講師が実演する内容をご確認ください。

  1. 講義テキスト(AI解析入門)を通読する
  2. Googleアカウントをつくる
  3. Google Colabにログインする
  4. alexnet.ipynb のリンクをクリックし、[Download raw file]を選択することでダウンロードを行う
  5. Google Colabにログインした状態で[ファイル] → [ノートブックをアップロード] を選択し、alexnet.ipynbをアップロードする
  6. [ランタイプ] → [ランタイプのタイプを変更] → [ハードウェアアクセラレータ]をCPUからGPUに変更して保存する
  7. コード左側の再生ボタンを押すか、shift+Enterを押してコードを実行してみる
  8. コードの内容を通読してみる

以上

⚠️ **GitHub.com Fallback** ⚠️