_何故、Rを使うのか - satoxlab/learning-R GitHub Wiki

この教材を使用している人は何らかの理由でRを習得したいと考えているでしょう。理由は色々とあるでしょうが、初学者に向けた内容でRを紹介していきます。

可視化ツール: 統計、データサイエンスあるいはプログラミングのためにRを使いたい方々であっても、Rの使い始めるための基礎はまずはデータの可視化・図表の作成かと思います。 その理由は

  • 何らかのデータ解析をする際にデータを「視る」必要が必ずあること
  • どのレベルの学生・研究者であっても、作図・データ可視化の必要性があること

からデータを視るために出力することを念頭に順番に進めたいと思います。 一方、教材に取り組む学生・研究者のR・統計の知識レベルは様々であるでしょう。そのため、リストされたトピックを順番に取り組むことは想定していません。 ウェブベースでの教材である優位性を活かして、体系的にも横断的にも活用していただければと思います。

統計解析: プログラミングにあるレベルまで慣れたら、Rを使う主たる目的が、充実した、各種の統計解析を行う関数、パッケージ利用になると思います。 Rは世界中の統計学者が利用、そして関数・パッケージの開発へ貢献しており、我々も自由にそれらを利用することができます。 この充実した統計解析の実行環境がRを使う理由となります。本教材は分子生物学における大規模データの取り扱いをRで行うことを中心としていますが、統計解析も含めて、Rの使い方を習得できるように設計しています。

解析の透明性: Rはオープンソースであり、パッケージ、スクリプト、関数の内容が全て公開されている、あるいは確認できるようになっています。 研究に取り組む一員として自身の解析結果に至る過程を把握できることは極めて重要です。計算過程がブラックボックスのソフトウェアを利用した場合には、論文に計算過程の詳細を記載し、得られた結果が想定している計算過程を経たか100%の確信を得ることができません。 例:Rパッケージの関数を読み解く